還原真實(shí)視界|探析圖像技術(shù)演進(jìn)之路

來(lái)源:CPS 更新日期:2023-12-21 作者:羅超

    科技大時(shí)代,引人入勝。視界千變?nèi)f化,視界之大,盡收眼底。回歸安防的本初,對(duì)圖像無(wú)止境的追求與打磨,才形成了現(xiàn)今以智能視頻為核的安防應(yīng)用大生態(tài)。

    有偏差的世界與視界

    百態(tài)安防,各色精彩!之于2023歲末之際,之于圖像,回首初心、細(xì)看當(dāng)下、瞭望未來(lái)。

    人眼看到的世界與機(jī)器讀出來(lái)得視界,有所異同。

    世界即視界,人眼看視界,或許都一樣。

    人眼有著很強(qiáng)觀察能力,能夠在復(fù)雜及變化的環(huán)境中識(shí)別目標(biāo),同時(shí)由大腦賦予了最高級(jí)的智能分析能力,可以運(yùn)用邏輯分析和推理能力去識(shí)別變化目標(biāo)。

    為此,長(zhǎng)久以來(lái),在監(jiān)控室里死盯屏幕,成了監(jiān)控人員的日常,這也是視頻監(jiān)控時(shí)代最為傳統(tǒng)與普遍的工作方式。但,人眼看到的視界,就是真實(shí)視界嗎?

    人眼看視界,或許真不一樣。

    人非機(jī)器,先天性有所短板,帶有主觀性,容易心里誤導(dǎo),產(chǎn)生誤判。

    與文字、聲音相比,視頻承載了更多信息量,而要從大量豐富信息當(dāng)中去讀取有用數(shù)據(jù),這是非常繁瑣復(fù)雜的工作,這種被動(dòng)應(yīng)對(duì)方式,并不能主動(dòng)預(yù)防,并受制于人員數(shù)量和能力,比如:長(zhǎng)時(shí)間易疲勞、錯(cuò)看漏看、看得不及時(shí)。此外,在顯示終端方面也因各種原因受制,你看到的視界,不一定為實(shí)。

    故而,有偏差的世界與視界,就需要圖像處理、優(yōu)化、調(diào)教,甚至是多維度的時(shí)空融合,來(lái)讓圖像盡可能的全域性無(wú)所不在與無(wú)所不能。

    機(jī)器視覺(jué)的“技術(shù)雛形”

    既然回首過(guò)去,對(duì)于圖像,行業(yè)最開(kāi)始做法是不斷為圖像做加法,一堆的后處理技術(shù)進(jìn)行科研突破,最為明顯體現(xiàn)在視頻圖像處理技術(shù),簡(jiǎn)而言之就是用計(jì)算機(jī)對(duì)視頻數(shù)字圖像進(jìn)行處理,其本質(zhì)是一種信號(hào)處理過(guò)程,而且是離散信號(hào)處理。

    這其實(shí)就是機(jī)器視覺(jué)的最初技術(shù)形態(tài),雖功能有限,但底子還在?磮D像處理技術(shù)應(yīng)用價(jià)值,有幾個(gè)方面:

    其一,提高圖像的視感質(zhì)量,如進(jìn)行圖像的亮度、彩色變換,增強(qiáng)、抑制某些成分,對(duì)圖像進(jìn)行幾何變換等,以改善視頻圖像的質(zhì)量。

    其二,提取視頻圖像中所包含的某些特征或特殊信息,這些被提取的特征或信息往往為計(jì)算機(jī)分析圖像提供便利。

    其三,視頻圖像增強(qiáng)與復(fù)原。圖像增強(qiáng)的目的是將圖像轉(zhuǎn)換為更適合人和機(jī)器的分析的形式。

    其四,圖像的分析。從圖像中抽取某些有用的度量、數(shù)據(jù)和信息,以的到某種數(shù)值結(jié)果。

    其五,能使圖像再現(xiàn)性。圖像在數(shù)字化時(shí)準(zhǔn)確地表現(xiàn)了原稿,則數(shù)字圖像處理過(guò)程始終能保持圖像的再現(xiàn)。

    其六,靈活多變的處理功能。把監(jiān)控畫(huà)面分割為任意大小的二維數(shù)組,這意味著圖像的數(shù)字化精度可以達(dá)到滿(mǎn)足任一應(yīng)用需求。

    其七,適用面寬。不論是來(lái)自哪個(gè)行業(yè)的信息源的圖像只要被變換為數(shù)字編碼形式后,均是用二維數(shù)組表示的灰度圖像組合而成。

    其八,靈活性高。即凡是可以用數(shù)學(xué)公式或邏輯關(guān)系來(lái)表達(dá)的一切運(yùn)算均可用數(shù)字圖像處理實(shí)現(xiàn)。

    依據(jù)八大特性,圖像處理研究?jī)?nèi)容就分三大板塊:圖像壓縮;增強(qiáng)和復(fù)原;匹配、描述和識(shí)別。

    機(jī)器讀懂視界的行業(yè)邏輯

    時(shí)代在變革,技術(shù)在演進(jìn),與之相悖的,終將漸趨式微,這同樣適用于圖像處理技術(shù)。如樓宇對(duì)講到智能家居,防盜報(bào)警到AIOT一樣,圖像處理到機(jī)器視覺(jué),也只是時(shí)代產(chǎn)物,底色未變。

    過(guò)去圖像處理在“后側(cè)”,而機(jī)器視覺(jué)更多“向前”。

    在當(dāng)下,智能攝像機(jī)本身作為前端產(chǎn)品,芯片、鏡頭、焦距、補(bǔ)光、外殼等一系列硬件工程是基礎(chǔ)。能將智能算法跟場(chǎng)景關(guān)聯(lián)后,根據(jù)算法需求界定一個(gè)范圍,盡量做到場(chǎng)景變化,但硬件減少變化,用軟件來(lái)做調(diào)節(jié)。

    全天候的多維融合全域感知,這是智能攝像機(jī)對(duì)于圖像追求的另一個(gè)技術(shù)維度,視頻、音頻、氣味、生物特征等技術(shù)的發(fā)展和成熟,全面掌控防控場(chǎng)景和目標(biāo)的完整信息成為可能,在安防應(yīng)用中越來(lái)越多的部署更多類(lèi)別的感知設(shè)備,用于從更多維度采集目標(biāo)信息,包括目標(biāo)的各種要素、活動(dòng)軌跡以及關(guān)聯(lián)信息等,從而形成一個(gè)動(dòng)態(tài)感知體系,實(shí)現(xiàn)防控工作的“無(wú)所不在、無(wú)所不知”目標(biāo)。這一點(diǎn)從最近幾年的聲光劃界攝像機(jī)、光譜水質(zhì)攝像機(jī)、雷視合一攝像機(jī)、氣象觀測(cè)攝像機(jī)、環(huán)保攝像機(jī)等一些列場(chǎng)景定義類(lèi)產(chǎn)品,無(wú)一不在說(shuō)明,圖像處理的多面與多角度,來(lái)適配多場(chǎng)景的深度。

    當(dāng)然,攝像機(jī)一個(gè)單品,不可能一肩挑起這時(shí)代與這視界,形成成熟與高價(jià)值的解決方案閉環(huán),是必然。

    在追求極致更好圖像的行業(yè)進(jìn)程中,圖像的廣度在縮小,更多的是在深度的追求。通用型、一招鮮吃遍天的攝像機(jī)已經(jīng)不復(fù)存在,這還是源于用戶(hù)需求驅(qū)動(dòng)。

    在2023深圳安博會(huì)參觀走訪期間,記者了解到很多底層用戶(hù)或中間生態(tài)位集成商大多表示,現(xiàn)有智能視頻方案過(guò)于通用,不夠適配行業(yè)具體場(chǎng)景。為此,此屆安博會(huì)最大不同之一就是硬件展示減少,方案展示居多的原因。

    機(jī)器視覺(jué)解決方案需要與行業(yè)自身長(zhǎng)期運(yùn)轉(zhuǎn)而沉淀下來(lái)的商業(yè)邏輯與行業(yè)經(jīng)驗(yàn)相融合。除了成熟的技術(shù)能力外,該解決方案對(duì)行業(yè)具體場(chǎng)景的全方位適配必不可少。同樣,機(jī)器視覺(jué)解決方案應(yīng)用門(mén)檻高,企業(yè)IT架構(gòu)/基礎(chǔ)設(shè)施適配難度高。對(duì)于很多企業(yè)來(lái)說(shuō),算法訓(xùn)練相對(duì)容易實(shí)現(xiàn),但如何與實(shí)時(shí)推理結(jié)合起來(lái)部署到實(shí)際應(yīng)用場(chǎng)景,卻是一個(gè)難題。為此,大模型的出現(xiàn),或者類(lèi)似算法商城、算法工廠、AI自動(dòng)工具等,就開(kāi)辟了另一個(gè)戰(zhàn)場(chǎng),另一個(gè)對(duì)圖像追求無(wú)休止的行業(yè)邏輯。

    圖像的未來(lái)之愿

    對(duì)于圖像創(chuàng)新,行業(yè)心之所向。沉于過(guò)去,不能打破現(xiàn)狀,之于圖像的未來(lái),本當(dāng)歸于平靜,來(lái)看未來(lái)之愿與應(yīng)用模樣。

    其一,大視界時(shí)代,未來(lái)數(shù)據(jù)圖像技術(shù)強(qiáng)調(diào)高清晰度、高速傳輸、實(shí)時(shí)圖像處理、三維成像或多維成像、智能化、自動(dòng)化等方向發(fā)展。

    其二,智能化方面,力爭(zhēng)使計(jì)算機(jī)識(shí)別和理解能夠按照人的認(rèn)識(shí)和思維方式工作,能夠考慮到主觀概率和非邏輯思維。這里有一點(diǎn)需要指出,AI在智能化方面可以做圖像數(shù)據(jù)與內(nèi)容的提取與分析,但是并不能在視頻圖像處理方面做文章。

    其三,未來(lái)圖像技術(shù)強(qiáng)調(diào)操作、運(yùn)用的方便性,圖像處理功能的集中化趨勢(shì)是必然會(huì)存在的。所以,最近幾年硬件芯片廠家不斷將諸多AI功能固化在芯片上,形成一個(gè)SOC級(jí)的獨(dú)立小系統(tǒng)。

    有偏差的視界,在以智能路為路徑,盡可能形成你是我的眼,你見(jiàn)如我見(jiàn);不止所見(jiàn),還能關(guān)聯(lián)其他,以圖像為圓點(diǎn),來(lái)畫(huà)視界。

廣告聯(lián)系:010-82755684 | 010-82755685 手機(jī)版:m.pjtime.com官方微博:weibo.com/pjtime官方微信:pjtime
Copyright (C) 2007 by PjTime.com,投影時(shí)代網(wǎng) 版權(quán)所有 關(guān)于投影時(shí)代 | 聯(lián)系我們 | 歡迎來(lái)稿 | 網(wǎng)站地圖
返回首頁(yè) 網(wǎng)友評(píng)論 返回頂部 建議反饋
快速評(píng)論
驗(yàn)證碼: 看不清?點(diǎn)一下
發(fā)表評(píng)論