還原真實視界｜探析圖像技術(shù)演進之路

來源：CPS　更新日期：2023-12-21 作者：羅超

年度評選盛典獲獎揭曉 Infocomm China 深入報道年度商顯市場最大的看點何在

科技大時代，引人入勝。視界千變?nèi)f化，視界之大，盡收眼底�；貧w安防的本初，對圖像無止境的追求與打磨，才形成了現(xiàn)今以智能視頻為核的安防應(yīng)用大生態(tài)。

有偏差的世界與視界

百態(tài)安防，各色精彩！之于2023歲末之際，之于圖像，回首初心、細(xì)看當(dāng)下、瞭望未來。

人眼看到的世界與機器讀出來得視界，有所異同。

世界即視界，人眼看視界，或許都一樣。

人眼有著很強觀察能力，能夠在復(fù)雜及變化的環(huán)境中識別目標(biāo)，同時由大腦賦予了最高級的智能分析能力，可以運用邏輯分析和推理能力去識別變化目標(biāo)。

為此，長久以來，在監(jiān)控室里死盯屏幕，成了監(jiān)控人員的日常，這也是視頻監(jiān)控時代最為傳統(tǒng)與普遍的工作方式。但，人眼看到的視界，就是真實視界嗎？

人眼看視界，或許真不一樣。

人非機器，先天性有所短板，帶有主觀性，容易心里誤導(dǎo)，產(chǎn)生誤判。

與文字、聲音相比，視頻承載了更多信息量，而要從大量豐富信息當(dāng)中去讀取有用數(shù)據(jù)，這是非常繁瑣復(fù)雜的工作，這種被動應(yīng)對方式，并不能主動預(yù)防，并受制于人員數(shù)量和能力，比如：長時間易疲勞、錯看漏看、看得不及時。此外，在顯示終端方面也因各種原因受制，你看到的視界，不一定為實。

故而，有偏差的世界與視界，就需要圖像處理、優(yōu)化、調(diào)教，甚至是多維度的時空融合，來讓圖像盡可能的全域性無所不在與無所不能。

機器視覺的“技術(shù)雛形”

既然回首過去，對于圖像，行業(yè)最開始做法是不斷為圖像做加法，一堆的后處理技術(shù)進行科研突破，最為明顯體現(xiàn)在視頻圖像處理技術(shù)，簡而言之就是用計算機對視頻數(shù)字圖像進行處理，其本質(zhì)是一種信號處理過程，而且是離散信號處理。

這其實就是機器視覺的最初技術(shù)形態(tài)，雖功能有限，但底子還在�？磮D像處理技術(shù)應(yīng)用價值，有幾個方面：

其一，提高圖像的視感質(zhì)量，如進行圖像的亮度、彩色變換，增強、抑制某些成分，對圖像進行幾何變換等，以改善視頻圖像的質(zhì)量。

其二，提取視頻圖像中所包含的某些特征或特殊信息，這些被提取的特征或信息往往為計算機分析圖像提供便利。

其三，視頻圖像增強與復(fù)原。圖像增強的目的是將圖像轉(zhuǎn)換為更適合人和機器的分析的形式。

其四，圖像的分析。從圖像中抽取某些有用的度量、數(shù)據(jù)和信息，以的到某種數(shù)值結(jié)果。

其五，能使圖像再現(xiàn)性。圖像在數(shù)字化時準(zhǔn)確地表現(xiàn)了原稿，則數(shù)字圖像處理過程始終能保持圖像的再現(xiàn)。

其六，靈活多變的處理功能。把監(jiān)控畫面分割為任意大小的二維數(shù)組，這意味著圖像的數(shù)字化精度可以達到滿足任一應(yīng)用需求。

其七，適用面寬。不論是來自哪個行業(yè)的信息源的圖像只要被變換為數(shù)字編碼形式后，均是用二維數(shù)組表示的灰度圖像組合而成。

其八，靈活性高。即凡是可以用數(shù)學(xué)公式或邏輯關(guān)系來表達的一切運算均可用數(shù)字圖像處理實現(xiàn)。

依據(jù)八大特性，圖像處理研究內(nèi)容就分三大板塊：圖像壓縮；增強和復(fù)原；匹配、描述和識別。

機器讀懂視界的行業(yè)邏輯

時代在變革，技術(shù)在演進，與之相悖的，終將漸趨式微，這同樣適用于圖像處理技術(shù)。如樓宇對講到智能家居，防盜報警到AIOT一樣，圖像處理到機器視覺，也只是時代產(chǎn)物，底色未變。

過去圖像處理在“后側(cè)”，而機器視覺更多“向前”。

在當(dāng)下，智能攝像機本身作為前端產(chǎn)品，芯片、鏡頭、焦距、補光、外殼等一系列硬件工程是基礎(chǔ)。能將智能算法跟場景關(guān)聯(lián)后，根據(jù)算法需求界定一個范圍，盡量做到場景變化，但硬件減少變化，用軟件來做調(diào)節(jié)。

全天候的多維融合全域感知，這是智能攝像機對于圖像追求的另一個技術(shù)維度，視頻、音頻、氣味、生物特征等技術(shù)的發(fā)展和成熟，全面掌控防控場景和目標(biāo)的完整信息成為可能，在安防應(yīng)用中越來越多的部署更多類別的感知設(shè)備，用于從更多維度采集目標(biāo)信息，包括目標(biāo)的各種要素、活動軌跡以及關(guān)聯(lián)信息等，從而形成一個動態(tài)感知體系，實現(xiàn)防控工作的“無所不在、無所不知”目標(biāo)。這一點從最近幾年的聲光劃界攝像機、光譜水質(zhì)攝像機、雷視合一攝像機、氣象觀測攝像機、環(huán)保攝像機等一些列場景定義類產(chǎn)品，無一不在說明，圖像處理的多面與多角度，來適配多場景的深度。

當(dāng)然，攝像機一個單品，不可能一肩挑起這時代與這視界，形成成熟與高價值的解決方案閉環(huán)，是必然。

在追求極致更好圖像的行業(yè)進程中，圖像的廣度在縮小，更多的是在深度的追求。通用型、一招鮮吃遍天的攝像機已經(jīng)不復(fù)存在，這還是源于用戶需求驅(qū)動。

在2023深圳安博會參觀走訪期間，記者了解到很多底層用戶或中間生態(tài)位集成商大多表示，現(xiàn)有智能視頻方案過于通用，不夠適配行業(yè)具體場景。為此，此屆安博會最大不同之一就是硬件展示減少，方案展示居多的原因。

機器視覺解決方案需要與行業(yè)自身長期運轉(zhuǎn)而沉淀下來的商業(yè)邏輯與行業(yè)經(jīng)驗相融合。除了成熟的技術(shù)能力外，該解決方案對行業(yè)具體場景的全方位適配必不可少。同樣，機器視覺解決方案應(yīng)用門檻高，企業(yè)IT架構(gòu)/基礎(chǔ)設(shè)施適配難度高。對于很多企業(yè)來說，算法訓(xùn)練相對容易實現(xiàn)，但如何與實時推理結(jié)合起來部署到實際應(yīng)用場景，卻是一個難題。為此，大模型的出現(xiàn)，或者類似算法商城、算法工廠、AI自動工具等，就開辟了另一個戰(zhàn)場，另一個對圖像追求無休止的行業(yè)邏輯。

圖像的未來之愿

對于圖像創(chuàng)新，行業(yè)心之所向。沉于過去，不能打破現(xiàn)狀，之于圖像的未來，本當(dāng)歸于平靜，來看未來之愿與應(yīng)用模樣。

其一，大視界時代，未來數(shù)據(jù)圖像技術(shù)強調(diào)高清晰度、高速傳輸、實時圖像處理、三維成像或多維成像、智能化、自動化等方向發(fā)展。

其二，智能化方面，力爭使計算機識別和理解能夠按照人的認(rèn)識和思維方式工作，能夠考慮到主觀概率和非邏輯思維。這里有一點需要指出，AI在智能化方面可以做圖像數(shù)據(jù)與內(nèi)容的提取與分析，但是并不能在視頻圖像處理方面做文章。

其三，未來圖像技術(shù)強調(diào)操作、運用的方便性，圖像處理功能的集中化趨勢是必然會存在的。所以，最近幾年硬件芯片廠家不斷將諸多AI功能固化在芯片上，形成一個SOC級的獨立小系統(tǒng)。

有偏差的視界，在以智能路為路徑，盡可能形成你是我的眼，你見如我見；不止所見，還能關(guān)聯(lián)其他，以圖像為圓點，來畫視界。

返回視頻監(jiān)控頻道首頁