依托"梧桐"大模型技術(shù)多年的行業(yè)積淀與持續(xù)創(chuàng)新,宇視成功實(shí)現(xiàn)大模型技術(shù)在交通抓拍攝像機(jī)領(lǐng)域的工程化落地,在攝像機(jī)上實(shí)現(xiàn)了算法精度躍升、成像質(zhì)量?jī)?yōu)化與長(zhǎng)尾需求響應(yīng)的三大技術(shù)突破。這標(biāo)志著宇視成功將"梧桐"大模型的億級(jí)參數(shù)規(guī)模與泛化能力應(yīng)用于攝像機(jī),助力交通管理更加安全、有序、高效。
圖 宇視“梧桐”大模型交通抓拍系列產(chǎn)品
大模型提升算法精度,更聰明更精準(zhǔn)
傳統(tǒng)的深度學(xué)習(xí)算法主要依賴卷積操作來(lái)提取局部特征,但面對(duì)復(fù)雜場(chǎng)景時(shí),往往容易忽視全局信息的整合,導(dǎo)致在目標(biāo)遮擋、低對(duì)比度、復(fù)雜姿態(tài)等情況下出現(xiàn)誤檢和漏檢的問(wèn)題。宇視“梧桐”大模型憑借其億級(jí)參數(shù)量及強(qiáng)大的泛化推理能力,能讓攝像機(jī)更聰明地洞察細(xì)節(jié),捕捉關(guān)鍵信息,從而在復(fù)雜多變的場(chǎng)景中顯著降低誤檢和漏檢的發(fā)生。
異常成像車(chē)牌識(shí)別
宇視將大模型技術(shù)應(yīng)用于車(chē)牌識(shí)別,結(jié)合多模態(tài)特殊融合技術(shù),有效解決部分字符模糊、車(chē)牌傾角過(guò)大、過(guò)曝等業(yè)界難題,在各類復(fù)雜場(chǎng)景下,識(shí)別準(zhǔn)確率顯著提升。
圖 車(chē)牌識(shí)別準(zhǔn)確度對(duì)比
“相近”車(chē)輛特征識(shí)別
“梧桐”大模型有效發(fā)掘更深層的局部特征,對(duì)車(chē)型、車(chē)身顏色等車(chē)輛特征的識(shí)別精度更高。
圖 各類車(chē)型、顏色識(shí)別對(duì)比
機(jī)動(dòng)車(chē)違法行為分析
機(jī)動(dòng)車(chē)車(chē)內(nèi)違法行為取證過(guò)程中,常面臨車(chē)內(nèi)光照變化、深色衣物、頭發(fā)遮擋以及復(fù)雜姿態(tài)等多重干擾因素,這些因素極易引發(fā)“誤判”,進(jìn)而增加了人工審核的工作量!拔嗤贝竽P蛻{借其強(qiáng)大的全局特征理解能力與上下文建模能力,能有效解決相關(guān)問(wèn)題,深入剖析駕駛員行為,提升整體的檢測(cè)精度,減輕人工審核負(fù)擔(dān)。
圖 車(chē)內(nèi)行為識(shí)別對(duì)比
非機(jī)動(dòng)車(chē)違法行為分析
非機(jī)動(dòng)車(chē)通行場(chǎng)景是一個(gè)典型的多目標(biāo)復(fù)雜環(huán)境,其中衣帽識(shí)別困難、前后目標(biāo)相互遮擋等問(wèn)題常導(dǎo)致取證效率低下。“梧桐”大模型憑借其先進(jìn)的自注意力機(jī)制,突破局部特征的局限性,有效濾除了前后目標(biāo)的遮擋干擾,從而顯著提升檢測(cè)的準(zhǔn)確性。
圖 非機(jī)動(dòng)車(chē)行為識(shí)別對(duì)比
大模型驅(qū)動(dòng)圖像還原,更真實(shí)更清晰
宇視“梧桐”大模型交通抓拍系列產(chǎn)品搭載“獵光2.0”圖像引擎,在微光環(huán)境下實(shí)現(xiàn)真實(shí)色彩和車(chē)窗細(xì)節(jié)清晰還原的雙重突破,助力城市光污染治理,守護(hù)出行安全。
圖 獵光2.0圖像原理概述
大模型助力小目標(biāo)跟蹤,更穩(wěn)定更可靠
受多種外界因素如風(fēng)力影響、桿件因熱脹冷縮而形變以及大型車(chē)輛經(jīng)過(guò)時(shí)的震動(dòng)等,紅綠燈在攝像機(jī)捕捉的畫(huà)面中往往長(zhǎng)期處于晃動(dòng)狀態(tài),這對(duì)交通信號(hào)燈的準(zhǔn)確檢測(cè)構(gòu)成了極大挑戰(zhàn)。尤其在大型路口,紅綠燈在圖像中的像素通常小于12像素,這進(jìn)一步加劇了算法的檢測(cè)難度,易導(dǎo)致燈態(tài)識(shí)別異常。大模型技術(shù)的應(yīng)用顯著增強(qiáng)攝像機(jī)的圖像檢測(cè)與分割能力,精準(zhǔn)識(shí)別目標(biāo)并定位跟蹤,提高穩(wěn)定性和準(zhǔn)確性。
圖 傳統(tǒng)及大模型紅綠燈定位對(duì)比
大模型賦能長(zhǎng)尾需求,更泛化更高效
車(chē)牌識(shí)別在特定場(chǎng)景,如工業(yè)園區(qū)內(nèi)部,一直被視為業(yè)界的棘手難題。傳統(tǒng)的深度智能算法往往需要依賴海量的標(biāo)注數(shù)據(jù)來(lái)進(jìn)行特定任務(wù)的訓(xùn)練,不僅投入巨大,而且響應(yīng)時(shí)效也相對(duì)較慢。宇視推出的“梧桐”大模型交通抓拍系列產(chǎn)品通過(guò)創(chuàng)新的預(yù)訓(xùn)練+微調(diào)范式,能有效解決這一難題。
該模型基于海量的通用數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,積累了豐富的基礎(chǔ)特征,結(jié)合強(qiáng)化微調(diào)技術(shù),在遷移到具體應(yīng)用場(chǎng)景時(shí),僅需少量的樣本數(shù)據(jù)即可實(shí)現(xiàn)高精度識(shí)別。這一創(chuàng)新應(yīng)用可大幅縮短開(kāi)發(fā)周期,并顯著提升響應(yīng)速度,為特定場(chǎng)景下的車(chē)牌識(shí)別帶來(lái)了全新的解決方案。
為了提升園區(qū)廠內(nèi)車(chē)牌識(shí)別的準(zhǔn)確率(97%以上),同時(shí)保持與現(xiàn)有車(chē)牌識(shí)別算法的兼容性,我們對(duì)兩種方案進(jìn)行了對(duì)比:傳統(tǒng)方案需處理1萬(wàn)張車(chē)牌圖像數(shù)據(jù),且開(kāi)發(fā)周期長(zhǎng)達(dá)2個(gè)月;而大模型方案僅需對(duì)100張車(chē)牌數(shù)據(jù)進(jìn)行高效訓(xùn)練,開(kāi)發(fā)周期大幅縮減至2周。
圖 某工業(yè)園區(qū)廠內(nèi)車(chē)牌
宇視科技的“梧桐”大模型為交通抓拍攝像機(jī)帶來(lái)了全面智能化升級(jí),實(shí)現(xiàn)了更精準(zhǔn)、穩(wěn)定、真實(shí)與高效的應(yīng)用表現(xiàn)。這一革新深度強(qiáng)化了交通管理場(chǎng)景的應(yīng)用能力,營(yíng)造了更加安全、有序且高效的出行環(huán)境。未來(lái),“梧桐”大模型將持續(xù)賦能AIoT邊端產(chǎn)品,不斷拓展感知邊界,深化場(chǎng)景理解,秉持務(wù)實(shí)創(chuàng)新精神,致力于提供更加專業(yè)、超值的產(chǎn)品及解決方案,引領(lǐng)行業(yè)前行。