近日,麥肯錫發(fā)布《技術熱門趨勢報告(The top trends in tech)》,對世界科學技術發(fā)展趨勢進行了研究。報告認為,更高水平的流程自動化、可視化,分布式基礎設施、下一代計算平臺、AI應用等已經成為各行各業(yè)的發(fā)展趨勢。同時,報告還對其中具有重要影響科學技術進行了深入洞察,具體包括:數字孿生、3-D/4-D打印技術、應用AI技術、云計算、邊緣計算、區(qū)塊鏈等等。此前,我們分享了其中關于“數字孿生”的技術洞察,本期將繼續(xù)解讀麥肯錫《技術熱門趨勢報告》,聚焦“應用AI技術”。
應用AI技術
報告中的應用AI技術包括計算機視覺、自然語言處理和語音技術三種。計算機視覺、自然語言處理、語音技術利用人工智能算法來幫助計算機理解現實世界的數據,包括利用計算機視覺技術來理解視頻和圖像,利用自然語言處理技術來理解文本,和利用語音技術來理解音頻。
這些技術能夠促進人機交互和自然環(huán)境的數字化。在利用樣本數據訓練算法后,機器可以識別范式,并對其進行解釋和操作。
技術成熟情況
應用AI正在從基礎研究向大規(guī)模應用過渡,現在處于過渡的后期,已經成為了大規(guī)模落地的成熟技術。
到2024年,超過50%的用戶觸點(user touches)將被人工智能驅動的語音、文字或計算機視覺算法所增強。到2021年,10億臺聯(lián)網的監(jiān)控攝像頭將收集和共享視覺數據。
行業(yè)適用情況
應用AI經歷了從被特定行業(yè)采納向被多個行業(yè)采納的過渡,現在過渡已經結束。該技術已經成為了在多個行業(yè)廣泛落地的成熟技術。
應用AI對企業(yè)的價值
無縫人機交互:通過將人工輸出轉換為機器閱讀指令,簡化應用程序的使用或與機器的交互。
擴展或創(chuàng)造新產品和服務以覆蓋端到端:利用基于AI的數據分析特征(例如,監(jiān)測癌癥就是醫(yī)學成像設備的一個特征)。
更高水平的數字化和自動化:機器的視聽理解水平很高,能夠幫助公司實現全自動化,或是通過機器完成部分工作來減輕人類勞動者的負擔。
更多客戶界面:提供不同的互動方法,通過文本、語音或圖像(例如,亞馬遜基于照片搜索產品的功能)與客戶互動。
應用示例
01
擴展或創(chuàng)造新產品和服務
以覆蓋端到端
利用基于AI的數據分析特征(例如,監(jiān)測癌癥就是醫(yī)學成像設備的一個特征)來擴展或創(chuàng)造新產品和服務。
如:作物保護生產商希望優(yōu)化產品用途,以預防植物病害。目前,針對通常無法監(jiān)測到病害的問題,可以把計算機視覺與衛(wèi)星遙感技術相結合進行農田監(jiān)測,監(jiān)測到病害風險后觸發(fā)警報。而使用計算機視覺算法技術后,可在發(fā)現植物病害之前就監(jiān)測到這些問題,在實際感染病害14天前觸發(fā)警報,從而使農民減少使用殺蟲劑。
02
(人力)資源生產力更高
人機交互變得更高效,即計算機視覺、自然語言處理算法會推進流程并為決策的制定提供依據(例如,通過搜索合同獲得特定信息),這樣員工就能將時間花在能夠增值的任務上。
如:英國的欺詐重案辦公室(Serious Fraud Office)保存著超過三千萬份文件,該辦公室利用計算機視覺對文檔進行了分類,并通過數據處理來查找貪污腐敗的卷宗。在2017年,該辦公室利用計算機視覺算法發(fā)現了勞斯萊斯欺詐案,并對該公司處以6.71億英鎊的罰款。使用計算機視覺算法每天能夠處理60萬份文件,節(jié)省了80%的文件處理時間,使得工作人員能夠把重心重新轉移到起訴上。
03
任務的全自動化
減少了運營開支
AI控制的機器人能夠高效完成重復性的后臺和前臺任務(例如,自助服務雜貨店利用計算機視覺結賬)。
此外,數字孿生還能減少資本密集型投資,使得管理者能夠根據模擬結果做出投資決策,從而降低冗余或替換的風險(因為產品是定制的)。同時,數字孿生還可以增加項目確定性,通過模擬可能路徑、追蹤績效并對標里程碑,在偏離項目計劃的情況下及時糾正(如把數字孿生運用到建設中的復雜項目)。
04
客戶滿意度更高
提供各種自然的互動方式,并保持始終如一的服務水平(如聊天或語音機器人)。
發(fā)展前景
未來五年計算機視覺、自然語言處理、語音技術的發(fā)展前景如下:
階段一:神經網絡的發(fā)展進入停滯期;攻克復雜應用的技術難關
現有神經網絡仍然存在一些缺陷(如缺乏上下文),限制了解釋力和采取行動或進一步累積洞見的能力。我們需要優(yōu)化和運用現有解決方案(如Facebook利用卷積神經網絡開發(fā)了面部識別功能,準確率達到了97.5%)。在攻克技術難關后,復雜應用準備進入市場(如5級自動駕駛)。
階段二:計算機視覺和自然語言處理模型的普及
得益于已建立的數據標準和可調整的預定義模型,計算機視覺和自然語言處理在相對不太復雜的虛擬任務中得到廣泛應用。機器通過不會編碼的專家的培訓,簡化人機交互(例如,護士指導機器人處理患者樣本)而被加速應用。利用基于認知AI 的加工來根據非結構化數據自動做出判斷和決策,從而實現智能流程自動化。
階段三:生成式預訓練模型
在一組不同的未標記數據上預訓練語言或視覺模型,從而自動生成感知上下文的內容,這些內容很難同人類創(chuàng)作的內容區(qū)分開來。無需人工監(jiān)督或手動標記輸入數據,模型會遵循自己的邏輯而不是遵循所學習的范式,機器可以獨立“思考”和創(chuàng)造高精度內容,從而實現真實的人機交互。AI研究實驗室OpenAI的生成式預訓練模型(GPT-3)學會了僅根據一個提示來執(zhí)行任務(例如,通過給模型展示一個完整的句子和一個不完整句子來教會模型如何造句)。
發(fā)展動力
可用于訓練和解釋的機器和人類生成的數據呈現爆發(fā)式增長(例如,裝有傳感器和攝像頭的消費或者工業(yè)設備的數量大幅增長)。
深度神經網絡和深度學習方法的出現(例如,卷積神經網絡降低了錯誤率,使計算機在語音和圖像識別方面與人類不相上下)。
AI驅動的應用程序成本不斷下降,處理能力和算法的可用性不斷提高,因此該類應用程序正在普及。
不斷提高數據(圖像、音頻)的質量,提高分析的準確性。