日前,Gartner發(fā)布了2022年重要戰(zhàn)略技術趨勢。其中,生成式人工智能(Generative Artificial Intelligence)位列12項重要戰(zhàn)略之首。同時Gartner預計,到2025年,生成式人工智能將占所有生成數(shù)據(jù)的10%,而目前這一比例還不到1%。
而在2020年Gartner發(fā)布《人工智能技術成熟度曲線報告2020(Hype Cycle for Artificial Intelligence,2020)》時,生成式人工智能作為新增技術熱點才首次被提出。
此外,在今年《Hype Cycle for Artificial Intelligence,2021》報告中,生成式人工智能同樣位列其中。
以上種種跡象表明,生成式AI已經(jīng)成為未來舉足輕重的技術趨勢。那么,生成式AI究竟是什么?生成式AI又能給智能時代帶來什么?
Vol.1
生成式AI——訓練后的再創(chuàng)造
對于生成式AI,Gartner這樣定義:通過各種機器學習(ML)方法從數(shù)據(jù)中學習工件的組件(要素),進而生成全新的、完全原創(chuàng)的、真實的工件(一個產(chǎn)品或物品或任務),這些工件與訓練數(shù)據(jù)保持相似,而不是復制。
簡單理解,生成式AI就是利用現(xiàn)有文本、音頻文件或圖像創(chuàng)建新內(nèi)容的技術。使用生成 AI,計算機檢測與輸入相關的基本模式并生成類似內(nèi)容。
Vol.2
GANs——生成式AI的核心技術
生成式對抗網(wǎng)絡(GANs, Generative Adversarial Networks ),是生成式AI的關鍵技術。其本質(zhì)是一種深度學習模型,是近年來復雜分布上無監(jiān)督學習最具前景的方法之一。
在原理上,生成式對抗網(wǎng)絡使用兩個神經(jīng)網(wǎng)絡相互對立,一個生成器和一個判別器。生成器或生成網(wǎng)絡,負責生成類似于源數(shù)據(jù)的新數(shù)據(jù)或內(nèi)容,判別器或判別網(wǎng)絡則負責區(qū)分源數(shù)據(jù)和生成數(shù)據(jù)。經(jīng)過交替周期訓練,生成器不斷學習生成更逼真的數(shù)據(jù),判別器則更善于區(qū)分假數(shù)據(jù)和真實數(shù)據(jù)?梢园袵ANs想象成一個造假者和一個在貓捉老鼠游戲中的警察,造假者正在學習傳遞假幣,而警察正在學習檢測假幣。漸漸地,雙方在對抗中都不斷完善。
Vol.3
AI生“萬物”——生成式AI商業(yè)應用
當下,生成式AI已在研究和商業(yè)的多種場景得到應用,如創(chuàng)建軟件代碼、促進藥物研發(fā)和有針對性的營銷等。具體而言:
生成圖形:AI可以從藝術品中抽象視覺圖案,然后將這些圖案應用到具有該藝術品特征的虛擬圖像再現(xiàn)中。這些算法還可以將任何粗糙的涂鴉轉(zhuǎn)換為令人印象深刻的繪圖,令其似乎是由描繪真實世界的專業(yè)人類藝術家創(chuàng)作的。
生成照片:生成式AI可以通過生成并疊加到原始任何缺失、模糊或誤導性的視覺元素上來自動更正照片,還可以將任何低分辨率原始圖像轉(zhuǎn)換為高分辨率版本,也可以通過混合現(xiàn)有的肖像或從任何特定的肖像中抽象特征來產(chǎn)生自然的外觀,或者從語義標簽中生成逼真的圖像。
生成音頻:生成式AI可以將任何計算機生成的聲音渲染成一個真正聽起來像是在人類聲帶中自然產(chǎn)生的聲音,也可以將文本翻譯成語音、可以組成音樂。同樣,生成式AI也可以生成視頻、文本、字幕等。
生成材料:生成式AI甚至可以通過3D打印、CRISPR和其他技術從零開始呈現(xiàn)假肢、有機分子和其他物品。
Vol.4
迪斯尼、Netflix、影譜科技等率先發(fā)力
那么,如今哪些公司在發(fā)力生成式AI呢。通過其能生成音視頻、字幕等很容易聯(lián)想到,傳媒娛樂公司一定在使用。
的確,包括迪士尼、Netflix等娛樂傳媒巨頭均在嘗試用生成式AI代替標準內(nèi)容制作。例如迪士尼借助生成式AI生成動畫,只需通過文本描述某些活動,而不是注釋數(shù)據(jù)和大量訓練就能創(chuàng)建動畫、電影劇本視頻。
Netflix會借助生成式AI抽取符合觀影習慣和需求的畫面,然后把這些圖片制作成內(nèi)容封面,以降低內(nèi)容搜尋難度,提升視頻制作效率。
去年9月上市的Unity是3D生成型AI的推動者。全球有超過一半的移動、PC 和主機游戲采用了其生成引擎來制作,其3D-AI技術也廣泛應用于工業(yè)設計的3D模型搭建,VR/AR設備內(nèi)容創(chuàng)作以及影視特效制作。
此外,一家名為Insilico Medicine(英科智能)的AI藥物研發(fā)公司也是生成式AI的應用者。作為一家抗衰老及癌癥治療藥物研發(fā)商,Insilico Medicine依托基因組學、醫(yī)療大數(shù)據(jù)及AI技術等技術手段,專注于癌癥治療、抗衰老藥物的研發(fā)、生產(chǎn)及銷售。同時該公司也是全球第一家應用GANs,2015年在全球范圍內(nèi)率先利用生成對抗網(wǎng)絡(GANs)和強化學習(RL)技術,生成具有特定性質(zhì)的藥物分子結(jié)構。
不止國外,國內(nèi)的影譜科技在2018年底便發(fā)布AGC智能影像生產(chǎn)引擎,這也是國內(nèi)最早一批借助生成式AI開發(fā)的技術框架。
影譜科技的智能影像生成引擎MAGC已率先應用在傳媒娛樂領域,被知名電視臺、電信運營商、短視頻平臺廣泛采納。除此之外,MAGC還廣泛應用于數(shù)字人的3D成像,影視特效制作及數(shù)字孿生、虛擬主播、虛擬課堂等數(shù)字產(chǎn)權場景。
在文娛領域,影譜科技打造的智能文娛解決方案可以幫助產(chǎn)業(yè)推動視頻自動化生產(chǎn),提高內(nèi)容生產(chǎn)效率,在視頻幀審校、視頻過濾、內(nèi)容推薦到視頻審核、視頻深度預測、流媒體視頻及短視頻內(nèi)容生產(chǎn)、故事可視化等產(chǎn)業(yè)環(huán)節(jié)應用。
在傳媒領域,影譜科技推出的智慧傳媒平臺服務,從內(nèi)容創(chuàng)建到分發(fā),形成以元數(shù)據(jù)為基本單位的一站式智能影像技術服務,提供包括批量化創(chuàng)建智能影像、視頻資產(chǎn)管理與分析、智能影像運營、再到智能視頻商業(yè)化的全過程。
基于影譜科技智能影像技術的AI方案,可在處理新聞、體育賽事等內(nèi)容發(fā)揮作用。例如,實時自動繪制虛擬越位線,包括徽標,識別名人,提取字幕、人物圖像等。