百度李士巖:數(shù)字人3.0將具有千人千面的互動能力

2022-01-15 20:43:43   來源:新浪科技   評論:0   [收藏]   [評論]
導(dǎo)讀:  1月14日下午,百度科技沙龍《AI呀,我去!》第四期活動現(xiàn)場,百度智能云AI人機交互實驗室負(fù)責(zé)人李士巖指出,虛擬數(shù)字人產(chǎn)業(yè)格局中,提供建模、渲染、動態(tài)捕捉等服務(wù)于數(shù)字人制作的基礎(chǔ)設(shè)施服務(wù)商已形成穩(wěn)固格
  1月14日下午,百度科技沙龍《AI呀,我去!》第四期活動現(xiàn)場,百度智能云AI人機交互實驗室負(fù)責(zé)人李士巖指出,虛擬數(shù)字人產(chǎn)業(yè)格局中,提供建模、渲染、動態(tài)捕捉等服務(wù)于數(shù)字人制作的基礎(chǔ)設(shè)施服務(wù)商已形成穩(wěn)固格局,大多由海外巨頭把持,但在工具、應(yīng)用層,中國企業(yè)已開始嶄露頭角。

  目前,數(shù)字人經(jīng)歷了以“紙片人”為代表的1.0階段,以Vtuber主播為代表的2.0時代,已進化至3.0階段,具備模型高精、人工智能驅(qū)動特點的數(shù)字人3.0成為行業(yè)主流。在李士巖看來,第三代數(shù)字人的建模和內(nèi)容生產(chǎn)均有AI參與,這使得數(shù)字人的制作效率更高,也更智能,能面向更多應(yīng)用場景與全群體用戶,可由視頻、直播、chatbot等載體承載,具備千人千面的互動能力。

  在李士巖看來,數(shù)字人產(chǎn)業(yè)有三大核心推動力,第一級火箭是用戶需求與技術(shù)升級、第二級是政策支持與資本涌入、第三級是計算平臺的迭代。“每一次數(shù)字人發(fā)展本質(zhì)上都是技術(shù)推動的,用戶從平面的圖文影音獲取信息與交互,向?qū)崟r3D交互反饋的需求轉(zhuǎn)變,將成為數(shù)字人長期發(fā)展的根本動能,未來也將創(chuàng)造大量需求。”李士巖表示。

  雖然數(shù)字人行業(yè)擁有強勁的驅(qū)動力,但李士巖認(rèn)為,當(dāng)下國內(nèi)數(shù)字人要大規(guī)模產(chǎn)業(yè)落地還面臨三大難題。

  首先,數(shù)字人產(chǎn)業(yè)鏈各個節(jié)點相對割裂,不能高效協(xié)同,導(dǎo)致數(shù)字人在制作和調(diào)優(yōu)上存在較高壁壘,目前行業(yè)中大多數(shù)公司只是數(shù)字人制作與運營全流程上的一環(huán)或其中幾環(huán)。其次,服務(wù)場景與演藝場景沒有有效打通,表現(xiàn)為演藝型數(shù)字人不具備客戶所需的業(yè)務(wù)能力,而服務(wù)型數(shù)字人缺乏人設(shè),難以與用戶進行情感交流。最后,滿足高機動性、高頻需求的成本依舊很高,這一問題歸根結(jié)底還是數(shù)字人的生產(chǎn)效率問題。

  面對當(dāng)前數(shù)字人制作的高門檻,2021年12月,百度create大會上,百度CTO王海峰正式發(fā)布了“百度智能云曦靈數(shù)字人平臺”,搭建集數(shù)字人生產(chǎn)、內(nèi)容創(chuàng)作、業(yè)務(wù)配置服務(wù)為一體的平臺級產(chǎn)品。目前該產(chǎn)品已具備標(biāo)準(zhǔn)平臺的快速交付能力,幫助不同領(lǐng)域客戶快速實現(xiàn)敏捷型需求,降本增效。

  據(jù)李士巖介紹,百度的數(shù)字人平臺曦靈具有全場景、一站式、平臺化的特點,能支持從最初數(shù)字人形象定制、人設(shè)管理再到業(yè)務(wù)編排、內(nèi)容創(chuàng)作,最后到多種驅(qū)動模式下與用戶互動的全部需求,這也意味著在一個平臺上即可實現(xiàn)數(shù)字人的全鏈路調(diào)優(yōu),從而將效果做到最好。

  早在2019年,百度就開始了“虛擬數(shù)字人戰(zhàn)略”。基于多年的AI技術(shù)沉淀, AI能力已成為百度智能云曦靈平臺的核心能力,現(xiàn)在百度也在把這種能力開放給外界。李士巖表示,“我們近兩年的奮斗目標(biāo)是通過百度智能云曦靈平臺的開放,讓每個人實現(xiàn)數(shù)字人自由。”

分享到:
責(zé)任編輯:zsz

網(wǎng)友評論