5月21日,在全國(guó)人民代表大會(huì)召開之際,由搜狗和新華社聯(lián)合推出的世界首個(gè)3D人工智能合成主播“新肖偉”正式亮相,將全國(guó)人民代表大會(huì)的最新新聞和信息報(bào)道帶給全國(guó)觀眾。基于搜狗人工智能核心技術(shù)“搜狗的化身”的“新小微”,將開啟中國(guó)傳媒業(yè)全面進(jìn)入智能時(shí)代。搜狗在頭像技術(shù)上取得了又一次突破,作為人工智能復(fù)合錨的先驅(qū)和領(lǐng)導(dǎo)者,引領(lǐng)人工智能復(fù)合錨進(jìn)入了3D時(shí)代。自2018年推出全球首款基于搜狗頭像技術(shù)的人工智能復(fù)合主播以來,搜狗頭像不斷取得重大突破,這款3D人工智能復(fù)合主播是搜狗頭像的最新突破成果。《新》以新華社記者趙為原型,基于超逼真3D數(shù)字人體建模、多模態(tài)識(shí)別與生成、實(shí)時(shí)人臉運(yùn)動(dòng)生成與驅(qū)動(dòng)、遷移學(xué)習(xí)等多種人工智能前沿技術(shù),使機(jī)器能夠基于輸入文本生成高保真3D數(shù)字人體視頻內(nèi)容。3D人工智能合成錨結(jié)合了行業(yè)領(lǐng)先的掃描和修復(fù)、面部肌肉驅(qū)動(dòng)、表情肢體捕捉和力技術(shù)提供的其他技術(shù),以產(chǎn)生高度恢復(fù)真實(shí)人類毛發(fā)和生動(dòng)圖像的數(shù)字人類模型;同時(shí),基于搜狗領(lǐng)先的端到端多模態(tài)建模技術(shù),利用語音、圖像、文本和三維肌肉運(yùn)動(dòng)數(shù)據(jù)等多模態(tài)信息完成關(guān)節(jié)建模訓(xùn)練。在人工智能算法的驅(qū)動(dòng)下,“新瓦威”只需輸入文本內(nèi)容,就可以根據(jù)語義實(shí)時(shí)播報(bào)新聞,其面部表情、嘴唇動(dòng)作、身體動(dòng)作和聲音表情高度一致,自然逼真。從2D到3D,搜狗人工智能繼續(xù)引領(lǐng)媒體應(yīng)用的創(chuàng)新。搜狗推出全球首款人工智能合成主播后,人工智能合成主播通過不斷的迭代更新,具備了多語種播放、對(duì)話和互動(dòng)等多種功能,并以尖端的技術(shù)能力和產(chǎn)品效果不斷推動(dòng)媒體行業(yè)內(nèi)容制作的效率變革。據(jù)統(tǒng)計(jì),第一位人工智能合成主持人“新小昊”在新華社的客戶端已經(jīng)為觀眾服務(wù)了500多天,制作了13000多條新聞報(bào)道,累計(jì)時(shí)長(zhǎng)超過35000分鐘。與之前的2D人工智能復(fù)合錨相比,3D“新娃娃臉”不僅具有立體感、靈活性和可控性,還具有支持多攝像機(jī)、多景深、360°任意角度呈現(xiàn)內(nèi)容的能力。它在應(yīng)用空間上有更多的可能性,為新聞節(jié)目的多樣化制作和呈現(xiàn)帶來更多的選擇。在5G時(shí)代,搜狗阿凡達(dá)技術(shù)的應(yīng)用將從最初的2D爆炸到今天的3D人工智能合成錨,而在它的背后不僅僅是搜狗阿凡達(dá)技術(shù)一次又一次
電商動(dòng)態(tài)
搜狗人工智能技術(shù)再次迎來突破,世界首個(gè)3D人工智能合成錨發(fā)布
瀏覽:163 時(shí)間:2023-8-31