淘寶公布數(shù)字人專利 可模擬用戶聲音
3月16日消息,天眼查知識產(chǎn)權信息顯示,3月15日,淘寶(中國)軟件有限公司申請的“基于數(shù)字人的視頻生成與交互方法、設備、存儲介質(zhì)與程序產(chǎn)品”專利公布。
摘要顯示,本申請實施例基于用戶的聲音特征和情感標簽進行文本轉(zhuǎn)語音處理,以及基于用戶的聲音特征和表情系數(shù)之間的映射關系進行語音轉(zhuǎn)表情處理,并基于語音信號和表情系數(shù)渲染數(shù)字人模型,以得到數(shù)字人模型的視頻數(shù)據(jù)。該專利精準地模擬用戶的聲音特征,確保了數(shù)字人的語音輸出不僅聽起來自然,而且實現(xiàn)數(shù)字人的個性化驅(qū)動,提高數(shù)字人在聲音和動態(tài)形象方面的逼真度,進而提高用戶體驗,提升了數(shù)字人的互動性、真實感和沉浸感。
淘寶(中國)軟件有限公司專利信息 圖源:天眼查APP
在去年11月,淘寶推出全網(wǎng)首次數(shù)字人拍賣。AI數(shù)字人度曉曉與真人拍賣師尹晨陽進行全網(wǎng)首次數(shù)字人拍賣。作為國內(nèi)首個可交互虛擬偶像,度曉曉于2020年首次亮相,是百度基于百度大腦7.0核心技術驅(qū)動,整合了多模態(tài)交互技術、3D數(shù)字人建模、機器翻譯、語音識別、自然語言理解等多項技術匯聚而成。其還產(chǎn)出過唱作歌曲,并且登上過央視舞臺。
數(shù)字人度曉曉也在去年開啟了個人主理的“曉曉AI萬事屋”淘寶店,除了看圖測MBTI bot,還有朋友圈神器、彩虹屁小天使等服務,都是來自于知識增強大語言模型產(chǎn)品——文心一言APP端內(nèi)的AI功能。店內(nèi)商品價格標價0.01元起,其中最貴的是定制數(shù)字人bot商品,承諾永久質(zhì)保,定金價格高達30萬元。
圖源:AI度曉曉微博
同在去年11月,阿里巴巴國際站發(fā)布了數(shù)字人虛擬主播直播管理規(guī)則。若商家想通過數(shù)字人虛擬主播在阿里巴巴國際站直播開播,需滿足平臺制定的管理流程和規(guī)則。關于準予直播類型,目前平臺僅支持數(shù)字人驅(qū)動,即由真人驅(qū)動的數(shù)字人虛擬主播,僅限擬真人形象在國際站報備后可以在平臺開播。另外,適用直播類型有工位接待、日常營銷、活動直播。
官方介紹,數(shù)字人虛擬主播指的是非真人,而僅以數(shù)字人虛擬主播形象出鏡進行直播。數(shù)字人虛擬主播形象即擬真人形象。同時,該規(guī)則只適用于Chinese Gold Supplier。需要注意的是,Global Gold Supplier暫不允許數(shù)字人虛擬直播,且僅允許使用阿里巴巴外貿(mào)服務市場入駐的數(shù)字人虛擬直播服務商進行國際站數(shù)字人直播,非外貿(mào)市場入駐的數(shù)字人直播一經(jīng)發(fā)現(xiàn)立刻關停且凍結(jié)直播權限7天。
阿里巴巴國際站發(fā)布數(shù)字人虛擬主播直播管理規(guī)則 圖源:Alibaba.com規(guī)則中心
2、電商號平臺僅提供信息存儲服務,如發(fā)現(xiàn)文章、圖片等侵權行為,侵權責任由作者本人承擔。
3、如對本稿件有異議或投訴,請聯(lián)系:info@dsb.cn