小米公開(kāi)識(shí)別媒體文件中人聲配音類型相關(guān)專利
10月19日消息,天眼查信息顯示,今天,北京小米移動(dòng)軟件有限公司公開(kāi)“識(shí)別媒體文件中人聲配音類型的方法、裝置及存儲(chǔ)介質(zhì)”專利,申請(qǐng)公布號(hào)為CN113516154A,申請(qǐng)日期為2021年4月。
專利摘要顯示,本公開(kāi)是關(guān)于一種識(shí)別媒體文件中人聲配音類型的方法、裝置及存儲(chǔ)介質(zhì)。一種識(shí)別媒體文件中人聲配音類型的方法,包括:獲取待識(shí)別的媒體文件,媒體文件至少包括音頻數(shù)據(jù),音頻數(shù)據(jù)至少包括人聲配音數(shù)據(jù)。基于預(yù)先訓(xùn)練得到的類型識(shí)別模型,確定人聲配音數(shù)據(jù)中的人聲配音的配音類型,配音類型包括真實(shí)人聲和模擬人聲。
通過(guò)本公開(kāi)提供的識(shí)別媒體文件中人聲配音類型的方法,能夠通過(guò)預(yù)先訓(xùn)練得到的類型識(shí)別模型將媒體文件中人聲配音數(shù)據(jù)中的人聲配音進(jìn)行識(shí)別,進(jìn)而確定該人聲配音的配音類型屬于真實(shí)人聲還是模擬人聲,從而提高音頻分類的辨識(shí)度,解決無(wú)法有效分辨人聲配音的配音類型的問(wèn)題。
信息顯示,北京小米移動(dòng)軟件有限公司成立于2012年5月8日,注冊(cè)資本為148800萬(wàn)人民幣,法定代表人為王川,經(jīng)營(yíng)范圍包括計(jì)算機(jī)系統(tǒng)服務(wù);設(shè)計(jì)、制作、代理、發(fā)布廣告;承辦展覽展示活動(dòng);市場(chǎng)調(diào)查;貨物進(jìn)出口、技術(shù)進(jìn)出口、代理進(jìn)出口等。
專利信息顯示,近日,該公司還公開(kāi)了“屏幕顯示的方法及裝置”、“智能設(shè)備的操作方法、裝置及存儲(chǔ)介質(zhì)”、“智能設(shè)備的管理方法、裝置及存儲(chǔ)介質(zhì)”等專利。
2、電商號(hào)平臺(tái)僅提供信息存儲(chǔ)服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對(duì)本稿件有異議或投訴,請(qǐng)聯(lián)系:info@dsb.cn