阿里達(dá)摩院新專(zhuān)利可提升聲紋特征提取準(zhǔn)確性
2023-06-13 10:38:10
分享
6月13日消息,天眼查APP顯示,近日,阿里巴巴達(dá)摩院(杭州)科技有限公司“聲紋特征提取方法、說(shuō)話(huà)人識(shí)別方法、模型訓(xùn)練方法及裝置”專(zhuān)利公開(kāi)。專(zhuān)利摘要顯示,主要技術(shù)方案包括:獲取包含語(yǔ)音的音頻段;提取音頻段的頻譜特征輸入聲紋提取模型。其中聲紋提取模型的第一卷積處理層包括一個(gè)以上串連的第一卷積處理模塊,第一卷積處理模塊包括多個(gè)串連的基礎(chǔ)模塊;基礎(chǔ)模塊對(duì)輸入該基礎(chǔ)模塊的特征進(jìn)行降維處理,得到第一特征;對(duì)第一特征進(jìn)行至少一種粒度的池化處理,并對(duì)池化處理的結(jié)果進(jìn)行卷積處理,得到第二特征;以及對(duì)第一特征進(jìn)行卷積處理得到第三特征;對(duì)第二特征和第三特征進(jìn)行融合處理,得到該基礎(chǔ)模塊輸出的特征;池化層對(duì)第一卷積處理層輸出的特征進(jìn)行池化處理,得到聲紋特征。本申請(qǐng)能夠提升聲紋特征提取的準(zhǔn)確性。
更加詳細(xì)情況,請(qǐng)關(guān)注本站最新動(dòng)態(tài)。