阿里達摩院公開“音頻信號處理方法、裝置、設(shè)備”專利
12月20日消息,天眼查資料顯示,阿里巴巴達摩院(杭州)科技有限公司12月17日公開一項“音頻信號處理方法、裝置、設(shè)備及存儲介質(zhì)”專利,申請公布號為CN113808578A,申請日期為2021年11月16日。
該專利摘要顯示,本公開涉及一種音頻信號處理方法、裝置、設(shè)備及存儲介質(zhì)。
本公開通過對音頻信號進行分段處理得到多個音頻分段,根據(jù)多個音頻分段中每個音頻分段的特征信息,對多個音頻分段進行聚類處理,得到一個或多個第一集合。進一步,根據(jù)每個第一集合包括的音頻分段的特征信息,確定每個第一集合的第一聚類中心,并且根據(jù)每個第一集合的第一聚類中心,對多個音頻分段進行聚類處理,得到一個或多個第二集合,其中,同一個第二集合中的音頻分段對應(yīng)相同的角色標簽。
也就是說,在對多個音頻分段進行初始聚類處理后,還可以根據(jù)每個第一集合的第一聚類中心,對多個音頻分段進行再次聚類處理,從而提高了基于單通道語音的無監(jiān)督角色分離的準確性。
12月17日,阿里巴巴達摩院(杭州)科技有限公司還公開“模型訓(xùn)練方法、裝置、設(shè)備及存儲介質(zhì)”、“語音處理方法、設(shè)備及存儲介質(zhì)”、“視頻處理方法、裝置、電子設(shè)備和可讀介質(zhì)”等多項專利。
天眼查資料顯示,阿里巴巴達摩院(杭州)科技有限公司成立于2017年11月7日,法定代表人為周明,注冊資本1000萬人民幣,經(jīng)營范圍包括:技術(shù)服務(wù)、技術(shù)開發(fā)、技術(shù)咨詢、技術(shù)交流、技術(shù)轉(zhuǎn)讓、技術(shù)推廣;軟件開發(fā);專業(yè)設(shè)計服務(wù);翻譯服務(wù)(除依法須經(jīng)批準的項目外,憑營業(yè)執(zhí)照依法自主開展經(jīng)營活動)。
股權(quán)穿透圖顯示,阿里巴巴達摩院(杭州)科技有限公司由阿里巴巴(中國)有限公司全資持股,認繳金額1000萬人民幣。
2、電商號平臺僅提供信息存儲服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責任由作者本人承擔。
3、如對本稿件有異議或投訴,請聯(lián)系:info@dsb.cn
