螞蟻集團(tuán)AntInsBert模型登頂CLUE閱讀理解榜 打破歷史記錄
8月10日消息,日前,中文語言理解測評基準(zhǔn)(CLUE)閱讀理解排行榜顯示,螞蟻集團(tuán)保險科技團(tuán)隊(duì)的AntInsBert模型以92.475的得分,打破了CLUE閱讀理解榜的歷史紀(jì)錄,排名第一。
據(jù)了解,機(jī)器閱讀理解技術(shù)一直是語義理解領(lǐng)域最為關(guān)鍵的能力之一。機(jī)器閱讀理解技術(shù)難度高、理解復(fù)雜,不僅要求AI對內(nèi)容進(jìn)行閱讀和理解,還需要針對相關(guān)問題,推理總結(jié)出正確答案。
據(jù)悉,憑借多年來在自然語言處理方面的深耕,螞蟻保險科技團(tuán)隊(duì)自主研發(fā)了預(yù)訓(xùn)練語言模型——AntInsBert。該模型僅包含十億參數(shù)量,是業(yè)界百億大模型的十分之一,主要在兩個技術(shù)上進(jìn)行了升級。
首先,AntInsBert對傳統(tǒng)語言模型預(yù)訓(xùn)練方案做了改進(jìn),設(shè)計(jì)了基于Prompt的知識增強(qiáng)預(yù)訓(xùn)練方案,將海量知識圖譜內(nèi)容引入到預(yù)訓(xùn)練模型當(dāng)中。
其次,為進(jìn)一步挖掘AntInsBert在機(jī)器閱讀理解算法上的潛力,該方案將文本分類、信息抽取、指代消解等常見的中文語義理解任務(wù),通過模板轉(zhuǎn)化為閱讀理解任務(wù),進(jìn)一步提升了模型的范化性。
此前,在第11屆CCF自然語言處理與中文計(jì)算會議(NLPCC)上,螞蟻集團(tuán)保險科技團(tuán)隊(duì)?wèi){借多年來在保險領(lǐng)域?qū)υ捓斫獾募夹g(shù)積累,獲得“細(xì)粒度對話社會偏見識別”評測任務(wù)第一名。
目前,AntInsBert模型已經(jīng)在螞蟻?!敖疬x”和“安心賠”等保險服務(wù)環(huán)節(jié)得到了應(yīng)用。例如,為了降低消費(fèi)者決策難度,螞蟻保險團(tuán)隊(duì)借助機(jī)器閱讀理解系統(tǒng)對保險條款進(jìn)行閱讀,將用戶最關(guān)心的投保門檻、保障范圍、價格等因素進(jìn)行結(jié)構(gòu)化,并組織專家團(tuán)隊(duì)橫向?qū)Ρ攘耸袌錾蠑?shù)千款保險產(chǎn)品,盡量保證螞蟻?!敖疬x”篩選出平臺上綜合競爭力最強(qiáng)的保險產(chǎn)品。
與此同時,機(jī)器閱讀理解也運(yùn)用在螞蟻?!鞍残馁r”服務(wù)中,通過對用戶上傳的理賠材料的理解,實(shí)現(xiàn)了理賠流程的自動化與智能化,大幅縮短傳統(tǒng)人工審核的耗時。以人保健康承保的好醫(yī)保長期醫(yī)療險為例,對于理賠金額小于2萬元的理賠案件,90%以上都可保證實(shí)現(xiàn)安心賠“2日快賠”。
(圖源 螞蟻保微博)
2、電商號平臺僅提供信息存儲服務(wù),如發(fā)現(xiàn)文章、圖片等侵權(quán)行為,侵權(quán)責(zé)任由作者本人承擔(dān)。
3、如對本稿件有異議或投訴,請聯(lián)系:info@dsb.cn
