欧美videosvideo喷水,欧美成ee人免费视频,亚洲欧洲日本综合aⅴ在线,国产精品美女久久久久久福利,国产成人午夜福利高清在线观看

阿里云宣布開源通義千問14B模型

云合
2023-09-25 15:17

9月25日消息,阿里云開源通義千問140億參數(shù)模型Qwen-14B及其對話模型Qwen-14B-Chat,免費可商用。Qwen-14B在多個權威評測中超越同等規(guī)模模型,部分指標甚至接近Llama2-70B。阿里云此前開源了70億參數(shù)模型Qwen-7B等,一個多月下載量破100萬,成為開源社區(qū)的口碑之作。

format-jpg

截自微博

Qwen-14B是一款支持多種語言的高性能開源模型,相比同類模型使用了更多的高質量數(shù)據(jù),整體訓練數(shù)據(jù)超過3萬億Token,使得模型具備更強大的推理、認知、規(guī)劃和記憶能力。Qwen-14B最大支持8k的上下文窗口長度。

format-jpg

Qwen-14B在十二個權威測評中全方位超越同規(guī)模SOTA大模型,圖源:數(shù)科NA,下同

Qwen-14B-Chat是在基座模型上經(jīng)過精細SFT得到的對話模型。借助基座模型強大性能,Qwen-14B-Chat生成內容的準確度大幅提升,也更符合人類偏好,內容創(chuàng)作上的想象力和豐富度也有顯著擴展。

Qwen擁有出色的工具調用能力,能讓開發(fā)者更快地構建基于Qwen的Agent(智能體)。開發(fā)者可用簡單指令教會Qwen使用復雜工具,比如使用Code Interpreter工具執(zhí)行Python代碼以進行復雜的數(shù)學計算、數(shù)據(jù)分析、圖表繪制等;還能開發(fā)具有多文檔問答、長文寫作等能力的“高級數(shù)字助理”。

百億以內參數(shù)級別大語言模型是目前開發(fā)者進行應用開發(fā)和迭代的主流選擇, Qwen-14B進一步提高了小尺寸模型的性能上限,從眾多同尺寸模型中沖出重圍,在MMLU、C-Eval、GSM8K、MATH、GaoKao-Bench等12個權威測評中取得最優(yōu)成績,超越所有測評中的SOTA(State-Of-The-Art)大模型,也全面超越Llama-2-13B,比起Llama 2的34B、70B模型也并不遜色。與此同時,Qwen-7B也全新升級,核心指標最高提升22.5%。

format-jpg

Qwen-14B性能超越同尺寸模型

用戶可從魔搭社區(qū)直接下載模型,也可通過阿里云靈積平臺訪問和調用Qwen-14B和Qwen-14B-Chat。阿里云為用戶提供包括模型訓練、推理、部署、精調等在內的全方位服務。

8月,阿里云開源通義千問70億參數(shù)基座模型Qwen-7B,先后沖上HuggingFace、Github的trending榜單。短短一個多月,累計下載量突破100萬。開源社區(qū)出現(xiàn)了50多個基于Qwen的模型,社區(qū)多個知名的工具和框架都集成了Qwen。

format-jpg

通義千問是落地最深、應用最廣的中國大模型,國內已有多個月活過億的應用接入通義千問,大量中小企業(yè)、科研機構和個人開發(fā)者都在基于通義千問開發(fā)專屬大模型或應用產(chǎn)品,如阿里系的淘寶、釘釘、未來精靈,以及外部的科研機構、創(chuàng)業(yè)企業(yè)。

浙江大學聯(lián)合高等教育出版社基于Qwen-7B開發(fā)了智海-三樂教育垂直大模型,已在全國12所高校應用,可提供智能問答、試題生成、學習導航、教學評估等能力,模型已在阿里云靈積平臺對外提供服務,一行代碼即可調用;浙江有鹿機器人科技有限公司在路面清潔機器人中集成了Qwen-7B,使機器人能以自然語言與用戶進行實時交互,理解用戶提出的需求,將用戶的高層指令進行分析和拆解,做高層的邏輯分析和任務規(guī)劃,完成清潔任務。

阿里云CTO周靖人表示,阿里云將持續(xù)擁抱開源開放,推動中國大模型生態(tài)建設。阿里云篤信開源開放的力量,率先開源自研大模型,希望讓大模型技術更快觸達中小企業(yè)和個人開發(fā)者。

阿里云還牽頭建設了中國最大的AI模型開源社區(qū)魔搭ModelScope,團結全行業(yè)的力量,共同推動大模型技術普惠和應用落地。過去兩個月內,魔搭社區(qū)的模型下載量從4500萬飆升到8500萬,增幅接近100%。

1、該內容為作者獨立觀點,不代表電商派觀點或立場,文章為作者本人上傳,版權歸原作者所有,未經(jīng)允許不得轉載。
2、電商號平臺僅提供信息存儲服務,如發(fā)現(xiàn)文章、圖片等侵權行為,侵權責任由作者本人承擔。
3、如對本稿件有異議或投訴,請聯(lián)系:info@dsb.cn
相關閱讀
12月1日消息,在通義發(fā)布會上,阿里開源通義720億參數(shù)模型Qwen-72B、18億參數(shù)模型Qwen-1.8B及音頻大模型Qwen-Audio。據(jù)悉,阿里本次開源的模型中除預訓練模型外,還同步推出了對應的對話模型,面向72B、1.8B對話模型提供了4bit/8bit量化版模型,便于開發(fā)者們推理訓練。
8月3日消息,據(jù)36氪,阿里今日開源通義70億參數(shù)模型,包括通用模型Qwen-7B和對話模型Qwen-7B-Chat,兩款模型均已上線魔搭社區(qū),開源、免費、可商用。此舉讓阿里成為國內首個加入大模型開源行列的大型科技企業(yè)。
阿里CTO周靖人今天宣布阿里開源通義720億參數(shù)模型Qwen-72B。
8月25日消息,阿里今日推出大規(guī)模視覺語言模型Qwen-VL,并對其直接開源。Qwen-VL以通義70億參數(shù)模型Qwen-7B為基座語言模型研發(fā),支持圖文輸入。相較于此前的VL模型,Qwen-VL除了具備基本的圖文識別、描述、問答及對話能力之外,還新增了視覺定位、圖像中文字理解等能力,可用于知識問答、圖像標題生成、圖像問答、文檔問答、細粒度視覺定位等場景。
4月7日消息,阿里通義開源320億參數(shù)模型Qwen1.5-32B。通義此前已開源5億、18億、40億、70億、140億和720億參數(shù)6款大語言模型。此次開源的320億參數(shù)模型,將在性能、效率和內存占用之間實現(xiàn)更理想的平衡,其希望32B開源模型能為企業(yè)和開發(fā)者提供更高性價比的模型選擇。
阿里官方宣布,通義大模型商業(yè)化模型與開源模型降價。
12月8日消息,全球最大的開源大模型社區(qū)HuggingFace日前公布了最新的開源大模型排行榜,阿里通義登頂榜首。據(jù)了解,HuggingFace的開源大模型排行榜收錄了全球上百個開源大模型,測試維度涵蓋閱讀理解、邏輯推理、數(shù)學計算、事實問答等六大評測。
12月22日消息,國內首個官方“大模型標準符合性評測”結果公布,阿里通義大模型成為首批通過評測的四款國產(chǎn)大模型之一,在通用性、智能性等維度均達到國家相關標準要求。本次通過評測的首批大模型中,通義是唯一的開源模型。據(jù)介紹,“大模型標準符合性評測”由中國電子技術標準化研究院發(fā)起,旨在建立中國大模型標準符合性名錄,引領人工智能產(chǎn)業(yè)健康有序發(fā)展。
12月12日消息,中國權威的大模型評測平臺OpenCompass日前更新了榜單,阿里通義72B模型登上開源基座大模型榜首。OpenCompass是上海人工智能實驗室開源的大模型評測平臺,涵蓋學科、語言、知識、理解、推理等五大評測維度,可全面評估大模型能力。此前,通義還曾力壓Llama2登頂全球最具權威性的HuggingFace開源大模型排行榜。