阿里云宣布開源通義千問14B模型

云合

2023-09-25 15:17

9月25日消息，阿里云開源通義千問140億參數(shù)模型Qwen-14B及其對話模型Qwen-14B-Chat，免費可商用。Qwen-14B在多個權威評測中超越同等規(guī)模模型，部分指標甚至接近Llama2-70B。阿里云此前開源了70億參數(shù)模型Qwen-7B等，一個多月下載量破100萬，成為開源社區(qū)的口碑之作。

format-jpg

截自微博

Qwen-14B是一款支持多種語言的高性能開源模型，相比同類模型使用了更多的高質量數(shù)據(jù)，整體訓練數(shù)據(jù)超過3萬億Token，使得模型具備更強大的推理、認知、規(guī)劃和記憶能力。Qwen-14B最大支持8k的上下文窗口長度。

format-jpg

Qwen-14B在十二個權威測評中全方位超越同規(guī)模SOTA大模型，圖源：數(shù)科NA，下同

Qwen-14B-Chat是在基座模型上經(jīng)過精細SFT得到的對話模型。借助基座模型強大性能，Qwen-14B-Chat生成內容的準確度大幅提升，也更符合人類偏好，內容創(chuàng)作上的想象力和豐富度也有顯著擴展。

Qwen擁有出色的工具調用能力，能讓開發(fā)者更快地構建基于Qwen的Agent（智能體）。開發(fā)者可用簡單指令教會Qwen使用復雜工具，比如使用Code Interpreter工具執(zhí)行Python代碼以進行復雜的數(shù)學計算、數(shù)據(jù)分析、圖表繪制等；還能開發(fā)具有多文檔問答、長文寫作等能力的“高級數(shù)字助理”。

百億以內參數(shù)級別大語言模型是目前開發(fā)者進行應用開發(fā)和迭代的主流選擇， Qwen-14B進一步提高了小尺寸模型的性能上限，從眾多同尺寸模型中沖出重圍，在MMLU、C-Eval、GSM8K、MATH、GaoKao-Bench等12個權威測評中取得最優(yōu)成績，超越所有測評中的SOTA（State-Of-The-Art）大模型，也全面超越Llama-2-13B，比起Llama 2的34B、70B模型也并不遜色。與此同時，Qwen-7B也全新升級，核心指標最高提升22.5%。

format-jpg

Qwen-14B性能超越同尺寸模型

用戶可從魔搭社區(qū)直接下載模型，也可通過阿里云靈積平臺訪問和調用Qwen-14B和Qwen-14B-Chat。阿里云為用戶提供包括模型訓練、推理、部署、精調等在內的全方位服務。

8月，阿里云開源通義千問70億參數(shù)基座模型Qwen-7B，先后沖上HuggingFace、Github的trending榜單。短短一個多月，累計下載量突破100萬。開源社區(qū)出現(xiàn)了50多個基于Qwen的模型，社區(qū)多個知名的工具和框架都集成了Qwen。

format-jpg

通義千問是落地最深、應用最廣的中國大模型，國內已有多個月活過億的應用接入通義千問，大量中小企業(yè)、科研機構和個人開發(fā)者都在基于通義千問開發(fā)專屬大模型或應用產(chǎn)品，如阿里系的淘寶、釘釘、未來精靈，以及外部的科研機構、創(chuàng)業(yè)企業(yè)。

浙江大學聯(lián)合高等教育出版社基于Qwen-7B開發(fā)了智海-三樂教育垂直大模型，已在全國12所高校應用，可提供智能問答、試題生成、學習導航、教學評估等能力，模型已在阿里云靈積平臺對外提供服務，一行代碼即可調用；浙江有鹿機器人科技有限公司在路面清潔機器人中集成了Qwen-7B，使機器人能以自然語言與用戶進行實時交互，理解用戶提出的需求，將用戶的高層指令進行分析和拆解，做高層的邏輯分析和任務規(guī)劃，完成清潔任務。

阿里云CTO周靖人表示，阿里云將持續(xù)擁抱開源開放，推動中國大模型生態(tài)建設。阿里云篤信開源開放的力量，率先開源自研大模型，希望讓大模型技術更快觸達中小企業(yè)和個人開發(fā)者。

阿里云還牽頭建設了中國最大的AI模型開源社區(qū)魔搭ModelScope，團結全行業(yè)的力量，共同推動大模型技術普惠和應用落地。過去兩個月內，魔搭社區(qū)的模型下載量從4500萬飆升到8500萬，增幅接近100%。

阿里云阿里云通義千問阿里云開源14B模型高性能開源模型

聲明

1、該內容為作者獨立觀點，不代表電商派觀點或立場，文章為作者本人上傳，版權歸原作者所有，未經(jīng)允許不得轉載。
2、電商號平臺僅提供信息存儲服務，如發(fā)現(xiàn)文章、圖片等侵權行為，侵權責任由作者本人承擔。
3、如對本稿件有異議或投訴，請聯(lián)系：info@dsb.cn

相關閱讀

阿里云開源通義千問720億參數(shù)模型

2023-12-01 10:36:04

12月1日消息，在通義千問發(fā)布會上，阿里云開源通義千問720億參數(shù)模型Qwen-72B、18億參數(shù)模型Qwen-1.8B及音頻大模型Qwen-Audio。據(jù)悉，阿里云本次開源的模型中除預訓練模型外，還同步推出了對應的對話模型，面向72B、1.8B對話模型提供了4bit/8bit量化版模型，便于開發(fā)者們推理訓練。

阿里云通義千問70億參數(shù)模型開源

2023-08-03 14:50:39

8月3日消息，據(jù)36氪，阿里云今日開源通義千問70億參數(shù)模型，包括通用模型Qwen-7B和對話模型Qwen-7B-Chat，兩款模型均已上線魔搭社區(qū)，開源、免費、可商用。此舉讓阿里云成為國內首個加入大模型開源行列的大型科技企業(yè)。

阿里云周靖人宣布通義千問720億參數(shù)模型開源

2023-12-01 11:37:59

阿里云CTO周靖人今天宣布阿里云開源通義千問720億參數(shù)模型Qwen-72B。

阿里云開源通義千問多模態(tài)大模型Qwen-VL

2023-08-25 11:47:09

8月25日消息，阿里云今日推出大規(guī)模視覺語言模型Qwen-VL，并對其直接開源。Qwen-VL以通義千問70億參數(shù)模型Qwen-7B為基座語言模型研發(fā)，支持圖文輸入。相較于此前的VL模型，Qwen-VL除了具備基本的圖文識別、描述、問答及對話能力之外，還新增了視覺定位、圖像中文字理解等能力，可用于知識問答、圖像標題生成、圖像問答、文檔問答、細粒度視覺定位等場景。

阿里云通義千問7款大語言模型全開源

2024-04-07 15:20:53

4月7日消息，阿里云通義千問開源320億參數(shù)模型Qwen1.5-32B。通義千問此前已開源5億、18億、40億、70億、140億和720億參數(shù)6款大語言模型。此次開源的320億參數(shù)模型，將在性能、效率和內存占用之間實現(xiàn)更理想的平衡，其希望32B開源模型能為企業(yè)和開發(fā)者提供更高性價比的模型選擇。

阿里云通義千問GPT-4級主力模型降價97%

2024-05-21 11:33:15

阿里云官方宣布，通義千問大模型商業(yè)化模型與開源模型降價。

阿里云通義千問登頂HuggingFace排行榜

2023-12-08 17:04:34

12月8日消息，全球最大的開源大模型社區(qū)HuggingFace日前公布了最新的開源大模型排行榜，阿里云通義千問登頂榜首。據(jù)了解，HuggingFace的開源大模型排行榜收錄了全球上百個開源大模型，測試維度涵蓋閱讀理解、邏輯推理、數(shù)學計算、事實問答等六大評測。

阿里云通義千問通過國家大模型標準符合性評測

2023-12-22 20:19:26

12月22日消息，國內首個官方“大模型標準符合性評測”結果公布，阿里云通義千問大模型成為首批通過評測的四款國產(chǎn)大模型之一，在通用性、智能性等維度均達到國家相關標準要求。本次通過評測的首批大模型中，通義千問是唯一的開源模型。據(jù)介紹，“大模型標準符合性評測”由中國電子技術標準化研究院發(fā)起，旨在建立中國大模型標準符合性名錄，引領人工智能產(chǎn)業(yè)健康有序發(fā)展。

阿里通義千問登頂OpenCompass開源基模評測榜

2023-12-12 11:46:32

12月12日消息，中國權威的大模型評測平臺OpenCompass日前更新了榜單，阿里云通義千問72B模型登上開源基座大模型榜首。OpenCompass是上海人工智能實驗室開源的大模型評測平臺，涵蓋學科、語言、知識、理解、推理等五大評測維度，可全面評估大模型能力。此前，通義千問還曾力壓Llama2登頂全球最具權威性的HuggingFace開源大模型排行榜。

云合

欧美videosvideo喷水,欧美成ee人免费视频,亚洲欧洲日本综合aⅴ在线,国产精品美女久久久久久福利,国产成人午夜福利高清在线观看

阿里云宣布開源通義千問14B模型