首頁|必讀|視頻|專訪|運營|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|低空經(jīng)濟|智能汽車|特約記者
手機|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計算|芯片|報告|智慧城市|移動互聯(lián)網(wǎng)|會展

首頁 >> 人工智能 >> 正文

阿里推出全新推理模型：僅1/21參數(shù)媲美DeepSeek R1

2025年3月6日 10:15 快科技作者：隨心

阿里Qwen團隊正式發(fā)布他們最新的研究成果——QwQ-32B大語言模型。

這是一款擁有320億參數(shù)的模型，其性能可與具備6710億參數(shù)（其中370億被激活）的DeepSeek-R1媲美。

QwQ-32B在僅有DeepSeek-R1約1/21參數(shù)量的情況下，用強化學習實現(xiàn)了性能上的跨越。

此外，阿里還在推理模型中集成了與Agent相關的能力，使其能夠在使用工具的同時進行批判性思考，并根據(jù)環(huán)境反饋調(diào)整推理過程。

QwQ-32B 在一系列基準測試中進行了評估，測試了數(shù)學推理、編程能力和通用能力。

其中，在測試數(shù)學能力的AIME24評測集上，以及評估代碼能力的LiveCodeBench中，千問QwQ-32B表現(xiàn)與DeepSeek-R1相當，遠勝于o1-mini及相同尺寸的R1 蒸餾模型。

同時，在由Meta首席科學家楊立昆領銜的“最難LLMs評測榜”LiveBench、谷歌等提出的指令遵循能力IFEval評測集、由加州大學伯克利分校等提出的評估準確調(diào)用函數(shù)或工具方面的BFCL測試中，千問QwQ-32B的得分均超越了DeepSeek- R1。

目前，QwQ-32B已在Hugging Face和ModelScope開源，大家也可通過Qwen Chat直接進行體驗！

編輯：章芳

飛象網(wǎng)版權(quán)及免責聲明:
1.本網(wǎng)刊載內(nèi)容，凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有，未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像，違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載，請必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性，并完整標注作者信息和飛象網(wǎng)來源。
2.凡注明“來源：XXXX”的作品，均轉(zhuǎn)載自其它媒體，在于傳播更多行業(yè)信息，并不代表本網(wǎng)贊同其觀點和對其真實性負責。
3.如因作品內(nèi)容、版權(quán)和其它問題，請在相關作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系，我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777，郵件后綴為cctime.com，冒充本站員工以任何其他聯(lián)系方式，進行的“內(nèi)容核實”、“商務聯(lián)系”等行為，均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。

相關新聞

·通鼎互聯(lián)戰(zhàn)略收購南京和本機電55%股權(quán)，布局儲能消防新..	·江蘇省委社會工作部部長田洪一行考察調(diào)研亨通集團
·代表委員說｜薛濟萍代表：關于促進氫能產(chǎn)業(yè)持續(xù)發(fā)展的建議	·AI創(chuàng)作內(nèi)容版權(quán)到底歸誰？騰訊元寶三改用戶協(xié)議引爭議
·騰訊元寶回應用戶協(xié)議含“霸王條款”：意見已經(jīng)收到，..	·何小鵬：建議制定人形機器人銷售補貼政策，加快構(gòu)建飛..
·AI眼鏡概念股爆火，行業(yè)爆發(fā)前夜誰主沉��？	·消費電子密集接入DeepSeek 蹭熱點還是真智能？
·邁向全面智能化運維運營，使能新增長	·華為RAN Intelligent Agents榮獲GTI Awards“移動技術..
·高通首席運營官：AI與5G融合發(fā)展推動未來創(chuàng)新，將帶來..	·中興通訊發(fā)布《自智網(wǎng)絡白皮書（2025）》，以AI創(chuàng)新加..
·代表委員說｜薛濟萍代表：關于加快推進風電場改造升級..	·兩會企業(yè)界代表委員建言錄：聚焦AI安全與產(chǎn)業(yè)破局