法國(guó)人工智能實(shí)驗(yàn)室 Mistral 周二宣布進(jìn)軍推理人工智能模型領(lǐng)域。6 月 10 日,Mistral 正式推出其首個(gè)推理模型系列 ——Magistral。該系列模型通過(guò)分步驟解決問(wèn)題,旨在提升在數(shù)學(xué)、物理等學(xué)科領(lǐng)域的一致性和可靠性,與 OpenAI 的 o3 模型和谷歌的 Gemini 2.5 Pro 等其他推理模型類似。

Magistral 系列包含兩個(gè)版本:Magistral Small 和 Magistral Medium。Magistral Small 擁有 240 億參數(shù),已在人工智能開(kāi)發(fā)平臺(tái) Hugging Face 上以 Apache 2.0 許可證開(kāi)放下載。而 Magistral Medium 是一個(gè)能力更強(qiáng)的模型,目前處于預(yù)覽階段,僅在 Mistral 的 Le Chat 聊天平臺(tái)、公司 API 以及第三方合作伙伴云平臺(tái)上提供。
Mistral 在其博客文章中表示:“Magistral 適用于廣泛的企業(yè)級(jí)應(yīng)用場(chǎng)景,包括結(jié)構(gòu)化計(jì)算、程序化邏輯、決策樹(shù)和基于規(guī)則的系統(tǒng)。這些模型經(jīng)過(guò)多步驟邏輯的微調(diào),能夠提升可解釋性,并以用戶語(yǔ)言提供可追溯的思考過(guò)程!
Mistral 成立于 2023 年,是一家前沿模型實(shí)驗(yàn)室,致力于開(kāi)發(fā)一系列人工智能驅(qū)動(dòng)的服務(wù),包括 Le Chat 和移動(dòng)應(yīng)用程序。該公司獲得了 General Catalyst 等風(fēng)險(xiǎn)投資機(jī)構(gòu)的支持,目前已籌集超過(guò) 11 億歐元(IT之家注:現(xiàn)匯率約合 90.22 億元人民幣)的資金。
盡管 Mistral 擁有強(qiáng)大的資源,但在某些領(lǐng)域,例如開(kāi)發(fā)推理模型方面,其落后于其他領(lǐng)先的人工智能實(shí)驗(yàn)室。從 Mistral 自己的基準(zhǔn)測(cè)試來(lái)看,Magistral 的競(jìng)爭(zhēng)力似乎也不夠突出。在評(píng)估模型物理、數(shù)學(xué)和科學(xué)技能的 GPQA Diamond 和 AIME 測(cè)試中,Magistral Medium 的表現(xiàn)不如 Gemini 2.5 Pro 和 Anthropic 的 Claude Opus 4。此外,在流行的編程基準(zhǔn)測(cè)試 LiveCodeBench 中,Magistral Medium 也未能超越 Gemini 2.5 Pro。

或許正因如此,Mistral 在其博客文章中著重強(qiáng)調(diào)了 Magistral 的其他優(yōu)勢(shì)。Mistral 聲稱,Magistral 在 Le Chat 上的答題速度是競(jìng)爭(zhēng)對(duì)手的 10 倍,并且支持多種語(yǔ)言,包括意大利語(yǔ)、阿拉伯語(yǔ)、俄語(yǔ)和簡(jiǎn)體中文。
該公司在文章中寫道:“基于我們的旗艦?zāi)P,Magistral 專為研究、戰(zhàn)略規(guī)劃、運(yùn)營(yíng)優(yōu)化和數(shù)據(jù)驅(qū)動(dòng)決策而設(shè)計(jì),無(wú)論是執(zhí)行多因素風(fēng)險(xiǎn)評(píng)估和建模,還是在約束條件下計(jì)算最優(yōu)交付窗口,都能勝任。”
Magistral 的發(fā)布是在 Mistral 推出“氛圍編程”客戶端 Mistral Code 之后不久。而在幾周前,Mistral 還發(fā)布了多個(gè)專注于編程的模型,并推出了 Le Chat Enterprise,這是一款面向企業(yè)的聊天服務(wù),提供人工智能代理構(gòu)建器等工具,并將 Mistral 的模型與 Gmail 和 SharePoint 等第三方服務(wù)集成。