首頁|必讀|視頻|專訪|運(yùn)營|制造|監(jiān)管|芯片|物聯(lián)網(wǎng)|量子|低空經(jīng)濟(jì)|智能汽車|特約記者
手機(jī)|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計(jì)算|大數(shù)據(jù)|報(bào)告|智慧城市|移動(dòng)互聯(lián)網(wǎng)|會展
首頁 >> 移動(dòng)互聯(lián)網(wǎng) >> 正文

華為小藝AI競賽Agent首戰(zhàn)國際數(shù)學(xué)奧林匹克大賽(IMO)榮獲佳績!

2025年7月30日 21:45  CCTIME飛象網(wǎng)  

在2025年國際數(shù)學(xué)奧林匹克競賽(IMO)官方的特別邀請下,小藝AI競賽Agent亮相本屆全球頂尖的數(shù)學(xué)賽事。經(jīng)過三天的激烈角逐,小藝AI競賽Agent成功攻克6道難題中的5道,以34分的優(yōu)異成績摘得銀牌,距離金牌分?jǐn)?shù)線(35分)僅1分之差。這一歷史性的突破,標(biāo)志著華為AI的邏輯推理能力達(dá)到了一個(gè)新的高度。

IMO主席Gregor Dolinar教授對華為AI的表現(xiàn)給予了高度評價(jià):“華為AI提交的答卷獲得了34分(滿分42分),這是一個(gè)了不起的成就。(The Huawei AI scripts received a grade of 34 out of 42, which is a remarkable result.)”

不止于答題:小藝AI競賽Agent展現(xiàn)專家級解題藝術(shù)

與傳統(tǒng)模型追求解題套路不同,小藝AI競賽Agent在解題過程中展現(xiàn)了接近頂尖解題方式的創(chuàng)造力和嚴(yán)密性:

專家級推理能力:小藝AI競賽Agent完美攻克第1至第4題,均獲滿分(7分)。其論證過程嚴(yán)謹(jǐn)、邏輯自洽、可讀性強(qiáng),此外在第3題中還靈活運(yùn)用了“升冪定理”等技巧,展現(xiàn)了深厚的數(shù)學(xué)知識儲備。值得說明的是第5題,評審組確認(rèn),盡管Agent因?qū)ζ骄智闆r的表述存在細(xì)微瑕疵被扣1分,但其核心思維過程已完整包含了對該情況的嚴(yán)謹(jǐn)證明。這表明,它實(shí)際上已具備了解答該題所需的全部數(shù)學(xué)能力。

閃耀的解題靈感在第2題的證明中,小藝AI競賽Agent精準(zhǔn)預(yù)測并添加了唯一一個(gè)輔助點(diǎn),便完成了整個(gè)復(fù)雜證明的生成。其解法之高效、思路之凝練,顯著優(yōu)于已知的公開解法。

接近完美的思考深度:第1題的解答思路流程完整,清晰簡潔,對于n=3的情況討論充分,歸納過程嚴(yán)謹(jǐn);同時(shí)在第4題的解答中對所有情況討論完備,證明的結(jié)構(gòu)層級分明,易于理解。

> 對IMO 2025競賽感興趣的開發(fā)者,可以去Github:https://github.com/Huawei-xiaoyi/IMO2025-solutions和Gitee :https://gitee.com/huawei-xiaoyi/imo2025-solutions了解下賽題解答過程。

技術(shù)揭秘:驅(qū)動(dòng)巔峰表現(xiàn)的“雙腦”協(xié)同架構(gòu)

小藝AI競賽Agent的卓越表現(xiàn),源于其創(chuàng)新的“自然語言大模型 + 形式化證明”協(xié)同架構(gòu)。這套系統(tǒng)如同一個(gè)擁有“左右腦”的數(shù)字大腦,將人類的直覺創(chuàng)造與機(jī)

器的嚴(yán)謹(jǐn)驗(yàn)證無縫融合。

1、思維風(fēng)暴與“AI同行評審”:孕育創(chuàng)造性解法

面對難題,小藝AI競賽Agent首先通過并行采樣生成海量、多樣化的解題思路,如同進(jìn)行一場“思維風(fēng)暴”。隨后,啟動(dòng)獨(dú)特的“AI同行評審”機(jī)制,讓不同的AI模型互相審閱、辯論、評分,從而篩選出最優(yōu)的思路路徑。這一過程還會融合形式化證明的反饋,指導(dǎo)AI模型進(jìn)行多輪自我修復(fù)與迭代優(yōu)化,極大提升了模型攻克精英級難題的創(chuàng)造力。

2、迭代式多層級證明:構(gòu)建嚴(yán)密的邏輯閉環(huán)

為克服高復(fù)雜度數(shù)學(xué)證明嚴(yán)謹(jǐn)性的挑戰(zhàn),華為小藝團(tuán)隊(duì)設(shè)計(jì)了迭代式多層級并行證明系統(tǒng)。該系統(tǒng)首先將復(fù)雜的證明目標(biāo)分解為樹狀的多層級子問題,然后由形式化證明模型自下而上地對每個(gè)子節(jié)點(diǎn)進(jìn)行大規(guī)模并行驗(yàn)證。一旦某個(gè)環(huán)節(jié)證明失敗,具備反思和自我修正能力的模型將立刻啟動(dòng)修復(fù)流程,直至整個(gè)邏輯鏈條完美閉環(huán)。

里程碑與新起點(diǎn):共探AI與教育的未來

此次賽事的成果,不僅是華為AI發(fā)展的重要里程碑,更充分地證明了基于大語言模型(LLM)的多Agent協(xié)同系統(tǒng)在解決高階數(shù)學(xué)問題上的強(qiáng)大潛力。

與此同時(shí)華為小藝團(tuán)隊(duì)也意識到,當(dāng)前系統(tǒng)在面對極高復(fù)雜度的數(shù)學(xué)問題時(shí)(如本屆IMO第6題)仍有局限,未來將會繼續(xù)提升小藝的抽象推理與問題建模能力,持續(xù)向高階數(shù)學(xué)推理探索。

據(jù)悉,小藝AI競賽Agent的核心能力,未來將逐步賦能于小藝教育Agent。華為小藝團(tuán)隊(duì)或?qū)⒁园酌麊螜C(jī)制,優(yōu)先向數(shù)學(xué)及AI領(lǐng)域的專業(yè)研究者開放,旨在共同推動(dòng)智能解題方法論的創(chuàng)新,讓頂級的思維能力普惠每一位學(xué)習(xí)者。

編 輯:T01
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載,請必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問題,請?jiān)谙嚓P(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時(shí)間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。
推薦新聞              
 
人物
中興通訊總裁徐子陽:智聯(lián)共生 數(shù)實(shí)融合
精彩視頻
2025WAIC|探館中國電信展臺 AI全景圖 滿滿“科技范兒”
中國電信總經(jīng)理劉桂清:星辰智惠,共治共享,賦能產(chǎn)業(yè)變革新未來
中國電信柯瑞文:打造全方位人工智能動(dòng)態(tài)防護(hù)體系,構(gòu)建共創(chuàng)、共治、共享的產(chǎn)業(yè)生態(tài)
2025世界人工智能大會:才藝比拼、技能比武!機(jī)器人“大顯身手”
精彩專題
2025世界人工智能大會暨人工智能全球治理高級別會議
2025中國聯(lián)通合作伙伴大會
2025 MWC 上海
2025工業(yè)互聯(lián)網(wǎng)大會
關(guān)于我們 | 廣告報(bào)價(jià) | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號
公司名稱: 北京飛象互動(dòng)文化傳媒有限公司
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像