新華社倫敦7月22日電 谷歌旗下“深層思維”公司21日宣布,其搭載了“深度思考”能力的高級版“雙子座(Gemini)”人工智能模型測試得分達(dá)到國際數(shù)學(xué)奧林匹克競賽(IMO)金牌水平,該成績已獲官方認(rèn)證。
“深層思維”公司在官網(wǎng)發(fā)布公報說,高級版“雙子座”模型的“深度思考”模式成功解答了2025年國際數(shù)學(xué)奧林匹克競賽6道題目中的5道,共獲35分,達(dá)到金牌水平。相關(guān)解題方案已在網(wǎng)上公布。
“我們可以證實,谷歌‘深層思維’已達(dá)成這一備受期待的里程碑,在總分42分中獲得35分——這已達(dá)到(今年)金牌分?jǐn)?shù)線?!眹H數(shù)學(xué)奧林匹克競賽主席格雷戈爾·多利納爾教授說。他稱解題方案在諸多方面都“令人驚嘆”。國際數(shù)學(xué)奧林匹克競賽評分員認(rèn)為這些方案清晰、精確,且大多數(shù)都易于理解。
國際數(shù)學(xué)奧林匹克競賽自1959年起每年舉辦一屆,參賽選手需在兩天(每天各4.5小時)內(nèi)解答涉及代數(shù)、組合數(shù)學(xué)、幾何和數(shù)論四大領(lǐng)域的6道極具難度的題目。近年來,該競賽成為檢驗人工智能模型解決高級數(shù)學(xué)問題能力和推理能力的熱門挑戰(zhàn)。
“深層思維”公司推出的人工智能模型AlphaProof與AlphaGeometry 2組合解答了2024年國際數(shù)學(xué)奧林匹克競賽6道題中的4道,以28分的成績達(dá)到當(dāng)年銀牌水平。為了讓這兩個模型理解題目,專家先將題目從自然語言翻譯成特定計算機(jī)語言,解題總共耗費兩到三天的計算時間。今年,高級版“雙子座”測試成果相比去年有顯著進(jìn)展,它直接根據(jù)自然語言描述的題目給出數(shù)學(xué)證明,并在競賽時限內(nèi)完成挑戰(zhàn)。競賽協(xié)調(diào)員采用與學(xué)生選手解題方案相同的標(biāo)準(zhǔn)對其進(jìn)行正式評分和認(rèn)證。
“深層思維”公司說,今年取得的成果得益于高級版“雙子座”的“深層思考”模式——這是一種針對復(fù)雜問題的增強(qiáng)推理模式,融合了“并行思維”等最新技術(shù)。這種模式設(shè)置可使模型在給出最終答案之前,同時探索并整合多種可能的解決方案,而非沿著單一、線性思路推進(jìn)。