新聞資訊 NEWS
“今天,AI第一次不靠人類(lèi)點(diǎn)擊,就獨立完成了一首Rap并同步生成MV?!?月26日下午,上海世博中心主論壇,階躍星辰CEO姜大昕按下啟動(dòng)鍵后,Agent在40秒內寫(xiě)完歌詞、匹配鼓點(diǎn)并推送至大屏。臺下掌聲響起,不是因為歌詞押韻,而是因為這意味著(zhù)大模型從“對話(huà)”躍遷到“執行”——2025世界人工智能大會(huì )(WAIC 2025)用一整天的議程,把“Agent”確立為年度關(guān)鍵詞。
如果把2023年的大模型比作會(huì )說(shuō)話(huà)的百科全書(shū),2025年的Agent就是拿著(zhù)工具箱、能進(jìn)辦公室的“超級員工”。在階躍星辰的展臺,終端Agent接入Mac Studio,調用本地GPU云主機(8×A100 80G顯存,峰值算力5 PFLOPS)實(shí)時(shí)推理,把用戶(hù)哼出的三小節旋律擴展成完整編曲;MiniMax則在隔壁展廳演示“全棧通用智能體”,對著(zhù)一段“幫我做一款記賬App”的自然語(yǔ)言需求,Agent自動(dòng)完成需求拆解、代碼生成、單元測試、Docker鏡像打包,全程耗時(shí)11分27秒——這背后是一套“思維鏈-行動(dòng)鏈”雙循環(huán)架構:大模型先輸出任務(wù)圖(planning),再調用沙箱里的代碼解釋器、瀏覽器、數據庫工具依次執行(acting),失敗即回溯重試,直至通過(guò)CI/CD流水線(xiàn)。MiniMax技術(shù)副總裁曾國洋在媒體群訪(fǎng)中解釋?zhuān)骸拔覀儼压ぞ叩腁PI schema當作'外語(yǔ)'教給模型,讓它學(xué)會(huì )像程序員一樣閱讀文檔、寫(xiě)調用?!?/span>
行業(yè)級Agent的落地更早也更重。螞蟻數科聯(lián)合意言科技首發(fā)的“金融合規Agent”已在三家股份行試運行:讀取新監管條文后,Agent在2小時(shí)內遍歷銀行全部存量產(chǎn)品合約,標出143處潛在違規條款并給出修訂模板,準確率達96.4%(來(lái)源:螞蟻數科《2025Q2金融A(yíng)gent評估報告》,2025-07-15)。工業(yè)場(chǎng)景里,某頭部汽車(chē)廠(chǎng)把產(chǎn)線(xiàn)質(zhì)檢Agent部署在邊緣GPU云主機(NVIDIA L40 48G顯存×4),Agent通過(guò)視覺(jué)-語(yǔ)言模型實(shí)時(shí)解析工人語(yǔ)音指令“檢查車(chē)門(mén)縫隙”,自動(dòng)調取3D相機點(diǎn)云,將誤差大于0.2毫米的部件打上紅框,單件檢測時(shí)間從45秒壓縮到3秒。
算力是Agent“自主”的前提。WAIC發(fā)布的《中國AI算力發(fā)展指數》顯示,2025年上半年國內GPU云主機租賃量同比增長(cháng)312%,其中65%用于A(yíng)gent推理與微調(國家信息中心&IDC,2025-07)。階躍星辰工程負責人透露,其音樂(lè )Agent單次創(chuàng )作需并行跑通歌詞、旋律、混音三條擴散模型,顯存峰值占用74 GB,“如果按一年前的H800卡,用戶(hù)得等三分鐘;現在A(yíng)100×8的云集群把延遲壓到12秒,體驗才像'實(shí)時(shí)'?!?/span>
技術(shù)原理上,Agent的核心是“大模型+工具調用+記憶系統”。MiniMax在模型側引入“混合專(zhuān)家-工具路由”機制:每一層Transformer中插入輕量級門(mén)控網(wǎng)絡(luò ),決定當前token是否需要調用外部工具,從而把工具API的調用延遲從230 ms降到41 ms。記憶系統則借鑒了操作系統分頁(yè)思想,把長(cháng)期記憶(用戶(hù)歷史、行業(yè)知識)分頁(yè)存儲在分布式KV數據庫,短期記憶(當前任務(wù)上下文)留在GPU顯存,換頁(yè)由模型自主觸發(fā),避免顯存溢出。姜大昕比喻:“Agent的內存管理就像程序員手動(dòng)開(kāi)換,只是現在由模型自己決定何時(shí)換入換出?!?/span>
走出世博中心,夜幕下的上海依舊車(chē)流如織。只是此刻,一部分紅綠燈的配時(shí)決策已由交通Agent接管;而在看不見(jiàn)的云端,更多Agent正排隊領(lǐng)取下一塊GPU——它們不再等待人類(lèi)提問(wèn),而是在尋找下一個(gè)需要被解決的問(wèn)題。