階躍星辰CEO姜大昕:通用人工智能正加速走來(lái)
在2月21日舉辦的生態(tài)開(kāi)放日上,階躍星辰創(chuàng)始人兼CEO姜大昕發(fā)表演講,分享了他對(duì)通用人工智能(AGI)發(fā)展的見(jiàn)解。階躍星辰這家成立僅兩年的大模型公司,由微軟前高管姜大昕創(chuàng)立,并獲得了包括上海國(guó)資、騰訊在內(nèi)的多家知名投資機(jī)構(gòu)的支持。
姜大昕回顧道,十年前,AGI還只是一個(gè)遙不可及的夢(mèng)想。但如今,隨著大模型的飛速進(jìn)步,越來(lái)越多的人開(kāi)始相信,AGI的實(shí)現(xiàn)已為期不遠(yuǎn)。階躍星辰自成立之初,就制定了實(shí)現(xiàn)AGI的明確路線圖,該路線圖分為模擬世界、探索世界和歸納世界三個(gè)階段。
在模擬世界階段,階躍星辰主要通過(guò)模仿學(xué)習(xí)來(lái)訓(xùn)練模型,目標(biāo)是掌握各種模態(tài)的表征。姜大昕指出,下一步是培養(yǎng)模型解決復(fù)雜問(wèn)題的能力。他提到,人腦解決復(fù)雜問(wèn)題時(shí),會(huì)啟動(dòng)系統(tǒng)2的模式,通過(guò)問(wèn)題拆解不斷探索。為了讓模型也能學(xué)會(huì)這種探索過(guò)程,階躍采用了強(qiáng)化學(xué)習(xí)的方法,正如AlphaGo和最近大火的DeepSeek所采用的。
,姜大昕認(rèn)為強(qiáng)化學(xué)習(xí)并非AI的終點(diǎn)。AI的下一個(gè)重大突破將是機(jī)器能夠自主學(xué)習(xí),主動(dòng)發(fā)現(xiàn)物理規(guī)律。他贊賞DeepSeek開(kāi)源其模型,為AI社區(qū)做出了巨大貢獻(xiàn),并表示階躍星辰也受到了啟發(fā),近期發(fā)布了兩款開(kāi)源的多模態(tài)大模型——一款是300億參數(shù)的文生視頻模型,另一款是1300億參數(shù)的語(yǔ)音模型Step Audio。姜大昕希望通過(guò)這兩款模型的開(kāi)源,推動(dòng)開(kāi)發(fā)者創(chuàng)造出更多樣化的應(yīng)用。
姜大昕還透露,階躍星辰正在研發(fā)推理模型Open-Reasoner-Zero,其效率相比DeepSeek-R1-Zero可達(dá)25倍。他表示,將開(kāi)源實(shí)驗(yàn)結(jié)果、代碼數(shù)據(jù)及論文,以推動(dòng)AI領(lǐng)域的進(jìn)一步發(fā)展。
在視覺(jué)推理模型方面,姜大昕認(rèn)為,與文本一樣,視覺(jué)在遇到復(fù)雜問(wèn)題時(shí),也需要慢思考和思維鏈的能力。他指出,如何將強(qiáng)化學(xué)習(xí)的方法引入視覺(jué)領(lǐng)域,實(shí)現(xiàn)慢思考,是當(dāng)前的前沿問(wèn)題。