DoNews10月13日消息,據(jù)IT之家援引倫敦《金融時報》報道,埃隆?馬斯克旗下 xAI 公司正加緊構(gòu)建其“世界模型”,與 Meta 和谷歌等對手一同角逐下一代 AI 系統(tǒng)。這些系統(tǒng)能夠?qū)崿F(xiàn)對物理環(huán)境的自主導(dǎo)航與設(shè)計。
世界模型是一種生成式 AI 模型,能夠理解現(xiàn)實世界的動態(tài)特征,包括物理屬性和空間特性。這類模型利用文字、圖像、視頻以及動作在內(nèi)的輸入數(shù)據(jù)來生成影片。
據(jù)稱,xAI 已經(jīng)從英偉達(dá)挖來了專家,研發(fā)這類新一代 AI 模型。這些模型通過學(xué)習(xí)視頻以及來自機(jī)器人的數(shù)據(jù),理解現(xiàn)實世界。世界模型有望將 AI 的能力提升到超越大語言模型的水平。目前,大模型主要接受文本訓(xùn)練,是 ChatGPT 以及 xAI 自家 Grok 等熱門 AI 工具的技術(shù)基礎(chǔ)。
兩位知情人士稱,該公司正在研發(fā)世界模型,計劃將其應(yīng)用于游戲領(lǐng)域,用于生成可交互的 3D 環(huán)境。其中一位知情人士補(bǔ)充說,這類模型未來也可能應(yīng)用于機(jī)器人 AI 系統(tǒng)。
xAI 已從英偉達(dá)聘請了兩位具備世界模型研發(fā)經(jīng)驗的 AI 研究員:澤尚?帕特爾 (Zeeshan Patel) 與何宜暉。憑借能夠創(chuàng)建并運行模擬環(huán)境的 Omniverse 平臺,英偉達(dá)始終在該技術(shù)領(lǐng)域保持領(lǐng)先地位。
一些科技公司對世界模型寄予厚望,認(rèn)為它或許能將 AI 應(yīng)用從軟件和計算機(jī)拓展到實體產(chǎn)品,例如人形機(jī)器人。上個月,英偉達(dá)對《金融時報》表示,世界模型的潛在市場規(guī)??赡芙咏?dāng)前全球經(jīng)濟(jì)總量。
馬斯克在 X 上發(fā)帖稱,xAI 計劃在明年年底前推出“一款由 AI 生成的優(yōu)秀游戲”,重申了他在去年設(shè)定的目標(biāo)。
周二,xAI 推出了最新的圖像和視頻生成模型,并表示該模型進(jìn)行了“重大升級”,并且免費向用戶開放使用。
當(dāng)前,OpenAI 旗下 Sora 等視頻生成模型,主要通過從訓(xùn)練數(shù)據(jù)中學(xué)習(xí)到的模式進(jìn)行預(yù)測,從而逐幀生成視頻圖像。但是世界模型則會向前邁進(jìn)一大步,因為它能實時理解物理世界的因果關(guān)系,掌握物體在不同環(huán)境中的實時互動機(jī)制。
然而,世界模型仍面臨巨大的技術(shù)挑戰(zhàn)。要找到足夠的數(shù)據(jù)來模擬現(xiàn)實世界并訓(xùn)練這些模型,已被證明既困難又成本昂貴。
《博德之門 3》開發(fā)商拉瑞安工作室的發(fā)行主管邁克爾?道斯 (Michael Douse) 本周在 X 上直言,AI 無法解決游戲行業(yè)面臨的“重大問題”,即“領(lǐng)導(dǎo)力與遠(yuǎn)見的缺失”。
他補(bǔ)充說,游戲行業(yè)并不需要“更多由算法生成、經(jīng)心理學(xué)訓(xùn)練的玩法循環(huán),而是需要更多能夠讓玩家投入或愿意投入其中的世界呈現(xiàn)方式”。
截至發(fā)稿,xAI 及帕特爾、何宜暉尚未就此置評。