撰文 | 曹雙濤
編輯 | 楊博丞
題圖 | IC Photo
上線4天銷(xiāo)量超1000萬(wàn)套,全平臺(tái)最高同時(shí)在線人數(shù)超300萬(wàn)人,Steam平臺(tái)27萬(wàn)+評(píng)價(jià),96%好評(píng)。國(guó)產(chǎn)首款3A游戲《黑神話:悟空》的火爆,帶火的不僅只有山西,也有國(guó)產(chǎn)GPU廠商。
《黑神話:悟空》正式發(fā)售之際,摩爾線程發(fā)布的V270.80驅(qū)動(dòng)程序已解決DirectX11模式下運(yùn)行《黑神話:悟空》Benchmark時(shí)的閃退問(wèn)題。大量玩家的關(guān)注,8月25日摩爾線程百度資訊指數(shù)達(dá)到近30天峰值。
圖源:百度指數(shù)
成立于2020年10月的摩爾線程,在國(guó)內(nèi)GPU廠商中屬于相對(duì)低調(diào)的存在。直到2023年10月,美國(guó)商務(wù)部突然將摩爾線程列入貿(mào)易管制“黑名單”,摩爾線程才引發(fā)市場(chǎng)大量關(guān)注。
但創(chuàng)投圈中,摩爾線程卻屬于“高調(diào)”的存在。摩爾線程不僅核心團(tuán)隊(duì)來(lái)自英偉達(dá),且創(chuàng)始人張建中為原英偉達(dá)中國(guó)區(qū)總經(jīng)理、英偉達(dá)全球副總裁。濃厚的英偉達(dá)基因以及近幾年從高層到地方,對(duì)國(guó)產(chǎn)替代政策的大力支持,摩爾線程受到資本高度青睞。
據(jù)悉,摩爾線程成立至今完成的5輪融資中,每輪融資陣容都極其強(qiáng)大,資方涵蓋上下游資本、頭部機(jī)構(gòu)、政府基金、戰(zhàn)略投資等等。
圖源:天眼查
資本助推下,摩爾線程發(fā)展速度較快。圍繞TOC端桌面顯卡,摩爾線程現(xiàn)有產(chǎn)品包括MTT S80、S70、S50、S30、S10。圍繞TOB端AI大模型,摩爾線程產(chǎn)品包括訓(xùn)推一體機(jī)MCCX D800、AI超融合一體機(jī)KUAE FUSION,用于部署服務(wù)器推理、訓(xùn)練。且支持LLaMA、GLM、Aquila、Baichuan、GPT、Bloom、玉言等各類(lèi)主流大模型的開(kāi)源。
換言之,摩爾線程已建立從芯片、板卡、服務(wù)器、集群到軟件的全棧AI智算產(chǎn)品線,市場(chǎng)認(rèn)為摩爾線程是國(guó)內(nèi)僅有能從功能上對(duì)標(biāo)英偉達(dá)的國(guó)產(chǎn)GPU芯片廠商。但持續(xù)補(bǔ)齊軟件生態(tài)、AI大模型技術(shù)迭代速度快帶來(lái)的技術(shù)持續(xù)創(chuàng)新壓力,以及國(guó)內(nèi)GPU市場(chǎng)正進(jìn)入洗牌階段,讓摩爾線程真正成為英偉達(dá)仍需持續(xù)發(fā)力。
一、桌面顯卡銷(xiāo)量有限,生態(tài)體系搭建仍需發(fā)力
“其盛也,始則人畏之。甚則人惡之,極則群起而攻之”。這或許是當(dāng)下英偉達(dá)的真實(shí)寫(xiě)照。
自2024年至今,英偉達(dá)先后引來(lái)歐盟、法國(guó)等多地監(jiān)管機(jī)構(gòu)調(diào)查,要求其提供相關(guān)銷(xiāo)售等數(shù)據(jù)。市場(chǎng)此前曾傳出法國(guó)反壟斷機(jī)構(gòu)對(duì)英偉達(dá)當(dāng)?shù)剞k公室展開(kāi)突襲搜查,扣押部分物件和相關(guān)數(shù)據(jù)。
另?yè)?jù)外媒報(bào)道,英偉達(dá)已收到美國(guó)司法部具有法律意義上的傳票,正式對(duì)英偉達(dá)展開(kāi)調(diào)查。受此影響,英偉達(dá)市值暴跌近2800億美元,創(chuàng)下美股最高紀(jì)錄。按照合同賠償客戶只是小事,英偉達(dá)后續(xù)開(kāi)放諸多技術(shù)才是關(guān)鍵。習(xí)慣高調(diào)強(qiáng)勢(shì)的黃仁勛未來(lái)將如何應(yīng)對(duì),成為全球科技產(chǎn)業(yè)關(guān)注的焦點(diǎn)。
圖源:Yahoo Finance
英偉達(dá)遭到全球多國(guó)調(diào)查,早在供應(yīng)鏈預(yù)料范圍內(nèi)。服務(wù)器供應(yīng)鏈表示,英偉達(dá)在AI GPU市占率高達(dá)九成,唯一同級(jí)對(duì)手就是AMD與Intel,但二者出貨量和英偉達(dá)相比差距甚大。
在全球市場(chǎng)幾乎沒(méi)有對(duì)手的英偉達(dá),不僅掌控者帶下游客戶的定價(jià)權(quán)、供貨排期權(quán)。且上游難以取代的臺(tái)積電以及富士康、廣達(dá)等龐大供應(yīng)鏈同樣缺乏自主權(quán)。
但英偉達(dá)并不滿足于此,一方面,通過(guò)技術(shù)持續(xù)升級(jí)、投資等多重方式,促進(jìn)GPU產(chǎn)品的購(gòu)買(mǎi)和使用,維持其競(jìng)爭(zhēng)優(yōu)勢(shì)。
公開(kāi)數(shù)據(jù)顯示,自2023年至2024年8月底,英偉達(dá)參與投資數(shù)量高達(dá)74筆,涉及金額高達(dá)109億美元。其中包括資料中心設(shè)計(jì)、開(kāi)發(fā)和營(yíng)運(yùn)公司Applied Digital,Google技術(shù)人員在日本創(chuàng)立的Sakana AI等等。
另一方面,黃仁勛并不想讓英偉達(dá)僅充當(dāng)供應(yīng)商角色,正試圖將英偉達(dá)打造成數(shù)據(jù)中心所有關(guān)鍵元素的一站式服務(wù)平臺(tái)——即AI工廠,以增加客戶對(duì)英偉達(dá)產(chǎn)品的依賴。
面對(duì)英偉達(dá)難以撼動(dòng)的地位及芯片短缺問(wèn)題,國(guó)內(nèi)以騰訊、阿里為代表的大廠依托資金和技術(shù),加速推進(jìn)自研AI芯片進(jìn)程。比如騰訊自主研發(fā)的影片編解碼芯片滄海已進(jìn)入量產(chǎn)階段,支持從云端游戲到視訊直播等服務(wù)。部分資金和技術(shù)實(shí)力欠佳的廠商,或選擇租賃或選擇從東南亞購(gòu)入A100和H100系列芯片,后經(jīng)香港流入國(guó)內(nèi)市場(chǎng)。
此外,調(diào)整大模型的訓(xùn)練方式,成為不少?gòu)S商的策略之一。零一萬(wàn)物CEO創(chuàng)辦人李開(kāi)復(fù)提到,因缺乏足夠GPU資源,他們只能開(kāi)發(fā)出更高效的AI基礎(chǔ)設(shè)施和推論引擎。這種低精度訓(xùn)練模式,同樣被應(yīng)用到美國(guó)海外大廠,核心優(yōu)勢(shì)在于加速模型的輸出速度。
海外谷歌、OpenAl、微軟等大廠除加速自研芯片進(jìn)程外,近期微軟、Google與英特爾等眾多大廠攜手成立Ultra Accelerator Link。UALink聯(lián)盟成立的背后,正是想切斷谷歌的生態(tài)護(hù)城河。
圖源:基于公開(kāi)信息整理
服務(wù)器供應(yīng)鏈表示,英偉達(dá)的護(hù)城河絕非只是多年累積的強(qiáng)大GPU技術(shù)和投入10多年研發(fā)的平行運(yùn)算架構(gòu)CUDA。2014年推出的NVLink以及NVSwitch交換器芯片等,讓英偉達(dá)的GPU技術(shù)與生態(tài)系統(tǒng)更為強(qiáng)大與完整。CUDA為封閉生態(tài)系,只能在英偉達(dá)自家GPU上運(yùn)行。 NVLink同樣為英偉達(dá)獨(dú)家研發(fā),競(jìng)爭(zhēng)者只能采用現(xiàn)有PCIe等其他互連協(xié)定。
目前國(guó)內(nèi)GPU產(chǎn)業(yè)面臨核心且突出問(wèn)題為缺乏類(lèi)似英偉達(dá)CUDA的軟件生態(tài)體系,雖說(shuō)摩爾線程構(gòu)建MUSA生態(tài)來(lái)兼容 CUDA,但京東平臺(tái)不少已購(gòu)MTT S80用戶稱,MTT S80因存在軟件兼容問(wèn)題、卡頓問(wèn)題,可能并不適合新生小白使用。
圖源:京東
不少游戲玩家測(cè)評(píng)后發(fā)現(xiàn),MTT S80實(shí)際表現(xiàn)與英偉達(dá)等一線大廠的顯卡之間還有很大的差距。以黑神話測(cè)試工具的標(biāo)準(zhǔn)來(lái)看,MTT S80大致處于勉強(qiáng)能玩的樣子?!逗谏裨挘何蚩铡烽_(kāi)服后,不少玩家也都反應(yīng)打開(kāi)游戲后出現(xiàn)黑屏、閃退的情況。
游戲玩家李陽(yáng)(化名)告訴DoNews,在摩爾線程V270.80驅(qū)動(dòng)版本以及1280*720p分辨率,《黑神話:悟空》的最高分辨率僅有20多幀,真正進(jìn)入游戲后無(wú)法暢玩。
圖源:受訪者提供
桌面顯卡仍需提高的競(jìng)爭(zhēng)力,直接影響到其桌面級(jí)顯卡銷(xiāo)量增長(zhǎng)。京東官方旗艦店MTTS80評(píng)論量?jī)H有2000+,其他顯卡產(chǎn)品評(píng)論量更是不足2000+,這側(cè)面說(shuō)明摩爾線程桌面級(jí)顯卡出貨量欠佳。
另外,對(duì)標(biāo)華為鴻蒙生態(tài)來(lái)看,從和APP廠商前期溝通到中期APP廠商排期、開(kāi)發(fā)、測(cè)試,到最終完全上線,整個(gè)內(nèi)容生態(tài)搭建不僅耗時(shí)較長(zhǎng)且需廠商以龐大的銷(xiāo)售團(tuán)隊(duì)和技術(shù)團(tuán)隊(duì)為支撐。
圖源:京東
不僅僅是軟件生態(tài),芯片互聯(lián)同樣是一大問(wèn)題。聯(lián)發(fā)科CEO蔡力直言,從整個(gè)系統(tǒng)角度來(lái)看,芯片之間的互聯(lián)技術(shù)是除運(yùn)算部分之外發(fā)展的最大瓶頸。換言之,如何持續(xù)攻克軟硬件問(wèn)題,或許是摩爾線程這家相對(duì)年輕的GPU企業(yè)需長(zhǎng)期解決的問(wèn)題。
二、大模型技術(shù)持續(xù)升級(jí),面臨持續(xù)創(chuàng)新壓力
為“圍剿”英偉達(dá),國(guó)內(nèi)廠商逐漸分化兩條現(xiàn)實(shí)路徑,一是以燧原、天數(shù)智芯等為代表的多數(shù)廠商,為避免和英偉達(dá)競(jìng)爭(zhēng),從對(duì)硬件、軟件要求都不高的推理場(chǎng)景抓起。
另一條為摩爾線程、華為為代表的少數(shù)廠商,選擇從千卡向萬(wàn)卡進(jìn)發(fā),著重訓(xùn)練場(chǎng)景,直接硬剛英偉達(dá)。
如摩爾線程的夸娥(KUAE)智算集群解決方案基于大模型智算加速卡MTT S4000,從千卡可擴(kuò)展至萬(wàn)卡集群,以打造大模型和通用人工智能的先進(jìn)算力基礎(chǔ)設(shè)施。
摩爾線程創(chuàng)始人兼CEO張建中表示,夸娥萬(wàn)卡智算集群作為摩爾線程全棧AI戰(zhàn)略的一塊重要拼圖,可為各行各業(yè)數(shù)智化轉(zhuǎn)型提供澎湃算力。
廠商的理想或許很美好,但現(xiàn)實(shí)卻是國(guó)產(chǎn)AI芯片落地過(guò)程難免出現(xiàn)各種問(wèn)題。華為推出的升騰Ascend系列AI芯片客戶包括訊飛、百度、騰訊等互聯(lián)網(wǎng)大廠。但援引英國(guó)《金融時(shí)報(bào)》報(bào)道,在AI模型訓(xùn)練方面,Ascend和英偉達(dá)芯片仍存在差距,先后出現(xiàn)穩(wěn)定性問(wèn)題、芯片之間連接問(wèn)題、華為CANN平臺(tái)錯(cuò)誤頻傳問(wèn)題等等。百度使用華為芯片時(shí)常出現(xiàn)崩潰,進(jìn)而影響AI項(xiàng)目的開(kāi)發(fā)工作。
為解決問(wèn)題,華為直接派出工程師到現(xiàn)場(chǎng)處理客戶問(wèn)題,百度、科大訊飛和騰訊均有華為團(tuán)隊(duì)支持。華為Ascend系列芯片在給摩爾線程敲響警鐘的同時(shí),相較于家大業(yè)大的華為來(lái)說(shuō),摩爾線程在資金、人員配置等方面稍有不足。若采取和華為常用的“堆人頭”定制化服務(wù)方式,對(duì)其綜合成本、現(xiàn)金流和盈利也提出高挑戰(zhàn)。
除上述問(wèn)題外,當(dāng)前全球GPU廠商所面臨的難題為AI大模型技術(shù)迭代速度過(guò)快和芯片長(zhǎng)開(kāi)發(fā)周期的矛盾,這對(duì)摩爾線程的持續(xù)創(chuàng)新能力、市場(chǎng)洞察能力均提出極高要求。
今年以來(lái)半導(dǎo)體產(chǎn)業(yè)重點(diǎn)關(guān)注高帶寬存儲(chǔ)器以及高速傳輸技術(shù)兩大方向,這點(diǎn)不管從三星、SK海力士、美光快速調(diào)配產(chǎn)能,加速量產(chǎn)HBM來(lái)滿足市場(chǎng)需求,還是運(yùn)算芯片大廠陸續(xù)投入通信與傳輸技術(shù)開(kāi)發(fā),如英偉達(dá)的NVLink、英特爾主導(dǎo)的UALink,博通及Marvell都全力投入各層次高速傳輸技術(shù)開(kāi)發(fā),聯(lián)發(fā)科和神盾集團(tuán)通過(guò)SerDes和UCIE相關(guān)IP技術(shù)切入市場(chǎng)均能側(cè)面證實(shí)。
但GPU中行業(yè)IP核占用的面積超過(guò)80%。但I(xiàn)P的研發(fā)并不輕松,GPU IP自研需要36—48個(gè)月以及200個(gè)工程師。采用外購(gòu)IP雖能將開(kāi)發(fā)周期縮短12—18個(gè)月。且高端芯片前端和后續(xù)設(shè)計(jì)1—3年,流片環(huán)節(jié)需3—6個(gè)月。若流片失敗,只能繼續(xù)上演該過(guò)程。且即使流片成功,還需經(jīng)過(guò)3—12個(gè)月產(chǎn)品測(cè)試優(yōu)化,才能開(kāi)啟量產(chǎn)。
這就意味著GPU廠商提出的AI芯片設(shè)計(jì)理念在當(dāng)時(shí)或許很新穎,但若是被制成成品時(shí),很有可能無(wú)法跟上市場(chǎng)需求和業(yè)界技術(shù)進(jìn)展,最終被市場(chǎng)所淘汰。
換言之,AI大模型時(shí)代下GPU廠商面臨壓力遠(yuǎn)比此前更大,想要生存更加不易。張建中也曾指出,摩爾線程目標(biāo)為至少先存活10年。
三、國(guó)產(chǎn)GPU洗牌加劇,摩爾線程迎大考
不僅僅是摩爾線程想要“活下來(lái)”,國(guó)內(nèi)很多投資人也不斷告訴自己的被投項(xiàng)目需要“先活下來(lái)”。
近兩年,國(guó)內(nèi)GPU廠商從一度當(dāng)紅的芯片領(lǐng)域,但在地緣政治帶來(lái)的不確定以及經(jīng)營(yíng)管理團(tuán)隊(duì)融資欠缺等多因素共同影響下,行業(yè)急轉(zhuǎn)直下。
燒光融資的GPU廠商,或裁員或解散。進(jìn)而到2024年,這種情況不僅未能迎來(lái)改善,反而仍在繼續(xù)惡化,國(guó)產(chǎn)GPU行業(yè)正迎來(lái)洗牌整合期。雖說(shuō)燧原6年完成10次融資,累計(jì)融資金額高達(dá)70億元,目前正啟動(dòng)A股IPO進(jìn)程。但并非所有GPU廠商都有燧原這么“幸運(yùn)”累計(jì)獲約25億元融資,估值約150億元,且為重慶當(dāng)?shù)谹I獨(dú)角獸的象帝先因和資本對(duì)賭失敗,反遭投資者反撲。業(yè)務(wù)關(guān)停、大規(guī)模裁員、創(chuàng)始人從“吸金人”變成失信人。
圖源:象帝先官方
南京礪算子公司礪算上海,近期雖獲得東芯與其他投資者投資2億元、1.28億元,暫時(shí)解除資金鏈斷裂危機(jī),但GPU的重資金屬性意味其后續(xù)可能還需尋求大量外部資金續(xù)命。大量GPU公司的倒閉讓投資人血虧,對(duì)GPU項(xiàng)目愈發(fā)謹(jǐn)慎背景下。全球科技市場(chǎng)的持續(xù)生變,讓該問(wèn)題更加雪上加霜。
宏碁董事長(zhǎng)暨執(zhí)行長(zhǎng)陳俊圣指出,全球科技產(chǎn)業(yè)正上演恐怖電影。廠商或建立算力中心或建立資料中心,雖說(shuō)發(fā)展路徑不同,但均需要服務(wù)器、存儲(chǔ)器、海量數(shù)據(jù)。投入這么多成本,又要多少?gòu)S商挖到金礦?微軟通過(guò)Copilot雖有所受益,但其又是否會(huì)愿意投入下去呢?或許當(dāng)前廠商仍關(guān)注AI硬件、算力等等,但核心仍是商業(yè)模式得以延續(xù)。
陳俊圣的擔(dān)憂正是當(dāng)前全球科技產(chǎn)業(yè)的真實(shí)寫(xiě)照,這輪全球AI大模型浪潮,短期內(nèi)除英偉達(dá)外,真正利潤(rùn)大幅度增長(zhǎng)的廠商有限。在AI大模型上游,AI大模型的爆發(fā)讓國(guó)產(chǎn)服務(wù)器一哥、號(hào)稱算力龍頭的浪潮信息2024年上半年業(yè)績(jī)大增、轉(zhuǎn)虧為盈,業(yè)績(jī)創(chuàng)下歷史新高。
圖源:浪潮信息財(cái)報(bào)
但浪潮信息業(yè)績(jī)大幅度改善的背后,頗有以價(jià)換量意味。2024年上半年7.74%的毛利率創(chuàng)下浪潮信息近幾年最低毛利率,浪潮信息方面稱,毛利率下跌主要受客戶結(jié)構(gòu)、產(chǎn)品結(jié)構(gòu)、原材料供應(yīng)、市場(chǎng)競(jìng)爭(zhēng)等多方面的綜合影響。換言之,若后續(xù)GPU廠商競(jìng)爭(zhēng)激烈,是否同樣會(huì)采取以價(jià)換量策略呢?
圖源:浪潮信息財(cái)報(bào)
對(duì)大模型廠商來(lái)說(shuō),Open AI仍處在虧損中。援引The Informantion報(bào)道,Open AI的營(yíng)收雖從2023年底的16億美元快速上漲到今年上半年的34億美元。但《紐約時(shí)報(bào)》預(yù)測(cè),Open AI的技術(shù)投入或超過(guò)70億美元,為其收入的2倍以上。目前Open AI正調(diào)整組織架構(gòu),募集新一輪資本。
但Open AI的34億美元收入建立在周活躍用戶2億,每月收費(fèi)20美元的基礎(chǔ)。國(guó)內(nèi)又有多少大模型廠商,能做到GPT的用戶規(guī)模且讓用戶愿意持續(xù)付費(fèi)呢?當(dāng)大模型廠商長(zhǎng)期處在虧損中,并不斷調(diào)整算法模型降低對(duì)AI芯片的需求,GPU廠商又會(huì)面臨何種問(wèn)題呢?
此外,目前本土GPU芯片跟英偉達(dá)的產(chǎn)品相比,仍存在不小差距。從芯片設(shè)計(jì)上來(lái)看,跟英偉達(dá)的差距為12—18個(gè)月。在芯片制造制程上,英偉達(dá)已采用3納米制程,國(guó)內(nèi)目前止步于5-7納米,這讓本就處在融資難、退出難的資本市場(chǎng)不得不更加謹(jǐn)慎。
隨著客戶結(jié)構(gòu)和AI大模型市場(chǎng)的改變,摩爾線程又要如何應(yīng)對(duì)未來(lái)可能出現(xiàn)的資金流問(wèn)題,持續(xù)補(bǔ)充業(yè)務(wù)所需大量資金呢?
或許摩爾線程所經(jīng)歷的這些問(wèn)題,正是當(dāng)前國(guó)內(nèi)眾多GPU廠商的現(xiàn)狀。正如張建中所言,摩爾線程希望做的事情是解決最難做的事情,幫助國(guó)家、幫助行業(yè)解決缺少大算力的問(wèn)題。
在國(guó)產(chǎn)替代這條路上,或許摩爾線程仍有諸多難題需要一一解決。但正是眾多摩爾線程廠商的出現(xiàn),國(guó)內(nèi)和海外的差距才有望逐漸縮小,并可能實(shí)現(xiàn)反超。