在线免费av网址|国产第一浮力久久|日本有码中文字幕|国产观看视频免费|亚洲熟女一二三区|久草视频免费网站|丰满熟女在线综合|久久久久久久久肛|草草影院浮力视频|亚洲色图激情国产

數(shù)字人直播迎來GPT4時(shí)刻,一家杭州創(chuàng)業(yè)公司殺出來了

?

如何突破行業(yè)卡點(diǎn),跑通技術(shù)產(chǎn)品和場景驗(yàn)證閉環(huán)?

文|徐鑫

編|任曉漁

如火如荼的生成式AI浪潮正走向應(yīng)用爆發(fā)前夜,不過應(yīng)用規(guī)?;涞兀恢泵媾R兩大鴻溝——落地成本和價(jià)值驗(yàn)證。

現(xiàn)在,數(shù)字人直播領(lǐng)域有望率先實(shí)現(xiàn)跨越,迎來拐點(diǎn)。

過去一年,AI技術(shù)進(jìn)步使得數(shù)字人成本進(jìn)一步降低,落地成本從今年年初開始已不再是卡點(diǎn),行業(yè)正加速逼近盈利線。最近,數(shù)字人直播規(guī)?;瘧?yīng)用另一道枷鎖也在被砸碎——

特看科技發(fā)布第四代直播數(shù)字人,在新一代大語言模型和多模態(tài)模型技術(shù)支持下,數(shù)字人直播效果正從真人的70%水平逼近90%。

“它說‘沖’的的時(shí)候,語氣、聲音、手部的動(dòng)作配合非常自然,已經(jīng)跟真人表現(xiàn)沒什么區(qū)別。一切全由AI生成,不再是對口型的數(shù)字人,數(shù)字人直播的GPT-4時(shí)刻已經(jīng)到來?!碧乜纯萍糃EO樂乘(原阿里花名,本名吳春松)判斷,數(shù)字人直播將加速從小眾嘗鮮快速走向大眾應(yīng)用階段。

對于直播行業(yè),這是一場大變局。數(shù)字人直播的應(yīng)用場景和行業(yè)滲透率都將迎來變化,更長期看它可能也會(huì)影響直播行業(yè)里流量分配機(jī)制。

與此同時(shí),外界也好奇,成立三年的AI應(yīng)用公司特看科技到底什么來路,為何能率先突破行業(yè)卡點(diǎn),跑通技術(shù)產(chǎn)品和場景驗(yàn)證閉環(huán)?

01

規(guī)模化落地時(shí)刻

你肯定見過直播間里的數(shù)字人。

大多數(shù)人對這些直播數(shù)字人的印象還停留在能介紹產(chǎn)品信息,但細(xì)看總有點(diǎn)不自然的階段。比如口播的內(nèi)容非常有激情但數(shù)字人的語氣平淡沒有情緒起伏,要么主播手部動(dòng)作與說話的節(jié)奏不匹配,還有可能數(shù)字人的動(dòng)作單調(diào)重復(fù),看起來機(jī)械和呆板。

是時(shí)候改變一下刻板印象了。過去大半年,在多模態(tài)及大語言模型快速進(jìn)步驅(qū)動(dòng)下,直播數(shù)字人的表現(xiàn)正超乎許多人的想象。

比如上面這個(gè)聲情并茂、怎么看都是真人的主播,出自特看科技最新發(fā)布的第四代直播數(shù)字人產(chǎn)品。

它的效果看起來非常自然,講述內(nèi)容、口型、動(dòng)作、語氣的匹配也非常協(xié)調(diào),甚至看不出來是個(gè)數(shù)字人。

特看科技CEO樂乘介紹,新發(fā)布的第四代數(shù)字人產(chǎn)品已經(jīng)擺脫了對口型階段,從數(shù)字人手部動(dòng)作、面部表情、聲音、情緒與內(nèi)容的匹配全都由AI驅(qū)動(dòng),效果能達(dá)到真人90%水平?!斑@是很重要的一個(gè)跨越”,樂乘將之類比為數(shù)字人直播的GPT-4時(shí)刻。

熟悉大模型發(fā)展歷程的人知道,GPT-4之后,ChatGPT的用戶量實(shí)現(xiàn)了月活過億到周活過億,月活十億規(guī)模的躍遷,大模型真正從偏愛好者走向了大眾市場。

“看起來逼近真人,效果達(dá)到真人90%水平”的數(shù)字人,為什么會(huì)被視作規(guī)?;瘧?yīng)用的分水嶺?

就像很多AI應(yīng)用有采納率指標(biāo)一樣,實(shí)際上,直播行業(yè)對數(shù)字人的效果也有一套從定性到定量的衡量標(biāo)準(zhǔn)。

定性的指標(biāo)來自各大平臺(tái)的直播間質(zhì)量評(píng)估團(tuán)隊(duì)的平均意見分?jǐn)?shù)(MOS)。比如淘寶平臺(tái)內(nèi)部的MOS打分系統(tǒng),兩撥人盲打分,評(píng)估平臺(tái)內(nèi)所有的直播間是不是真人,從而來保護(hù)消費(fèi)者體驗(yàn)。平臺(tái)MOS分打完后,得分最高的數(shù)十個(gè)數(shù)字人直播間會(huì)進(jìn)入公域流量池。

定量方法則更為簡單粗暴,就看小時(shí)成交效率。數(shù)字人和真人同時(shí)播,同一時(shí)段,同樣的貨,看交易數(shù)據(jù)。數(shù)字人表現(xiàn)越好,消費(fèi)者就會(huì)用交易來給數(shù)字人的效果投票。

“定性確保內(nèi)容體驗(yàn),定量看成交效果,兩個(gè)維度統(tǒng)一來對比數(shù)字人與真人的差距。”樂乘說。

行業(yè)內(nèi)有共識(shí),直播效果只能達(dá)到真人70%水平時(shí),數(shù)字人就沒有辦法承載很大的流量。因?yàn)閷ι碳叶?,總有三成的生意?huì)丟掉,對平臺(tái)而言,流量的轉(zhuǎn)化效率仍然不夠高。此時(shí),數(shù)字人在直播場景里只能作為補(bǔ)充手段,比如在晚上時(shí)段播一播,很難成為主流的直播方式。

而當(dāng)數(shù)字人能達(dá)到真人的90%到95%階段,多數(shù)商家不會(huì)太在意950元還是1000元的營收差距,他們對數(shù)字人直播的態(tài)度就會(huì)從觀望、無感轉(zhuǎn)向開始用起來。

“一些客戶之前對數(shù)字人直播無感,可能還有點(diǎn)嫌棄對口型技術(shù),特看第四代產(chǎn)品出來后,他們眼前一亮,這時(shí)候他們心態(tài)就完全變了”,樂乘觀察到客戶的態(tài)度在發(fā)生變化。

效果提升讓規(guī)?;瘧?yīng)用的一大障礙被掃清。同時(shí),許多人關(guān)注的數(shù)字人直播的成本,也不再是行業(yè)卡點(diǎn)。過去一年多,技術(shù)進(jìn)步下,數(shù)字人落地成本已經(jīng)有了長足的下降,最主要的削減來自模型泛化能力增強(qiáng),數(shù)字人生成不用單獨(dú)建模。

以特看科技為例,2023年制作數(shù)字人需要提交十分鐘視頻,基于提交的視頻再去專門建模訓(xùn)練,不算后續(xù)使用,單個(gè)數(shù)字人建模成本至少要耗費(fèi)五千到一萬,極大限制數(shù)字人的推廣。當(dāng)時(shí)服飾的商家不可能用數(shù)字人直播,因?yàn)槊恳粋€(gè)款都要拍視頻單訓(xùn)模型,商家根本用不起來。

到今年年初,行業(yè)里領(lǐng)先的玩家比如特看已經(jīng)不需要用提交視頻單獨(dú)再去訓(xùn)模型,AI能直接生成數(shù)字人的口型和動(dòng)作,成本大幅降低。企業(yè)只需要按使用時(shí)長付費(fèi),數(shù)字人直播成本已經(jīng)降至真人直播的五分之一。

“效果上有突破,成本本身也不再是卡點(diǎn),數(shù)字人直播就能完成從小眾產(chǎn)品向大眾市場的躍遷,從少數(shù)商家補(bǔ)充手段變成大部分商家的主流直播手段”,樂乘判斷接下來一年數(shù)字人直播市場規(guī)模可能會(huì)翻倍。

02

一家創(chuàng)業(yè)公司

如何快速跑通技術(shù)產(chǎn)品和場景驗(yàn)證閉環(huán)

數(shù)字人直播跨越鴻溝在即,技術(shù)進(jìn)步當(dāng)然是最大的驅(qū)動(dòng)因素,這也是當(dāng)下這波AI應(yīng)用熱潮最大的特征之一。

視頻生成類基模升級(jí),AI涌現(xiàn)出的物理理解能力、人物情緒表現(xiàn)力、圖像理解和生成能力等持續(xù)進(jìn)化,驅(qū)動(dòng)了數(shù)字人的能力躍遷。

“比如動(dòng)的時(shí)候,講話的時(shí)候與全身動(dòng)作、神態(tài)的自然協(xié)調(diào),都需要有更強(qiáng)的人體、周邊環(huán)境、物理世界、空間理解能力,基礎(chǔ)模型在推理和多模態(tài)能力的進(jìn)步,帶動(dòng)了數(shù)字人生成效果升級(jí)?!毙袠I(yè)資深人士稱。

行業(yè)基建成熟之外,在直播場景里還需要AI應(yīng)用商們快速將技術(shù)、產(chǎn)品能力基于場景完成驗(yàn)證迭代,才能讓技術(shù)加速突破。在這一重要節(jié)點(diǎn),作為成立僅三年的AI應(yīng)用公司,特看科技率先將數(shù)字人直播效果從此前的70%拉高到90%水平,也受到了業(yè)界的廣泛關(guān)注。

樂乘認(rèn)為,目前,特看科技在數(shù)字人直播場景形成了從技術(shù)、產(chǎn)品到運(yùn)營能力的完整能力循環(huán),這也是他們能率先突破節(jié)點(diǎn)的原因。“直播間其實(shí)是一個(gè)很收斂的場景,一個(gè)主播站在空間里表達(dá)產(chǎn)品,人、貨、場相關(guān)因素非常固定。我們用場景內(nèi)數(shù)據(jù)去微調(diào)優(yōu)化模型,使得特看的模型在直播間場景的表現(xiàn)能比基模更優(yōu)?!?/p>

而除了技術(shù)維度,AI應(yīng)用在產(chǎn)品層面還需要持續(xù)沉淀互動(dòng)、成交和電商帶貨邏輯,才能完成AI落地。過去三年特看直播數(shù)字人經(jīng)歷了四個(gè)版本迭代,持續(xù)將對直播場景如何利用好AI來提升商家內(nèi)容供給能力的理解注入產(chǎn)品。

這其實(shí)與特看科技的基因一脈相承。這家AI應(yīng)用公司的創(chuàng)始團(tuán)隊(duì)來自阿里,CEO樂乘曾在第一波深度學(xué)習(xí)浪潮里,帶領(lǐng)團(tuán)隊(duì)打造了淘寶智能設(shè)計(jì)系統(tǒng)“魯班”。它的初衷就是用AI在策劃設(shè)計(jì)等環(huán)節(jié)幫助商家降低門檻,擴(kuò)大優(yōu)質(zhì)設(shè)計(jì)供給。

特看科技成立后,ChatGPT橫空問世讓他們意識(shí)到AI數(shù)字人直播是很好的載體,可以幫助商家提升內(nèi)容供給能力。這支團(tuán)隊(duì)過往用產(chǎn)品技術(shù)來降低商家經(jīng)營門檻的理解和沉淀在新創(chuàng)業(yè)的產(chǎn)品上有了被復(fù)用的可能。

樂乘介紹,他們對數(shù)字人直播的理解是“身體+大腦”,這也是數(shù)字人直播的第一性原理。身體是載體,依賴多模態(tài)技術(shù)的成熟,而大腦表現(xiàn)更智能則需要大語言模型加上智能體加持。

在基模能力尚不足時(shí),他們早早在直播場景里把應(yīng)用和產(chǎn)品做深,一旦基模能力進(jìn)步他們就快速切換。落后的發(fā)動(dòng)機(jī)先讓飛機(jī)飛起來,等新的發(fā)動(dòng)機(jī)好了再完成替換。這些產(chǎn)品應(yīng)用層的積累最終轉(zhuǎn)化成團(tuán)隊(duì)身上的肌肉,在這波AI浪潮里搶得先機(jī)。

特看還從運(yùn)營層面降低客戶使用的門檻。當(dāng)下許多商家客戶不具備數(shù)字人直播應(yīng)用的運(yùn)營能力,特看專門有代運(yùn)營服務(wù)團(tuán)隊(duì)幫助客戶去代運(yùn)營實(shí)施。兩年前一些頭部客戶已委托特看幫助代運(yùn)營,過去兩年里他們與這批先鋒客戶持續(xù)打磨,較早在技術(shù)、產(chǎn)品和場景驗(yàn)證間跑通了閉環(huán)。

“當(dāng)下特看可以給客戶交付結(jié)果,為成交負(fù)責(zé),而不只是賣個(gè)軟件”,樂乘認(rèn)為,Result as A Service是當(dāng)下這波AI應(yīng)用區(qū)別于上一代SaaS最大的不同,特看第四代產(chǎn)品上也將嘗試按結(jié)果付費(fèi)的分潤模式。

過去三年,數(shù)字人市場經(jīng)歷了不少喧囂起伏。大模型讓數(shù)字人市場迎來新的發(fā)展機(jī)遇,但同時(shí)也不乏機(jī)會(huì)型玩家下場掘金,2023年年中市面一度出現(xiàn)上千家代理商賣良莠不齊的數(shù)字人。當(dāng)時(shí)樂乘和他的團(tuán)隊(duì)十分克制,保持了較小的團(tuán)隊(duì)規(guī)模專心打磨技術(shù)和產(chǎn)品。他認(rèn)為,“泡沫總會(huì)消失,市場最終要看產(chǎn)品和能力”。

當(dāng)下技術(shù)已有突破,特看正基于第四代數(shù)字人做一些有趣的嘗試。比如一家國內(nèi)頭部運(yùn)動(dòng)品牌希望能在AI試衣場景合作?!爸辈ラg里主播離開畫面之后是去換衣服,未來數(shù)字人離開畫面其實(shí)是AI在生成,這其實(shí)也是數(shù)字人身體能力更成熟的表現(xiàn)?!?/p>

而圍繞著數(shù)字人大腦能力,特看已基于智能體編排數(shù)字人直播的運(yùn)營全流程,未來整個(gè)直播周期從前期策劃、腳本、話術(shù)生成、畫面、問答包括數(shù)據(jù)復(fù)盤,全鏈條都由一個(gè)個(gè)Agent串聯(lián)。目前這套Agent工作流已經(jīng)在特看內(nèi)部使用,年底將對外開放。

03

直播大洗牌,數(shù)字人直播將創(chuàng)造增量市場

“技術(shù)發(fā)展速度比我們預(yù)想最樂觀局面更快”,樂乘感慨這波應(yīng)用熱潮的非線性增長特性,突破拐點(diǎn)后爆發(fā)會(huì)異常迅猛。

特看科技有過一個(gè)估算,當(dāng)數(shù)字人直播只有真人70%效果,市場滲透率只有5%,行業(yè)規(guī)模在2億左右。突破了90%是個(gè)節(jié)點(diǎn),明年他們判斷市場滲透率會(huì)提升到10%,市場規(guī)模會(huì)擴(kuò)大到4億,到2027年又會(huì)再度翻倍。

直播生態(tài)也將迎來變局。數(shù)字人直播的類目、場景擴(kuò)展,它在企業(yè)經(jīng)營中角色也有變化。

過去幾年,市場上最先應(yīng)用數(shù)字人直播技術(shù)的商家來自本地生活板塊。當(dāng)時(shí)數(shù)字人主要是坐著直播,動(dòng)作幅度小,本地生活類目產(chǎn)品不用拿實(shí)物展示,更能規(guī)避數(shù)字人能力的短板。

之后隨著數(shù)字人動(dòng)作越來越自然,有實(shí)物的美妝類商家也開始用數(shù)字人。今年,隨著AI技術(shù)能生成的范圍擴(kuò)大到全身動(dòng)作上,比如可以在直播間很自然地走來走去展示,服飾類商家也開始擁抱數(shù)字人直播技術(shù)??梢哉f品類的擴(kuò)張,跟隨技術(shù)進(jìn)步而逐步擴(kuò)張。

而商家們用數(shù)字人直播的場景也在擴(kuò)大。貨架電商場景擁抱數(shù)字人最自然,商家們用數(shù)字人能更方便多渠道經(jīng)營,比如在淘寶、京東、拼多多、唯品會(huì)等主流貨架場景都用上數(shù)字人?,F(xiàn)在一些商家把數(shù)字人放到私域的小程序里做一對一導(dǎo)購,消費(fèi)者進(jìn)來用不同數(shù)字人做可導(dǎo)入問答,也有品牌把數(shù)字人往線下門店放。

業(yè)界觀察,數(shù)字人直播的第一批買單者往往是頭部品牌。它們在戰(zhàn)略上擁抱數(shù)字化,加上本身在直播場景做了很廣的投入,比如有自播、達(dá)播或者通過代運(yùn)營公司直播等多種手段。隨著AI技術(shù)成熟,AI直播是這些頭部企業(yè)的補(bǔ)充手段,未來它們的直播選擇往往是真人和AI混播。

隨著數(shù)字人直播技術(shù)發(fā)展,有一波新買單者來自原本靠客服來直播的中小商家團(tuán)隊(duì),因?yàn)閿?shù)字人直播的效果會(huì)明顯好于客服這類非專業(yè)主播,企業(yè)能算清ROI。

更大的市場增量則來自此前因直播投入大不敢貿(mào)然進(jìn)入直播賽道的商家群體,樂乘判斷這個(gè)群體未來可能會(huì)占據(jù)數(shù)字人直播市場的半壁江山。

“守著傳統(tǒng)貨架電商里中有龐大的群體之前不敢花錢建直播團(tuán)隊(duì),現(xiàn)在AI大幅降低門檻,提供了好的直播能力基建,他們就有條件直播,這會(huì)給平臺(tái)制造一大批增量商家?!睒烦苏f。

不同于其他類型的應(yīng)用,數(shù)字人直播的規(guī)?;M(jìn)展與平臺(tái)政策高度相關(guān),外界也關(guān)注,數(shù)字人效果變好后平臺(tái)是否愿意數(shù)字人規(guī)模應(yīng)用開綠燈。

樂乘和特看習(xí)慣從平臺(tái)、商家、消費(fèi)者、服務(wù)商四重視角來思考這個(gè)問題,這也是他們的阿里背景帶來的全局的思維,“當(dāng)數(shù)字人效果不好,會(huì)破壞內(nèi)容生態(tài)時(shí),平臺(tái)一定不會(huì)愿意給流量。一定是商家、平臺(tái)、消費(fèi)者都滿意之后,數(shù)字人直播才會(huì)成為做成更大的一件事”。

當(dāng)下數(shù)字人直播效果提升,成本下降,對商家而言能提高內(nèi)容供給能力;對平臺(tái)而言能帶來新的商家供給,同時(shí)不破壞原有的內(nèi)容生態(tài)體驗(yàn);對消費(fèi)者而言,則有可能在直播場景獲得更廣的商品及內(nèi)容供給。樂乘認(rèn)為,多方共贏后,服務(wù)商就會(huì)從這三方收益里贏得市場蛋糕。

另外,數(shù)字人直播能為店播提供高質(zhì)量內(nèi)容供給后,平臺(tái)的流量傾斜策略可能也會(huì)發(fā)生變化,比如流量池子從達(dá)播向商家店播轉(zhuǎn)變,這可能為未來天價(jià)直播生態(tài)的演進(jìn)埋下伏筆。

這波AI應(yīng)用浪潮另一大特征是生而全球。以特看科技為代表的頭部數(shù)字人應(yīng)用在國內(nèi)市場劃出漂亮的增長曲線時(shí),也積極進(jìn)軍海外。比如特看的直播數(shù)字人一方面跟著中國品牌商家出海到東南亞,同時(shí)它也在服務(wù)不少東南亞本土品牌。

一個(gè)反常識(shí)之處在于,當(dāng)下東南亞的人力成本低,數(shù)字人直播并不具備明顯成本優(yōu)勢,但商家們擁抱AI的決心比想象中強(qiáng)烈。因?yàn)楣芾懋?dāng)?shù)氐闹鞑ルy度很高,而AI則能更快規(guī)模化,也不存在文化隔閡和管理成本。

在東南亞市場,特看已經(jīng)服務(wù)了不少標(biāo)桿客戶,增長勢頭不俗。樂乘認(rèn)為中國在數(shù)字人直播上走在前列是一種必然。“中國電商直播生態(tài)領(lǐng)先全球,移動(dòng)互聯(lián)網(wǎng)時(shí)代電商生態(tài)領(lǐng)先就積累下了應(yīng)用優(yōu)勢。現(xiàn)在AI來了,從國內(nèi)市場廝殺出來的玩家自然具有全球競爭力”。

特別聲明:本文為合作媒體授權(quán)DoNews專欄轉(zhuǎn)載,文章版權(quán)歸原作者及原出處所有。文章系作者個(gè)人觀點(diǎn),不代表DoNews專欄的立場,轉(zhuǎn)載請聯(lián)系原作者及原出處獲取授權(quán)。(有任何疑問都請聯(lián)系idonews@donews.com)

標(biāo)簽: 人工智能
數(shù)字人直播迎來GPT4時(shí)刻,一家杭州創(chuàng)業(yè)公司殺出來了
掃描二維碼查看原文
分享自DoNews
Copyright ? DoNews 2000-2025 All Rights Reserved
蜀ICP備2024059877號(hào)-1