這幾天AIGC圈子炸了,OpenAI發(fā)布了文生視頻模型Sora,給本來(lái)就火熱的AIGC賽道,又添了一把柴火。Sora模型生成的視頻質(zhì)量和真實(shí)度,都達(dá)到了前所未有的高度。360董事長(zhǎng)周鴻祎感慨地說(shuō),Sora的出現(xiàn)意味著AGI的實(shí)現(xiàn)從十年縮短到一兩年。
那Sora的出現(xiàn)意味著中美兩國(guó)在AI領(lǐng)域的差距越來(lái)越大嗎?國(guó)產(chǎn)大模型聚焦應(yīng)用難道錯(cuò)了嗎?中國(guó)版的Sora,還要多久?下面談?wù)勎业目捶ā?/span>
01
Sora發(fā)布,多模態(tài)大戰(zhàn)提速
大模型本質(zhì)上是世界模型,代表著AI對(duì)人類(lèi)世界的認(rèn)知。以文字生成為例,大模型不是簡(jiǎn)單預(yù)測(cè)下一個(gè)最有可能出現(xiàn)的文字是什么,而是基于海量知識(shí)預(yù)訓(xùn)練的結(jié)果,理解人類(lèi)輸入文字的語(yǔ)義,然后給出基于對(duì)世界認(rèn)知的答案。
相對(duì)于文字和圖片處理來(lái)說(shuō),視頻所包含的信息量更豐富,這就意味著需要耗費(fèi)更大的算力來(lái)訓(xùn)練,工程復(fù)雜度也較高。
1)文生視頻是大模型的“最后一塊拼圖”
如果說(shuō)AIGC是AI技術(shù)領(lǐng)域的皇冠,那么文生視頻就是皇冠上的寶石。Sora的出現(xiàn),好比視頻領(lǐng)域的GPT-3時(shí)刻的到來(lái),這是具有顛覆性的事件,它完成了大模型技術(shù)的最后一塊拼圖,標(biāo)志著大模型的競(jìng)爭(zhēng)進(jìn)入到了比拼多模態(tài)的階段。
2)為什么Sora加速了AGI的實(shí)現(xiàn)
如周鴻祎所說(shuō):“Sora只是小試牛刀,它展現(xiàn)的不僅僅是一個(gè)視頻制作的能力,而是大模型對(duì)真實(shí)世界有了理解和模擬之后,會(huì)帶來(lái)新的成果和突破。有強(qiáng)勁的大模型做底子,基于對(duì)人類(lèi)語(yǔ)言的理解、對(duì)人類(lèi)知識(shí)和世界模型的了解,我們距離AIGC的實(shí)現(xiàn)將越來(lái)越近?!?/span>
基于這些理解,不難得出結(jié)論:接下來(lái)的大模型之戰(zhàn),誰(shuí)能打贏多模態(tài)這場(chǎng)戰(zhàn)役,就有可能贏得整個(gè)戰(zhàn)爭(zhēng)。
02
中美在AI領(lǐng)域的差距,正在加大嗎?
業(yè)內(nèi)的觀點(diǎn)普遍認(rèn)為,Sora的出現(xiàn)說(shuō)明在AI領(lǐng)域,中美的差距正在加大。我卻有不同看法,先來(lái)聊聊美國(guó)的大模型。
1)美國(guó)大模型搞到什么程度了?
根據(jù)公開(kāi)數(shù)據(jù),到2023年5月,美國(guó)10億級(jí)參數(shù)規(guī)模以上的基礎(chǔ)大模型就已突破100 個(gè),也是妥妥的“百模大戰(zhàn)”。高盛預(yù)測(cè),美國(guó)2025年大模型相關(guān)投資可達(dá)千億美元,約全球的1/2。從資金投入上看,美國(guó)也是遙遙領(lǐng)先的。
除了ChatGPT之外,美國(guó)具有代表性的通用大模型公司有:Anthropic、Cohere、Google、Meta等。
美國(guó)大模型的行業(yè)應(yīng)用方面,主要集中在金融、醫(yī)療、教育等領(lǐng)域。比如:在線教育組織Khan Academy于4月發(fā)布的基于GPT-4模型的AI助教Khanmigo,并且已經(jīng)實(shí)現(xiàn)商業(yè)化。還有谷歌的Med-PaLM2,它在美國(guó)醫(yī)師執(zhí)照考試(USMLE)中獲得85分以上。
2)國(guó)產(chǎn)大模型,現(xiàn)狀盤(pán)點(diǎn)
據(jù)不完全統(tǒng)計(jì),2023年中國(guó)約有300多家公司先后發(fā)布了大模型。一類(lèi)是頭部科技企業(yè),如:阿里、百度、騰訊、華為等;以及新創(chuàng)立的公司,如:智譜AI、百川智能、MiniMax等;還有傳統(tǒng)AI企業(yè),如:科大訊飛、商湯科技等。許多高校研究院,如:清華、復(fù)旦、中科院等,也都已經(jīng)深度布局大模型。
中國(guó)的大模型公司很多是從產(chǎn)業(yè)端實(shí)戰(zhàn)出來(lái)的,這跟美國(guó)從實(shí)驗(yàn)室里孵化成熟再推出的做法是有所區(qū)別的。比如:阿里、百度、騰訊的大模型應(yīng)用在了廣告推送、圖像識(shí)別、內(nèi)容分發(fā)等業(yè)務(wù)場(chǎng)景上,你能感知到廣告推送越來(lái)越準(zhǔn)了,視頻和圖文推薦越來(lái)越好看了,這背后就是大模型的功勞。
3)中美大模型,差距在加大嗎?
據(jù)《金融時(shí)報(bào)》報(bào)道,中國(guó)已在全球前10的大模型研發(fā)機(jī)構(gòu)中占據(jù)4席,分別是百度、BAAI智源研究院、清華大學(xué)以及阿里巴巴研究院。
百度的“文心一言”、阿里巴巴的“通義千問(wèn)”等都是我國(guó)自研的大模型,其性能以及各項(xiàng)測(cè)評(píng)指標(biāo),跟美國(guó)大模型可以一較高下。
個(gè)人認(rèn)為,相對(duì)來(lái)說(shuō)美國(guó)企業(yè)更加重視底層研發(fā)能力,中國(guó)企業(yè)更偏框架、行業(yè)應(yīng)用層面的研發(fā)。也就是說(shuō),以ChatGPT-4、Sora為代表的基礎(chǔ)大模型方面,美國(guó)具備一定的技術(shù)領(lǐng)先優(yōu)勢(shì)。但是在大模型的AI應(yīng)用和行業(yè)解決方案方面,中國(guó)有著更廣闊的市場(chǎng)和豐富的應(yīng)用場(chǎng)景。
因此,從整體大模型發(fā)展來(lái)看,其實(shí)很難做到Apple to Apple的比較,而大模型很重要的特征是:應(yīng)用和技術(shù)的雙輪驅(qū)動(dòng)。也就是說(shuō),大模型應(yīng)用產(chǎn)生的數(shù)據(jù)反哺模型本身,形成一個(gè)正反饋,不斷迭代發(fā)展,最終倒逼底層技術(shù)的突破。從長(zhǎng)遠(yuǎn)來(lái)看,中國(guó)的基礎(chǔ)大模型技術(shù)趕超美國(guó)只是時(shí)間問(wèn)題。
這不是盲目樂(lè)觀,只要回顧一下中國(guó)互聯(lián)網(wǎng)發(fā)展史就很清晰了:PC時(shí)代的電商系統(tǒng),移動(dòng)時(shí)代的支付、打車(chē)、外賣(mài),都經(jīng)歷過(guò)這樣的技術(shù)演進(jìn)過(guò)程。從全世界范圍來(lái)看,也只有中國(guó)才有“12306”全民秒殺火車(chē)票、春節(jié)十幾億人搶紅包這樣的場(chǎng)景。中國(guó)互聯(lián)網(wǎng)經(jīng)過(guò)20多年的野蠻生長(zhǎng),場(chǎng)景應(yīng)用倒逼底層技術(shù)突破,時(shí)至今日我們打造出世界領(lǐng)先的電商系統(tǒng)、支付系統(tǒng)、分布式技術(shù)、數(shù)據(jù)存儲(chǔ)技術(shù)。中國(guó)的大模型正在經(jīng)歷同樣的過(guò)程。
03
中國(guó)版的Sora,還需要多久?
這是許多業(yè)內(nèi)人最關(guān)心的問(wèn)題,中國(guó)版的Sora,究竟還需要多久?
1)“他們996搞了1年”,我們需要多久?
根據(jù)AI研究領(lǐng)域大神謝賽寧透露,他的好友Bill Peebles也就是Sora的領(lǐng)隊(duì),整整高強(qiáng)度工作了一年,最終發(fā)布了這個(gè)驚艷世界的視頻模型。
謝賽寧表示,對(duì)于Sora這樣復(fù)雜的系統(tǒng),人才第一,數(shù)據(jù)第二,算力第三,其他都沒(méi)有什么是不可替代的。對(duì)于中國(guó)科技巨頭來(lái)說(shuō),以上三個(gè)條件都是具備的,剩下的也只是時(shí)間問(wèn)題。
我問(wèn)了幾位大廠的朋友,得到的回復(fù)是“在搞了”,都處于保密狀態(tài),個(gè)人感覺(jué)應(yīng)該就是這幾個(gè)月吧。
2)中國(guó)版Sora最大的挑戰(zhàn)
比起問(wèn)“我們什么時(shí)候能搞出中國(guó)版Sora?”,也許我們更應(yīng)該問(wèn)“當(dāng)中國(guó)版Sora出現(xiàn)的時(shí)候,我們是否準(zhǔn)備好了?” 在不久的將來(lái),如美劇《黑鏡》這樣的故事情節(jié)即將成為現(xiàn)實(shí),如何保護(hù)個(gè)人信息和隱私不被惡意使用和傳播?如何防止某些組織從中非法牟利?都需要有一個(gè)成熟完善的監(jiān)控體系。
結(jié)束語(yǔ)
追趕這一波潮流不僅僅在于技術(shù)突破,更在于我們對(duì)未來(lái)的準(zhǔn)備。國(guó)產(chǎn)大模型的發(fā)展不只是技術(shù)的競(jìng)爭(zhēng),也是對(duì)世界認(rèn)知和文化的較量。
技術(shù)進(jìn)步帶來(lái)的不僅是便利,也有倫理、法律和社會(huì)挑戰(zhàn)。在追求技術(shù)創(chuàng)新的同時(shí),我們更應(yīng)思考如何讓這些技術(shù)服務(wù)于社會(huì),如何在科技創(chuàng)新與秩序之間找到平衡。
相信國(guó)產(chǎn)大模型會(huì)越來(lái)越好,更深度地參與和引領(lǐng)這場(chǎng)AI技術(shù)革命,成為推動(dòng)人類(lèi)文明進(jìn)步的重要力量。
網(wǎng)上經(jīng)營(yíng)許可證號(hào):京ICP備18006193號(hào)-1
copyright?2005-2022 czderi.com all right reserved 技術(shù)支持:杭州高達(dá)軟件系統(tǒng)股份有限公司
服務(wù)熱線:010-59231580