國(guó)產(chǎn)大模型，什么時(shí)候能搞出 Sora ？

2024-02-27 09:13:03來(lái)源：技術(shù)領(lǐng)導(dǎo)力作者：

這幾天AIGC圈子炸了，OpenAI發(fā)布了文生視頻模型Sora，給本來(lái)就火熱的AIGC賽道，又添了一把柴火。Sora模型生成的視頻質(zhì)量和真實(shí)度，都達(dá)到了前所未有的高度。360董事長(zhǎng)周鴻祎感慨地說(shuō)，Sora的出現(xiàn)意味著AGI的實(shí)現(xiàn)從十年縮短到一兩年。

那Sora的出現(xiàn)意味著中美兩國(guó)在AI領(lǐng)域的差距越來(lái)越大嗎？國(guó)產(chǎn)大模型聚焦應(yīng)用難道錯(cuò)了嗎？中國(guó)版的Sora，還要多久？下面談?wù)勎业目捶ā?/span>

Sora發(fā)布，多模態(tài)大戰(zhàn)提速

大模型本質(zhì)上是世界模型，代表著AI對(duì)人類(lèi)世界的認(rèn)知。以文字生成為例，大模型不是簡(jiǎn)單預(yù)測(cè)下一個(gè)最有可能出現(xiàn)的文字是什么，而是基于海量知識(shí)預(yù)訓(xùn)練的結(jié)果，理解人類(lèi)輸入文字的語(yǔ)義，然后給出基于對(duì)世界認(rèn)知的答案。

相對(duì)于文字和圖片處理來(lái)說(shuō)，視頻所包含的信息量更豐富，這就意味著需要耗費(fèi)更大的算力來(lái)訓(xùn)練，工程復(fù)雜度也較高。

1）文生視頻是大模型的“最后一塊拼圖”

如果說(shuō)AIGC是AI技術(shù)領(lǐng)域的皇冠，那么文生視頻就是皇冠上的寶石。Sora的出現(xiàn)，好比視頻領(lǐng)域的GPT-3時(shí)刻的到來(lái)，這是具有顛覆性的事件，它完成了大模型技術(shù)的最后一塊拼圖，標(biāo)志著大模型的競(jìng)爭(zhēng)進(jìn)入到了比拼多模態(tài)的階段。

2）為什么Sora加速了AGI的實(shí)現(xiàn)

如周鴻祎所說(shuō)：“Sora只是小試牛刀，它展現(xiàn)的不僅僅是一個(gè)視頻制作的能力，而是大模型對(duì)真實(shí)世界有了理解和模擬之后，會(huì)帶來(lái)新的成果和突破。有強(qiáng)勁的大模型做底子，基于對(duì)人類(lèi)語(yǔ)言的理解、對(duì)人類(lèi)知識(shí)和世界模型的了解，我們距離AIGC的實(shí)現(xiàn)將越來(lái)越近?！?/span>

基于這些理解，不難得出結(jié)論：接下來(lái)的大模型之戰(zhàn)，誰(shuí)能打贏多模態(tài)這場(chǎng)戰(zhàn)役，就有可能贏得整個(gè)戰(zhàn)爭(zhēng)。

中美在AI領(lǐng)域的差距，正在加大嗎？

業(yè)內(nèi)的觀點(diǎn)普遍認(rèn)為，Sora的出現(xiàn)說(shuō)明在AI領(lǐng)域，中美的差距正在加大。我卻有不同看法，先來(lái)聊聊美國(guó)的大模型。

1）美國(guó)大模型搞到什么程度了？

根據(jù)公開(kāi)數(shù)據(jù)，到2023年5月，美國(guó)10億級(jí)參數(shù)規(guī)模以上的基礎(chǔ)大模型就已突破100 個(gè)，也是妥妥的“百模大戰(zhàn)”。高盛預(yù)測(cè)，美國(guó)2025年大模型相關(guān)投資可達(dá)千億美元，約全球的1/2。從資金投入上看，美國(guó)也是遙遙領(lǐng)先的。

除了ChatGPT之外，美國(guó)具有代表性的通用大模型公司有：Anthropic、Cohere、Google、Meta等。

美國(guó)大模型的行業(yè)應(yīng)用方面，主要集中在金融、醫(yī)療、教育等領(lǐng)域。比如：在線教育組織Khan Academy于4月發(fā)布的基于GPT-4模型的AI助教Khanmigo，并且已經(jīng)實(shí)現(xiàn)商業(yè)化。還有谷歌的Med-PaLM2，它在美國(guó)醫(yī)師執(zhí)照考試（USMLE）中獲得85分以上。

2）國(guó)產(chǎn)大模型，現(xiàn)狀盤(pán)點(diǎn)

據(jù)不完全統(tǒng)計(jì)，2023年中國(guó)約有300多家公司先后發(fā)布了大模型。一類(lèi)是頭部科技企業(yè)，如：阿里、百度、騰訊、華為等；以及新創(chuàng)立的公司，如：智譜AI、百川智能、MiniMax等；還有傳統(tǒng)AI企業(yè)，如：科大訊飛、商湯科技等。許多高校研究院，如：清華、復(fù)旦、中科院等，也都已經(jīng)深度布局大模型。

中國(guó)的大模型公司很多是從產(chǎn)業(yè)端實(shí)戰(zhàn)出來(lái)的，這跟美國(guó)從實(shí)驗(yàn)室里孵化成熟再推出的做法是有所區(qū)別的。比如：阿里、百度、騰訊的大模型應(yīng)用在了廣告推送、圖像識(shí)別、內(nèi)容分發(fā)等業(yè)務(wù)場(chǎng)景上，你能感知到廣告推送越來(lái)越準(zhǔn)了，視頻和圖文推薦越來(lái)越好看了，這背后就是大模型的功勞。

3）中美大模型，差距在加大嗎？

據(jù)《金融時(shí)報(bào)》報(bào)道，中國(guó)已在全球前10的大模型研發(fā)機(jī)構(gòu)中占據(jù)4席，分別是百度、BAAI智源研究院、清華大學(xué)以及阿里巴巴研究院。

百度的“文心一言”、阿里巴巴的“通義千問(wèn)”等都是我國(guó)自研的大模型，其性能以及各項(xiàng)測(cè)評(píng)指標(biāo)，跟美國(guó)大模型可以一較高下。

個(gè)人認(rèn)為，相對(duì)來(lái)說(shuō)美國(guó)企業(yè)更加重視底層研發(fā)能力，中國(guó)企業(yè)更偏框架、行業(yè)應(yīng)用層面的研發(fā)。也就是說(shuō)，以ChatGPT-4、Sora為代表的基礎(chǔ)大模型方面，美國(guó)具備一定的技術(shù)領(lǐng)先優(yōu)勢(shì)。但是在大模型的AI應(yīng)用和行業(yè)解決方案方面，中國(guó)有著更廣闊的市場(chǎng)和豐富的應(yīng)用場(chǎng)景。

因此，從整體大模型發(fā)展來(lái)看，其實(shí)很難做到Apple to Apple的比較，而大模型很重要的特征是：應(yīng)用和技術(shù)的雙輪驅(qū)動(dòng)。也就是說(shuō)，大模型應(yīng)用產(chǎn)生的數(shù)據(jù)反哺模型本身，形成一個(gè)正反饋，不斷迭代發(fā)展，最終倒逼底層技術(shù)的突破。從長(zhǎng)遠(yuǎn)來(lái)看，中國(guó)的基礎(chǔ)大模型技術(shù)趕超美國(guó)只是時(shí)間問(wèn)題。

這不是盲目樂(lè)觀，只要回顧一下中國(guó)互聯(lián)網(wǎng)發(fā)展史就很清晰了：PC時(shí)代的電商系統(tǒng)，移動(dòng)時(shí)代的支付、打車(chē)、外賣(mài)，都經(jīng)歷過(guò)這樣的技術(shù)演進(jìn)過(guò)程。從全世界范圍來(lái)看，也只有中國(guó)才有“12306”全民秒殺火車(chē)票、春節(jié)十幾億人搶紅包這樣的場(chǎng)景。中國(guó)互聯(lián)網(wǎng)經(jīng)過(guò)20多年的野蠻生長(zhǎng)，場(chǎng)景應(yīng)用倒逼底層技術(shù)突破，時(shí)至今日我們打造出世界領(lǐng)先的電商系統(tǒng)、支付系統(tǒng)、分布式技術(shù)、數(shù)據(jù)存儲(chǔ)技術(shù)。中國(guó)的大模型正在經(jīng)歷同樣的過(guò)程。

中國(guó)版的Sora，還需要多久？

這是許多業(yè)內(nèi)人最關(guān)心的問(wèn)題，中國(guó)版的Sora，究竟還需要多久？

1）“他們996搞了1年”，我們需要多久？

根據(jù)AI研究領(lǐng)域大神謝賽寧透露，他的好友Bill Peebles也就是Sora的領(lǐng)隊(duì)，整整高強(qiáng)度工作了一年，最終發(fā)布了這個(gè)驚艷世界的視頻模型。

謝賽寧表示，對(duì)于Sora這樣復(fù)雜的系統(tǒng)，人才第一，數(shù)據(jù)第二，算力第三，其他都沒(méi)有什么是不可替代的。對(duì)于中國(guó)科技巨頭來(lái)說(shuō)，以上三個(gè)條件都是具備的，剩下的也只是時(shí)間問(wèn)題。

我問(wèn)了幾位大廠的朋友，得到的回復(fù)是“在搞了”，都處于保密狀態(tài)，個(gè)人感覺(jué)應(yīng)該就是這幾個(gè)月吧。

2）中國(guó)版Sora最大的挑戰(zhàn)

比起問(wèn)“我們什么時(shí)候能搞出中國(guó)版Sora？”，也許我們更應(yīng)該問(wèn)“當(dāng)中國(guó)版Sora出現(xiàn)的時(shí)候，我們是否準(zhǔn)備好了？” 在不久的將來(lái)，如美劇《黑鏡》這樣的故事情節(jié)即將成為現(xiàn)實(shí)，如何保護(hù)個(gè)人信息和隱私不被惡意使用和傳播？如何防止某些組織從中非法牟利？都需要有一個(gè)成熟完善的監(jiān)控體系。

結(jié)束語(yǔ)

追趕這一波潮流不僅僅在于技術(shù)突破，更在于我們對(duì)未來(lái)的準(zhǔn)備。國(guó)產(chǎn)大模型的發(fā)展不只是技術(shù)的競(jìng)爭(zhēng)，也是對(duì)世界認(rèn)知和文化的較量。

技術(shù)進(jìn)步帶來(lái)的不僅是便利，也有倫理、法律和社會(huì)挑戰(zhàn)。在追求技術(shù)創(chuàng)新的同時(shí)，我們更應(yīng)思考如何讓這些技術(shù)服務(wù)于社會(huì)，如何在科技創(chuàng)新與秩序之間找到平衡。

相信國(guó)產(chǎn)大模型會(huì)越來(lái)越好，更深度地參與和引領(lǐng)這場(chǎng)AI技術(shù)革命，成為推動(dòng)人類(lèi)文明進(jìn)步的重要力量。

返回列表

免费人成网站在线视频-亚洲av午夜精品麻豆av-日韩色大片在线观看-欧美日韩一区二区久久

國(guó)產(chǎn)大模型，什么時(shí)候能搞出 Sora ？

國(guó)產(chǎn)大模型，什么時(shí)候能搞出 Sora ？