免费人成网站在线视频-亚洲av午夜精品麻豆av-日韩色大片在线观看-欧美日韩一区二区久久

中國金屬材料流通協(xié)會,歡迎您!

English服務(wù)熱線:010-59231580

搜索

李彥宏:大模型對B端影響將超越互聯(lián)網(wǎng)

人工智能正在以前所未有的速度席卷全球,去年業(yè)界打響“百模大戰(zhàn)”,聚焦于AI的iPhone時刻,走到今年,大規(guī)模的落地應(yīng)用已經(jīng)成為新的競技場, AI應(yīng)用卷起來了,價格戰(zhàn)硝煙四起。

一系列的變化意味著大模型的商業(yè)化正在提速。圍繞大模型的下一步,業(yè)界展開了激烈討論:開源好還是閉源好?C端和B端誰先迎來AI應(yīng)用的爆發(fā)?超級應(yīng)用什么時候出現(xiàn)?大模型的落地還面臨哪些挑戰(zhàn)……近日,第一財經(jīng)總編輯楊宇東與百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏,硅谷101的聯(lián)合創(chuàng)始人陳茜展開一場對話,共同來探討大模型的未來之路。 

圖片“超級能干”的應(yīng)用比 “超級應(yīng)用”更重要

楊宇東:ChatGPT掀起的熱潮已經(jīng)一年多了,接下來超級應(yīng)用什么時候出現(xiàn)?國內(nèi)面向C端的大模型產(chǎn)品形態(tài)看起來大都是問答模式,未來有沒有可能產(chǎn)生差異化的競爭?

李彥宏:準確地講,我倒不是說一定在等待一個超級應(yīng)用的出現(xiàn),我更覺得,在基礎(chǔ)模型之上應(yīng)該能夠誕生數(shù)以百萬計的各種各樣的應(yīng)用,這些應(yīng)用有些是很小的領(lǐng)域,可能是大家不太容易想到的應(yīng)用,但是它對于那個領(lǐng)域的問題解決比以前好很多。

也有可能出現(xiàn)用戶量龐大、用戶時長非常長的類似于移動互聯(lián)網(wǎng)的超級應(yīng)用,現(xiàn)在還沒有看到能夠比肩移動互聯(lián)網(wǎng)時期超級應(yīng)用那樣的AI原生應(yīng)用。但我們已經(jīng)看到越來越多的在各種各樣場景、尤其是To B場景,利用大模型提升效率、產(chǎn)生更多的收入,或是能夠節(jié)省更多的成本的情況出現(xiàn)。

尤其是今年以來,我們看到在各行各業(yè)都有AI的應(yīng)用場景出現(xiàn)了,使人力大規(guī)模節(jié)省,或是效率大規(guī)模的提升。也許對于投資者、對于創(chuàng)業(yè)者,沒有覺得這很令人興奮,因為大家都在想,我能不能有一天從0到1做出一個人們想也沒想到過的東西,變成一個DAU10億的超級應(yīng)用,這個當然很重要,假以時日也一定會出現(xiàn)。但是目前已經(jīng)看到的,甚至是更重要的是大模型在各個領(lǐng)域、各個場景的應(yīng)用。

從百度文心一言的日調(diào)用量來看,已經(jīng)非常明顯了。我們在4月時曾公布過文心一言的調(diào)用量每天有2億次,到前幾天文心一言調(diào)用量已經(jīng)到了5億次,也就是說兩個月的時間,調(diào)用量翻倍

調(diào)用背后意味著什么?意味著它在給應(yīng)用產(chǎn)生價值。這種增長速度還是非常令人興奮的。大模型對于實體產(chǎn)業(yè),對于各行各業(yè)的提效降本這些作用現(xiàn)在已經(jīng)非常明顯了。

楊宇東:你更多是談到了垂直行業(yè),百度還是有很強C端基因的公司,作為一個普通的用戶會有什么樣很好的場景?

李彥宏:我覺得分兩類,一類是大家比較關(guān)注的,過去從來沒有過這些應(yīng)用而現(xiàn)在比較流行的,類似于ChatGPT,我們把它叫做ChatBot(聊天機器人),國內(nèi)每一個大模型公司,都會推出一個相應(yīng)的APP或網(wǎng)站來做ChatBot,它的作用也比較明顯,很多時候如果你丟給它一個很具體的問題,它會給你一個還不錯的答案,而且準確率也越來越高了。很多人逐步對ChatBot產(chǎn)生依賴。

對于現(xiàn)有的這些To C的應(yīng)用,其實信息增益作用非常大。我們在4月的時候公布過一個數(shù)據(jù),百度搜索有11%的搜索結(jié)果會由AI來生成的,這個比例還在不斷的提升。

也就是說,現(xiàn)有大家比較常見的應(yīng)用,其實也越來越多地在被大模型、被生成式AI所改造。另外一個例子,過去百度文庫大家是在上面找一些現(xiàn)成的文檔,今天經(jīng)過大模型改造之后,已經(jīng)更多地變成了生成式AI應(yīng)用,不管你想要產(chǎn)生什么樣的文檔,PPT、論文甚至是漫畫,它都可以根據(jù)你的要求來生成,而且它是收費的產(chǎn)品,今年以來已經(jīng)有大約2600萬付費用戶。你如果說用超級應(yīng)用的標準來看,它也沒有到超級應(yīng)用的水準,但要是看它實際產(chǎn)生的價值,有那么多人愿意為這個產(chǎn)品來付費,還是很厲害的。這些產(chǎn)品都是過去已經(jīng)存在的,只是經(jīng)過了大模型改造之后,它的能力跟以前完全不一樣,人們對它的認知也在不斷地迭代、加深。

陳茜:我同意您最近在多個場合強調(diào)的,去卷AI的原生應(yīng)用,這樣大模型才有意義。同時我也有一點小困惑。比如說OpenAI的GPTs在8個月之前就推出來了,當時大家都會覺得,我們AI應(yīng)用時刻要爆發(fā)了,但是8個月之后的今天,我們看到還沒有爆發(fā),可能很多應(yīng)用出來也不太盡人意,最近最火的就是AI搜索perplexity,現(xiàn)在是2000萬用戶的量級,也還沒有到所謂的Super APP、Killer APP,我的疑惑在于,如果基于GPT4的模型能力,是不是我們現(xiàn)在還沒有到去卷應(yīng)用的時候,這個時刻還沒到?

李彥宏:對,剛才你提到了GPT,以及perplexity,還是我剛才說的第一類,過去從來沒有過的東西從0到1去做,這樣的超級應(yīng)用確實現(xiàn)在還沒有出現(xiàn)。即使ChatGPT的DAU也沒有過億,算不上一個真正的超級應(yīng)用,但是對于現(xiàn)有產(chǎn)品的改造,無論是中國也好美國也好,我們都看到了實實在在的增益,比如美國微軟的Copilot已經(jīng)收到了很多費用。美國更多的是To B的行業(yè),Palantir、Snowflake這些軟件都是通過被大模型、被生成式AI加持之后,業(yè)績得到實實在在的增長。

所以從這個意義上講,大模型應(yīng)用其實已經(jīng)逐步在浮現(xiàn)出來,它對于現(xiàn)有業(yè)態(tài)的改造作用,比從0到1顛覆作用更早到來、更明顯,甚至我覺得也是能夠創(chuàng)造更多價值的。

以前薩提亞說,過去互聯(lián)網(wǎng)叫做AutoPilot,想要什么東西,你自己就把這個結(jié)果給弄出來了,現(xiàn)在的生成式AI叫Copilot,它實際上是人和機器共創(chuàng)的過程,這個過程一開始大家覺得沒有那么性感,但是它對于人的工作效率的提升、成本的下降,對于打開新的可能性,產(chǎn)生的促進作用其實是比那些從0到1要更大。

只是大家好像覺得說沒有新鮮感,或者它更多誕生在生產(chǎn)力場景,受眾群體不會過億過十億,尤其在C端,在公眾層面的體感沒有那么集中,這可能是大家現(xiàn)在一直想尋找一個SuperAPP的原因。

楊宇東:你的問題是挑戰(zhàn)Robin,Robin說要卷起來,你說怎么沒看到卷。聽Robin講完我總結(jié)下來,“超級”這兩個字一個是數(shù)以百萬計的應(yīng)用已經(jīng)開始起來了,二是所謂的超級反而是在垂直、局部的領(lǐng)域,有非常顯著的加速度或者是增益。

陳茜:或者是“超級”的定義在互聯(lián)網(wǎng)時代跟在AI時代是不一樣的。

李彥宏:是不一樣的。在互聯(lián)網(wǎng)時代可能是某一個單一的從0到1,或者是到100這樣的應(yīng)用,今天這種所謂的超級應(yīng)用,它對現(xiàn)有場景的一種加持,這種加持還在早期,我必須得承認,它逐步會改變現(xiàn)有產(chǎn)品的形態(tài)。

我再舉一個例子,小說創(chuàng)作、網(wǎng)文是在國內(nèi)特別火的行業(yè),過去就是靠作者自己的能力和想象不斷更新一篇小說,效率是很低的。現(xiàn)在有了大模型的加持,基本上有一個構(gòu)思,它就會給你相應(yīng)的文檔,根據(jù)你的想法不斷調(diào)整。在用戶看來,仍然是在讀一篇網(wǎng)文,但是小說的生產(chǎn)成本、生產(chǎn)效率,它的內(nèi)容豐富度、可讀性、優(yōu)良率等等,都跟以前不一樣。這樣的例子,其實我們在幾乎任何行業(yè)都能夠看到。

楊宇東:我們前面聊的總結(jié)一下叫卷應(yīng)用,接下來還有一個關(guān)鍵詞叫智能體,你說過好多次,AI時代最看好的是智能體,但是目前來看好像也沒有特別強大的爆發(fā)。你為什么認為智能體是AI時代未來的趨勢呢?

李彥宏:我覺得智能體正在爆發(fā),只是說它現(xiàn)在基數(shù)還比較小的時候,大家的體感沒有那么強烈。但是你要看業(yè)界大模型公司,都在做智能體,都在看好智能體。

智能體為什么代表未來?基礎(chǔ)模型本身是需要靠應(yīng)用才能顯現(xiàn)出來的價值。智能體就是一個幾乎可以是放之四海而皆準的基于大模型的應(yīng)用根據(jù)我自己的場景,我設(shè)定一個角色人設(shè),連編程都不用,只要把我想要做的事情跟它講清楚,有時候要把自己的私有知識庫對接進來,或者說把自己做事情的套路給它說清楚,專業(yè)術(shù)語叫做工作流,把工作流套進去后它就是一個非常有用的、跟基礎(chǔ)模型不一樣的東西。今天大多數(shù)AI的原生應(yīng)用,用智能體的方式都可以做出來,做出來之后效果也不錯。

由于它的門檻足夠低,意味著越來越多的人可以做出他想要的智能體來,這有點像90年代中期的互聯(lián)網(wǎng)網(wǎng)站,網(wǎng)站你可以把它做得非常復(fù)雜,但是仍然讀書的大學(xué)生,也可以做一個自己的HomePage,鏈接上常用的幾個網(wǎng)站,就是他自己的網(wǎng)站。由于做網(wǎng)站很簡單,所以在90年代中期到末期誕生了數(shù)以百萬計的網(wǎng)站,經(jīng)過大浪淘沙,最終會出來一些非常優(yōu)秀的網(wǎng)站,像Google、Facebook。早期你可能看到的都是,這些網(wǎng)站怎么亂糟糟的,一個大學(xué)生就能做一個網(wǎng)站有什么價值?但是你必須得門檻足夠低的時候,讓更多人進來,他們發(fā)揮聰明才智,指不定哪條路跑通了,它就是一個Supper APP、這就是為什么,我覺得智能體代表未來,我特別看好的一個新興的業(yè)態(tài)

陳茜:在美國硅谷智能體AI Agent也是特別重要的概念,在業(yè)界大家對AI Agent,它的定義還是有一點不同的探討,有些人說比如說GPTs,也都是一些智能體,有些人會說,可能更加高級一點的Agent才算智能體,要調(diào)取不同的工具、要成為一個虛擬世界的機器人它可能才叫Agent,你對Agent的定義是什么樣子的?

李彥宏:我剛才也講了,我首先要考慮門檻要足夠低。就一個小白,比如說大一的學(xué)生,他也可以很方便地能夠制作一個智能體出來,當然在此之上,可以有各種各樣比較fancy的玩法,剛才你講的調(diào)用工具、反思、長期的記憶等等,這些能力會逐步加進去,這跟90年代時候的網(wǎng)站誕生過程也有類似之處。我們一開始的網(wǎng)站都是很簡單的,后來說我可以用Java把一些動態(tài)的東西放在網(wǎng)站里,后來也可以加上cookie……一旦有越來越多的人在生產(chǎn)網(wǎng)站,技術(shù)就會跟進說,你有什么需求,我去解決你的問題。

Agent是一樣的,不是說用了最先進的能力之后才叫一個AI Agent,我反而覺得我們要把門檻降得足夠低,讓大家覺得我也可以搞一個AI Agent,進來之后隨著時間的推移,隨著你遇到新問題,解決問題的過程,會把各種各樣最先進的技術(shù)用進來。

說實話,我認為現(xiàn)在AI Agent用到的這些能力仍然是非常初級的。未來還會產(chǎn)生我們今天想也想不到的Agent能力,但是這些能力的誕生,反而要依賴數(shù)以百萬計的開發(fā)者,去開發(fā)各種各樣的應(yīng)用,在他們使用的過程當中產(chǎn)生新的需求,這些需求被解決的過程就是一個創(chuàng)新的過程,就是AI Agent進化的過程,這個我還是非常期待的。

楊宇東:這個特別像我們一個報道,在法律領(lǐng)域,好多創(chuàng)業(yè)公司想說,我要用AI做一個個人法律助手,但是一直沒有好的產(chǎn)品,真正拿到融資的AI法律產(chǎn)品還是面向企業(yè)客戶的適合合同審查場景的產(chǎn)品,因為這個場景足夠標準化而且有人買單。所以像這種一開始的初級產(chǎn)品,越做越復(fù)雜,越做越好的時候,可能最后像Robin說的,真正意義上的個人法律助手的產(chǎn)品就出現(xiàn)了。

陳茜:百度有什么比較有意思的AI Agent的案例可以給我們分享一下嗎?

李彥宏:國內(nèi)高考是一個非常大的事件,學(xué)生、家長都非常重視。過去大模型在干什么呢?高考有個作文題,我們用大模型來寫一個作文,看它能得多少分。其實你想一想,這個東西在哪用呢?不可能讓一個考生帶著大模型去參加高考嘛。但是高考完了之后,你要估分、報志愿,選學(xué)校和專業(yè),可能還有人在乎宿舍幾人間,學(xué)校有沒有游泳池,或者說哪個專業(yè)更適合我未來發(fā)展,每個人的情況都是不一樣的,問題也都是不一樣的。這種情況下,哪有一個全能的輔導(dǎo)老師可以告訴你說,你最適合的是哪個學(xué)校哪個專業(yè)?但是AI Agent就可以干這個事情。我們開發(fā)了一個高考填報志愿的AI Agent。在高峰時期,一天有200萬人在使用。高考考生也就1000萬左右,一天使用的人數(shù)就有200萬人,足見大家對這個東西的認可度和依賴度還是非常高的。

再比如剛才講到法律,我們還有一個智能體的法行寶,它就是一個法律援助方面的AI Agent,我有什么訴求,跟我類似的判例都是哪些,我該怎么去寫一個法律文書,全都是不一樣的。過去大家來百度或者其他地方去搜索,都是找世界上已經(jīng)存在的內(nèi)容文檔、視頻到底是什么樣子,沒有專門為這個人在這個時刻、這個地點、環(huán)境生產(chǎn)一個文檔或內(nèi)容,而今天的AI尤其是智能體就可以做到,然后根據(jù)你的情況生成一個法律文書,這樣的例子非常多。

圖片大模型對B端影響將超越互聯(lián)網(wǎng)

楊宇東:你說過大模型對于B端,對于這些領(lǐng)域的影響會超過互聯(lián)網(wǎng),接下來你認為,哪些垂直領(lǐng)域會受大模型的影響最大?

李彥宏:其實你想一想,互聯(lián)網(wǎng)對C端的改造,我們都是感同身受的,是非常徹底的,是顛覆性的。但是互聯(lián)網(wǎng)對B端的改造,其實我覺得一般,用的技術(shù)比較簡單,產(chǎn)生的增益也沒有那么明顯。

但是大模型確實不一樣,剛才提到的那些應(yīng)用,比如小說創(chuàng)作,讀小說叫做C端,小說創(chuàng)作就可以當做是B端,法律援助其實在幫助律師在提升效率。我們接觸到的一些能源電力行業(yè),生產(chǎn)制造業(yè)等都有類似的需求。還有像現(xiàn)在國內(nèi)電動車卷得也很厲害,車里對話系統(tǒng)很多也在用文心大模型。但對于百度來說,這就是一個To B的應(yīng)用,我們不直接提供給用戶,它是經(jīng)過了OEM、經(jīng)過了車廠集成之后把應(yīng)用提供給了終端消費者。這種事情非常多,而且我們看調(diào)用量如果上得很快,這就說明我們的客戶需要這些東西,B端靠著大模型和AI原生應(yīng)用產(chǎn)生了價值。

楊宇東:最近我跑制造業(yè)比較多,很多企業(yè)家覺得未來AI對于高端制造業(yè)、智能制造是一種革命性的突破,但是一直搞不明白,比如說通用大模型和我自己的行業(yè)垂直領(lǐng)域、垂直大模型,將來到底是什么樣的關(guān)系?你說到的OEM,到底是什么樣的供應(yīng)商,和平臺型的大廠商之間形成什么樣的業(yè)務(wù)鏈條,這個問題是制造業(yè),尤其是先進制造業(yè)特別關(guān)注的。

李彥宏:對!這個問題確實很重要。實際上涉及到大模型在各個垂直的場景里怎么用。這件事情我們也經(jīng)過了探索過程,最初我們的想法是把這個基礎(chǔ)模型做得越來越強大,大家叫通用人工智能,在什么場景我都能做得很好。后來發(fā)現(xiàn)這件事情沒有那么容易,每個場景都有它自己的道要求也不太一樣。有些場景下,大模型思考兩分鐘再給我結(jié)果也OK,只要結(jié)果準確、全面就可以了。但是有些場景,如果你一秒鐘不出結(jié)果,用戶就放棄了。

這兩個場景對大模型要求是不一樣的,今天即使是最強大、反應(yīng)最快的模型還不能做到。所以當應(yīng)用場景需要反應(yīng)快的時候,我們需要更小的模型,它由于沒有大模型通用的能力,在垂直場景當中還要做精調(diào),就是做SFT,把行業(yè)的數(shù)據(jù)怎么去灌進去,再經(jīng)過各種各樣的調(diào)教,在特定場景里的效果跟大模型差不多。

類似這種場景,我們也見了很多、去年10月份,我們發(fā)了文心4.0之后,主要精力就是根據(jù)最強大的模型,去裁剪各種體量的小模型。比如十億、百億、千億量級的模型,有的也許擅長角色扮演,有的模型也許擅長邏輯推理等等,根據(jù)客戶的不同使用場景不同要求,出來各種各樣的模型。這些模型的大多數(shù)速度都比EB4要快,推理成本更低,這種應(yīng)用是大家更愛用的

即使到今天,我剛才講的5億的調(diào)用量,調(diào)用量最大的一定不是最強大的模型,你要看市場需求的話,規(guī)模更小一點的模型,市場需求量是更大的。

楊宇東:幫我們介紹一下,這種大模型在B端的應(yīng)用有哪些比較成功的商業(yè)案例?

李彥宏:比如說電商的數(shù)字人直播,通過大模型來生成一個直播的話術(shù)。比如說我要賣一個營養(yǎng)品,是在哪一年、哪個大學(xué)教授做了多少實驗出來的結(jié)果,這些數(shù)據(jù)自然人很難去記住,但這些數(shù)據(jù)恰恰能夠很好地說明營養(yǎng)品到底有什么作用。這些內(nèi)容靠數(shù)字人把它表達出來,很多時候比真人的直播效果反而要更好。

楊宇東:還有一個有趣的問題,我們這兩年主要是生成式AI大行其道,比如金融、醫(yī)療、法律這些領(lǐng)域,C端和B端直接有非常好的交互場景,但是大家也開始擔(dān)心了,生成式AI有幻覺問題。尤其做金融的,不大敢讓AI幫助客戶來做決策,一旦碰到嚴謹性問題的時候,怎么破解這個難題?

李彥宏:其實我們只要回顧一下過去這一年半的時間,大模型發(fā)展的歷程,我相信你的信心會大增。一年前,如果你跟大模型進行交互,去問它一些問題會經(jīng)常發(fā)現(xiàn)幻覺問題。今天你在用的話,尤其是用最大規(guī)模,最強大模型的時候,已經(jīng)很少出現(xiàn)幻覺問題了。

因為隨著技術(shù)不斷地提升,一開始純粹于原教旨的Transformer去做出來的大模型,確實是非常難避免幻覺,要解決這個問題,就要在原來Transformer架構(gòu)上增加一些東西,專業(yè)詞語叫RAG,稍微借助一點工具就可以消除這樣的幻覺,隨著你使用這種工具的能力越來越強,你就會發(fā)現(xiàn),在各種場景下,幻覺是越來越少的。

當然,今天這種生成式人工智能更像是一個Copilot,在特別嚴肅,對準確度要求特別高的場景下,我們還不能讓它全部自動去實現(xiàn),還要靠人把最后一道關(guān),這樣的話,一方面效率提升,另一方面,在準確度上,在消除幻覺上也能夠起到比較重要的作用。其實我們也必須承認,人也有錯的時候,甚至有時候這個錯誤率更高,我們也不能夠完全避免,

陳茜:現(xiàn)在企業(yè)們是否愿意去為AI去付費,現(xiàn)在你在跟一些企業(yè)客戶交流的時候,他們的態(tài)度是什么樣子的?

李彥宏:當你處在市場經(jīng)濟環(huán)境當中,這些企業(yè)其實非常理性。尤其是中小企業(yè)的賬是算得非常精的,如果這件事情能夠讓我降本增效,能夠讓我賺到更多的錢,那我就會用它,如果不能,你再吹破天我也不會用。其實市場會告訴你這個大模型到底有用還是沒用,我們看到調(diào)用量的迅速提升,確實是因為在用戶側(cè),在客戶側(cè),它為企業(yè)確實產(chǎn)生了降本增效的作用。

我再舉個例子,比如說在招聘場景,很多時候雇主要找一個具備什么技能的人,對于技能的描述千差萬別,過去是HR坐在那兒,一份一份簡歷篩查,面試100個人,最后篩出來10個人來,再進行下一步的面試,效率是非常非常低。但是大模型進來之后,它可以非常明顯地去提升這方面的效率,有了這樣的場景之后,你去算一算模型的推理成本,其實幾乎是可以忽略不計的。尤其在國內(nèi),現(xiàn)在大模型價格戰(zhàn)是非常厲害的,所以像一些比較輕量級的模型,百度的輕量級模型都是免費的,這個免費不僅僅指的是模型免費,實際上算力也送你了,你本來要有電腦,我得要有帶寬等等,這些都沒有了,你只要來用就好。

陳茜:有一個比較好奇的問題,在互聯(lián)網(wǎng)時期,SaaS在中國To B沒有做起來,為什么您會覺得在AI時期,這個AI as a service可以在中國做起來呢?

李彥宏:我覺得在SaaS時期,之所以沒有做起來,更多的是因為比如說像互聯(lián)網(wǎng)大的平臺,既做了To C的事,也做了To B的事,比如今天大家都到電商平臺去購物,平臺商家所需要的To B的能力電商平臺都替他做了。在某種意義上講,其實中國并不是沒有這樣的需求,而是說這些需求,被更大的平臺所滿足掉了。

但是在AI時代,情況又發(fā)生了變化,它不是從0—1的,恰恰是對于現(xiàn)有業(yè)態(tài)的增強。當現(xiàn)有業(yè)態(tài)被增強、效率越來越高的時候,它就更能夠抵御類似于像互聯(lián)網(wǎng)平臺對它這種業(yè)務(wù)的侵蝕。我倒覺得AI的這種To B的需求,在中國會比互聯(lián)網(wǎng)To B的需求要大很多。

圖片開源是一種“智商稅”

楊宇東:我們還感興趣一個問題,就是其實現(xiàn)在行業(yè)里面爭議很大,開源還是閉源,現(xiàn)在看到開源的大模型越來越多了,而且甚至有些能力都不亞于GPT4了,就這個問題你怎么看,還堅定走閉源路線嗎?

陳茜:在國際上對開源閉源大家也爭論得很厲害,馬斯克吐槽OpenAI叫Close AI好了,我們看到馬斯克的XAI也開源了,為什么你對閉源這么堅持?

李彥宏:我覺得開源其實是一種智商稅。仔細想一想我們?yōu)槭裁匆龃竽P??是它能夠有?yīng)用,這些應(yīng)用在各種場景下能夠為客戶為用戶提升效率、降低成本。所以當你理性地去想大模型能夠以什么樣的成本給我?guī)韮r值的時候,你就會發(fā)現(xiàn)你永遠應(yīng)該選擇閉源模型無論是ChatGPT也好,文心一言也好,以及各種各樣的模型,你看一下它的平均水平,一定是比這些開源模型要更強大的,推理成本也一定是比開源模型更低的。

尤其在國內(nèi)的話,我們連算力都送你了,所以當你想要一個開源模型的時候,你得把這個模型拿過來根據(jù)場景去做SFT,很可能還要做安全上的對齊,根據(jù)場景去準備各種各樣的數(shù)據(jù),做一輪輪的迭代,最后由于是你獨有的模型,沒有辦法跟別的應(yīng)用去共享算力,最高峰的時候用多少那就要準備多少算力,這是非常非常不經(jīng)濟的。

反過來你用一個閉源的模型,算力可以和大家共享,這些能力在同等的參數(shù)下,閉源模型一定比開源模型的力量更強。同等能力下,由于閉源模型可能參數(shù)規(guī)模會更小一點,它的推理成本就會更低。所以長久來看,我覺得閉源模型使用一定會超過開源模型。

當然,我也不能說開源模型沒有存在的價值,其實比如說從學(xué)術(shù)研究的角度,或者是高校學(xué)生想拿來練練手……在這些場景下,我覺得有它的價值,但如果你是一個企業(yè),要的就是大模型能夠帶來價值上的增益,只要一算賬,就會發(fā)現(xiàn)開源模型是沒有機會的。

陳茜:閉源大模型再加公有云集合不同的閉源、開源模型供客戶去調(diào)用,你用這樣的一套打法,對To B客戶來說有什么考量嗎?

李彥宏:To B的客戶,他要選擇的是一個性價比最好的模型。一方面,模型要對他的應(yīng)用產(chǎn)生價值,另外一方面,成本要足夠低。很多時候,你看著有用,一算成本不劃算,客戶就放棄了。這是為什么我剛才講,開源模型打不過閉源模型。你只要理性的去看待,你的收益是啥,你的成本是啥,你就會發(fā)現(xiàn),最好還是去選擇閉源模型。當然,閉源模型不是一個模型,它是一系列的模型,根據(jù)你的使用場景去平衡一下,要多好的效果,要多快的推理速度,要多低的成本。模型有非常多的變種,可以根據(jù)用戶的需求,讓他來做選擇。
閉源模型還有一個開源模型不具備的優(yōu)勢:這些相對來說規(guī)模更小的模型,都是從最大最powerful的模型裁剪出來的,
裁剪出來這些更小規(guī)模的模型,仍然比那些同樣規(guī)模的開源模型要效果更好。 

圖片價格戰(zhàn)不可避免

楊宇東:用戶最終的選擇還是會看性價比。現(xiàn)在才一年多的時間,價格戰(zhàn)已經(jīng)開始打起來,閉源大模型的API調(diào)用的費用越來越低了。在這樣一個商業(yè)環(huán)境之下,大模型靠推理收費的商業(yè)模式未來成立不成立?以后我們市場再去比拼大模型的話,會比拼哪些點?

李彥宏:說實話,我們也在內(nèi)部不斷的在思考,在討論這個問題,價格戰(zhàn)我覺得幾乎是不可避免的,在中國互聯(lián)網(wǎng)干了這么長時間,其實已經(jīng)對價格戰(zhàn)非常熟悉了,但就像你講的,確實它來的比我想象的還要更早一點,這么早就開始把這個價格打到了幾乎不可思議這種低的地步。但我覺得某種意義上講也不是壞事兒,當你足夠低,甚至免費的時候,就會有更多的人有積極性來嘗試在大模型基礎(chǔ)上去開發(fā)各種各樣的應(yīng)用。也就是說大模型對于各行各業(yè)的滲透速度會更快。

你都免費了,或者說價格足夠低,大模型公司靠什么賺錢?我是這樣想的,大模型天花板還是很高的,技術(shù)的天花板,在今天我們還是對于大模型的能力有很多不滿意的地方,仍然需要很多非常優(yōu)秀的技術(shù)人員,需要很多的算力,需要很多很多的數(shù)據(jù)才能夠訓(xùn)練出來下一代大模型。

所以最終大家是要去拼誰的技術(shù)更好,你的技術(shù)好,你為客戶產(chǎn)生了更好的價值,將來你還是能夠收到費的。今天之所以把模型價格打到足夠低,是因為現(xiàn)在模型的能力其實還沒有到最好。那沒有到最好的時候,大家都差不多的時候,那就拼價格,誰的價格低就用誰的。時間長了之后,市場本身會回歸理性,同樣的效果,就是當我的成本比你低的時候,那你打價格戰(zhàn)你肯定打不過我,時間久了之后你就退出了。

這個過程我們在百度網(wǎng)盤上是經(jīng)歷過的。那些年大家在卷網(wǎng)盤的時候,今天給你10G的免費空間,明天你給我100G的免費空間,后天說無限空間永久免費。當你說無限空間永久免費的時候,大家也會說這怎么能夠持續(xù)呢? 后來慢慢地一個一個退出。為什么百度沒有退出呢?因為我敢打,我的技術(shù)好,存儲成本低。

陳茜:你覺得價格戰(zhàn)還會持續(xù)多久?

李彥宏:這個很難講,現(xiàn)在有些創(chuàng)業(yè)公司是玩家,也有很多非常大型的這種互聯(lián)網(wǎng)平臺公司是玩家,燒錢的話,理論上講是可以燒很長時間的,但我覺得燒錢不是這件事情的本質(zhì),本質(zhì)仍然是誰的技術(shù)更好,誰的效率更高。當你的技術(shù)好、效率高的時候,你就不怕去打價格戰(zhàn),所以多長時間都OK,最終它會是優(yōu)勝劣汰的一個過程。

陳茜:價格戰(zhàn)過后,你覺得未來在中國市場會是一個贏家通吃的局面嗎?還是說價格戰(zhàn)之后會剩下幾家主要的玩家?

李彥宏:這次生成式AI對于整個IT技術(shù)棧是一個大變革,我們一般認為過去的IT技術(shù)棧就是芯片層、操作系統(tǒng)層、應(yīng)用層或者軟件層這三層。到生成式AI之后,我們認為IT的技術(shù)棧變成了四層,芯片層、框架層、模型層、應(yīng)用層,我認為在每一層可能都會誕生至少2—3個大的玩家。應(yīng)用層可能數(shù)以百萬計,甚至數(shù)以千萬計的各種各樣的應(yīng)用都會出來,也會逐步地出現(xiàn)超級應(yīng)用。超級應(yīng)用不會很多,可能就三五個。模型層我覺得也許兩三個就足夠了,因為最后還是大家比拼的還是效率。

圖片Scalinglaw短期內(nèi)不會被顛覆  

楊宇東:我們談到規(guī)模和能力,最近開始有不同的聲音出來了,確實看很多行業(yè)做一些小的模型的速度更快,效率更高,大模型的Scalinglaw會不會這么快又被顛覆掉?

李彥宏:我覺得Scalinglaw本身可能還會有若干年的生命周期,但與此同時,會在此之上會疊加出來各種各樣的創(chuàng)新。剛才講到智能體,仍然是基于Transformer這類大模型在做,但未來再過一兩年還會出現(xiàn)什么新的技術(shù)創(chuàng)新,在此基礎(chǔ)上再去疊加,我們也不知道,大家都在探索。換句話說,我覺得Scaling law短期之內(nèi)倒不會被顛覆,但是在Scaling law之上會疊加出來很多我們現(xiàn)在可能還無法想象的創(chuàng)新。

陳茜:那你覺得接下來大家在卷應(yīng)用之余,會不會開始卷一些中小模型,在國際上比如Mistral這樣的中小模型也是受很多開發(fā)者歡迎的。百度在中小模型上,還有一些模型蒸餾上有什么的計劃?

李彥宏:我們看到的真實需求,確實在絕大多數(shù)情況下都不是最大的模型,它都要求這個模型變小。變小意味著什么?速度快,成本低,當我干這個事兒能帶來每年100萬的增益,但一算最大的模型要120萬的成本,那我肯定不干了。那我給大模型公司的要求就是要把成本降到80萬,甚至降到8萬。那我們就得想,怎么把最強大的模型蒸餾到足夠小,也就是成本足夠低的時候,仍然能夠滿足特定場景的需求。我覺得這方面閉源模型仍然有優(yōu)勢,因為閉源有最強大的基礎(chǔ)模型,它根據(jù)這個模型蒸餾或者裁剪出來的小模型比那些開源模型更有優(yōu)勢。開源模型不管是用更大的開源模型來蒸餾還是怎么樣,但當你基礎(chǔ)沒有別人好的時候,做出來的東西在競爭力上會有劣勢。這方面我們看到真實的需求確實非常多,也認為這方面的機會仍然在閉源不在開源。

陳茜:GPT—5一直在延后,擔(dān)憂的聲音越來越高,比如5—10萬億這樣的參數(shù)加上去,擔(dān)心它的效果并沒有實現(xiàn)躍升,是不是會打擊一些人對Scalinglaw的信仰?也就是我們的AGI可能沒有辦法用Scaling law的方式實現(xiàn)了,你對這個有擔(dān)憂嗎?

李彥宏:我不是很擔(dān)心這件事情,我覺得大家應(yīng)該更關(guān)注應(yīng)用,而不是關(guān)注基礎(chǔ)模型,某種意義上講,基礎(chǔ)模型迭代速度稍微放緩一點不是壞事兒,今天的這些應(yīng)用開發(fā)者,有一個相對穩(wěn)定的基礎(chǔ)模型來開發(fā)應(yīng)用其實效率更高。如果模型天天在那兒練,他每天都要重寫一遍過去的代碼,是很累的。但是在現(xiàn)有基礎(chǔ)模型上不斷去做微調(diào),去做一些漸進式的迭代和創(chuàng)新,其實是一直在發(fā)生的。

但是長遠來講,我確實認為下一代的大模型一定會比現(xiàn)在這一代模型強大得多。什么時候推出來我不是很著急,我們應(yīng)該更多地去看一下真實的市場需求是什么。如果我們認為AGI 10年都達不到,也就是說它有擅長的和不擅長的地方,如果它擅長的恰好不是市場需求的,那這個意義不大;如果他不擅長的恰好是市場需求的,那我們浪費了很多資源去做一些不該做的事情,這是為什么我更關(guān)注應(yīng)用。當市場需求不是很清楚的時候拼命往前跑,去做一個名義上更強大的模型,其實很有可能是會走彎路,是浪費資源。

楊宇東:你之前說距離AGI還有10年時間。你個人認為AGI實現(xiàn)的標準是什么?還有哪些路徑可以讓我們更快地通向AGI?

李彥宏:確實業(yè)界沒有一個標準答案。以前大家覺得通過圖靈測試就實現(xiàn)AGI了,實際上現(xiàn)在大模型已經(jīng)通過了圖靈測試,但是人們所說的AGI不只是通過圖靈測試。在我的心目中,AGI是說機器或AI能夠具備人在任何場景下所具備的能力,這是一個很高的要求。

我們做無人駕駛有11年的時間了,仍然不能說這個技術(shù)成熟,這還是一個專用場景,AI都做不到非常的成熟。所以說真正要實現(xiàn)AGI,我認為確實是還需要很多很多年。

但是就是業(yè)界有人說AGI可能再過2年的時間了,或者再過5年,說什么的都有,但是我自己的判斷是10年以上,也許10年,也許20年,也許更長的時間。很多人在講AGI是一種信仰,當你把它當做一種信仰的時候,誰的信仰會明年就實現(xiàn)?這是自相矛盾的。如果是一個信仰,它就是你值得為之長期奮斗的一個目標

楊宇東:好的,最后輕松一點,您能不能推薦一下最近讀的一本書或者論文,關(guān)于AI方面特別有啟發(fā)的,給我們大家推薦一下。

李彥宏:我最近沒有怎么讀論文或者是書。首先書太慢了,大模型技術(shù)包括大家認知迭代的速度非常非???,等到成書的時候,基本上已經(jīng)過時了。為什么論文我也讀得少呢?一方面我們公司有一大堆人都在讀論文,我很多時候就是讀一些摘要,時間有限,每天出來的新東西實在是太多太多了。另外一方面我也覺得其實我們應(yīng)該更關(guān)注市場信號,更關(guān)注真實的需求在哪里,而不是理論又往前推進了多少。如果大家都靠理論去指導(dǎo)實踐的話,根本就不會有飛機出來,是飛機出來之后,大家研究為什么比空氣重的東西還能在天上飛,其實有一個理論叫做空氣動力學(xué)。很多時候?qū)嵺`是反而是領(lǐng)先理論的,我們要更多地看市場有什么需求,我們怎么去更高效地去解決這些真實的市場需求。

楊宇東:對,它是種基本的原動力,來自于實踐,來自于需求。推動了理論,推動了科技的發(fā)展。

李彥宏:沒錯。

楊宇東:非常感謝一個多小時的時間,我們演播室對面就是徐匯濱江,非常漂亮,告訴大家一個很讓人開心的消息,馬上會建成一條纜車的索道,橫跨江兩岸。我們也期待以百度為代表的優(yōu)秀公司,早日為我們建成人類通向未來的AI橋梁,謝謝。

李彥宏:好,我們努力,謝謝。

陳茜:非常感謝。


返回列表

亚洲区二区三区香蕉区| 亚洲精品综合在线二区| 国产一区二区三区精品自拍 | 久久人午夜亚洲精品| 国产女明星换脸视频在线| 四虎在线观看免费资源| 色噜噜色一区二区三区| 国产在线精品成人欧美| 亚洲av香蕉综合一区 | 久久日韩一区二区三区| 国产精品久久久久久久av三级| 亚洲熟女综合色一区二区三区露脸| 久亚洲精品色婷婷国产熟女| 日本精品三级一区二区视频| 国产成人黄色自拍视频网站| 白丝美女露内裤十八禁| 亚洲中文字幕永久一区| 久久一亚色院精品全部免费| 日本熟妇人伦人视频在线观看| 国产欧美日韩经典一区| 日韩视频午夜在线观看| 黄片免费在线播放欧美| 成人区人妻精品一区二区不卡| 亚洲综合久久国产一区二区| 久久男人亚洲第一网站 | 日本成人高清一区二区| 久久热久久热精品视频| 超清中文乱码字幕在线观看| 麻豆国产午夜在线精品| 我的大逼丰满毛茸茸视频| 亚洲无综合素人在线观看| 女同专区中文字幕另类一区| 三十四十五十日本老熟妇| 国产极品尤物美在线观看| 亚洲奇米精品一区二区| 亚洲最新精品一区二区| 日本加勒比官网中文字幕| 人妖另类综合视频网站| 刚为人妻的黑丝美女少妇| 日本激情诱惑免费在线播放| 五月综合激激情狠狠做五月|