作者丨葉蓁?
編輯丨王偉凱
出品丨深網(wǎng)·騰訊新聞小滿(mǎn)工作室
AGI大模型,依然是2024年最炙手可熱的風(fēng)口。自2016年開(kāi)啟人工智能元年,AI產(chǎn)業(yè)已經(jīng)歷好幾輪洗牌,借著ChatGPT的東風(fēng),通用人工智能大模型創(chuàng)業(yè)再次被置于聚光燈下。
在第六屆“北京智源大會(huì)”上,百川智能CEO王小川、智譜AI CEO張鵬、月之暗面CEO楊植麟、面壁智能CEO李大海和智源研究院院長(zhǎng)王仲遠(yuǎn)進(jìn)行了對(duì)話。
怎么定義AGI,業(yè)界并沒(méi)有達(dá)成共識(shí)。在這場(chǎng)對(duì)話中,王小川認(rèn)為,大模型是通往AGI之路的基石。楊植麟指出:“不斷規(guī)?;P?,不斷做更好的壓縮,能產(chǎn)生越來(lái)越多的智能。當(dāng)然,這個(gè)過(guò)程會(huì)有很多挑戰(zhàn),最大的挑戰(zhàn)是有一些數(shù)據(jù)并不一定有那么多,也可能根本不存在這樣的數(shù)據(jù)?!?/P>
關(guān)于近期的熱點(diǎn)事件,斯坦佛LlaMA團(tuán)隊(duì)抄襲了面壁智能的MiniCPM模型,面壁智能CEO李大海則回應(yīng),“我們完全沒(méi)有想到我們的工作會(huì)以這種方式出圈,挺惶恐的。”
中國(guó)的大模型產(chǎn)業(yè)經(jīng)過(guò)一年的迭代和發(fā)展,誕生了大模型“五虎”,創(chuàng)始人則成為明星創(chuàng)業(yè)者,會(huì)議結(jié)束后,月之暗面CEO楊植麟被參會(huì)者層層圍住。熟悉楊植麟的人調(diào)侃,“一個(gè) i 人,被一群 e 人圍住了”。
以下是王仲遠(yuǎn)與王小川、楊植麟、李大海、張鵬的現(xiàn)場(chǎng)對(duì)話實(shí)錄,經(jīng)《深網(wǎng)》編輯整理:
大模型是通往AGI的基石
王仲遠(yuǎn):各位是頭部大模型公司的CEO,請(qǐng)教各位大模型是否是通往AGI之路的基石?有人說(shuō)它依然是數(shù)據(jù)的壓縮,對(duì)產(chǎn)業(yè)界非常有價(jià)值,但并不一定能夠通往AGI。
楊植麟:我們認(rèn)為大模型是第一性原理,需要不斷提升模型的規(guī)模。它確實(shí)本質(zhì)上是一個(gè)壓縮,但這個(gè)壓縮可以產(chǎn)生智能,不斷規(guī)?;P停粩嘧龈玫膲嚎s,它能產(chǎn)生越來(lái)越多的智能。當(dāng)然,這個(gè)過(guò)程中會(huì)有很多挑戰(zhàn),最大的挑戰(zhàn)是有一些數(shù)據(jù)并不一定有那么多。在數(shù)據(jù)沒(méi)有那么多的領(lǐng)域,或者假設(shè)你在最后要做出來(lái)一個(gè)比人類(lèi)更好的AI,可能根本不存在這樣的數(shù)據(jù),因?yàn)楝F(xiàn)在所有的數(shù)據(jù)都是人產(chǎn)生的。所以最大的問(wèn)題是怎么解決這些比較稀缺甚至有一些不存在的數(shù)據(jù),但是規(guī)?;苫蛘叽竽P捅旧砜赡苁菦](méi)有太本質(zhì)上的問(wèn)題。
王小川:剛才一直在提大模型通往AGI是否是基石,我認(rèn)為“基石”這個(gè)詞是沒(méi)有問(wèn)題的。今天我們看到了提升,它只是在逼近AGI,大家看到了Scaling Law(尺度定律)是第一件事。今天還有一件被忽略的事是把語(yǔ)言放到大模型里,把語(yǔ)言變成數(shù)學(xué),我們往前走,語(yǔ)言把這個(gè)符號(hào)主義跟連接主義之間產(chǎn)生一個(gè)突破,除了規(guī)模以外,符號(hào)和這中間的融合也是一件重要的事情。
再往后走還必須有泛式改變,比如大模型靠數(shù)據(jù)驅(qū)動(dòng)學(xué)習(xí)能夠做壓縮。之前像AlphaGo那種自我思考的系統(tǒng)也會(huì)有這樣的作用。所以我的結(jié)論是,我們到了AGI的時(shí)代,這個(gè)時(shí)代里我們能夠有足夠多的科學(xué)家進(jìn)來(lái)、更多資源進(jìn)來(lái),能夠走向AGI。但是以現(xiàn)在公開(kāi)大家看到的Scaling Law這個(gè)事情是做不到AGI的。
張鵬:要說(shuō)大模型是不是一個(gè)基石?同意小川說(shuō)的,它肯定是基石,是不是“之一”?這是另外一個(gè)問(wèn)題,這個(gè)問(wèn)題涉及怎么定義AGI。站在我們現(xiàn)在看到的角度,我覺(jué)得做人工智能這波人挺實(shí)用主義的,所謂的實(shí)用主義就是咱們“不看廣告,看療效”,這個(gè)東西能不能解決問(wèn)題,能不能真的向我們每個(gè)人心中定義的AGI路徑上推進(jìn)一步,大模型目前在很有效地推進(jìn)這件事情,我們的Scaling Law還在有效、還在往前前進(jìn)。至于它是不是能夠幫助我們推到頂峰上去,我們現(xiàn)在找不到一個(gè)確切的答案,但是我們相信它在這個(gè)階段是有效的,所以我認(rèn)為它肯定是基石,至少是基石之一,這個(gè)沒(méi)問(wèn)題。? ?
李大海:我個(gè)人是數(shù)學(xué)專(zhuān)業(yè)畢業(yè)的,所以我會(huì)比較嚴(yán)謹(jǐn)?shù)厝ケ磉_(dá),我認(rèn)為大模型一定是通往AGI這個(gè)方向上當(dāng)前所有技術(shù)里能走得最遠(yuǎn)的,它能不能直接達(dá)到,現(xiàn)在還有很多未知因素,包括剛才提到的定義是什么。我提一個(gè)大家沒(méi)有提到的點(diǎn),現(xiàn)在的大模型作為知識(shí)壓縮,主要是在處理人的大腦系統(tǒng)1的工作,這種慢思考的系統(tǒng)2的做各種各樣推理,搜索空間去做搜索、組合,來(lái)完成一個(gè)任務(wù),這樣的能力是未來(lái)大模型通過(guò)Agent技術(shù)外部化或者把它內(nèi)化為自己的能力,這是需要大家去探索的。
王仲遠(yuǎn):關(guān)于AGI的定義,似乎沒(méi)有廣泛的共識(shí)。各位認(rèn)為什么叫AGI?
楊植麟:首先,AGI的定義是重要的,但并不一定現(xiàn)在需要精確的、有量化的定義,它可能是一個(gè)定性的、感性的東西,它最重要的作用是能讓這個(gè)社會(huì)或者所有人能夠?qū)酉聛?lái)要發(fā)生什么事情有一個(gè)準(zhǔn)備。因?yàn)橐苍S這個(gè)技術(shù)節(jié)奏非常快,我們?nèi)绻軌蛑繟GI是什么樣的,如果能夠定義,可以更好地準(zhǔn)備這件事情,不管是每個(gè)人職業(yè),還是接下來(lái)這個(gè)行業(yè)怎么發(fā)展,首先這個(gè)是重要的。第二,也一定程度上在短期內(nèi)需要一些量化,因?yàn)槿绻麤](méi)有完全量化,沒(méi)有辦法衡量AGI開(kāi)發(fā)進(jìn)度是什么樣的,所以短期來(lái)說(shuō)這個(gè)是很難的問(wèn)題,也是很大的挑戰(zhàn)。
王仲遠(yuǎn):小川咱們上次在央視對(duì)話欄目提到去年是智能紀(jì)元的元年,這個(gè)智能紀(jì)元是對(duì)AGI的元年嗎?? ?
王小川:什么是AGI的定義,在全球里很難有完整的共識(shí)。大家都是學(xué)數(shù)學(xué)的,通過(guò)變換,把它從一個(gè)空間換成另一個(gè)空間來(lái)判斷。在我看來(lái),我用一個(gè)大家可以評(píng)測(cè)的指標(biāo)來(lái)看,在我心中是接近等價(jià)的,是什么?是能不能造醫(yī)生。為什么出這么奇怪的一個(gè)題目?醫(yī)生在所有的職業(yè)里是智力密度最高的一個(gè)行業(yè),既需要多模態(tài),也需要少幻覺(jué),也需要記憶,看70萬(wàn)字的病歷,有推理能力、查文獻(xiàn)能力等等。所以把醫(yī)生跟AGI做比較時(shí),做到醫(yī)生是否就算做到AGI了?這可能有一種聲音:醫(yī)生只是一個(gè)Vertical,醫(yī)生比這個(gè)低。人造醫(yī)生太難了!這里面有太多幻覺(jué)問(wèn)題,有太多推理能力不可靠。如果醫(yī)生比AGI低,醫(yī)生造不了,咱們就別談AGI這件事情。在我的邏輯里,醫(yī)生和AGI可以基本劃等號(hào)。
李大海:我會(huì)嘗試從經(jīng)濟(jì)學(xué)的角度來(lái)定義AGI。從經(jīng)濟(jì)學(xué)的角度講,如果我們?nèi)?zhí)行任何一個(gè)任務(wù),邊際成本都為零,這就是我們理想中的AGI。回到我剛才說(shuō)的,為什么我認(rèn)為大模型能夠走得最遠(yuǎn),就是我相信大模型能夠把邊際成本一直往下降,可能會(huì)逼近于零。就像植麟剛才講的,很多時(shí)候需要我們?cè)诟餍懈鳂I(yè)的數(shù)據(jù)產(chǎn)生一個(gè)飛輪,逐步讓模型持續(xù)訓(xùn)練、持續(xù)學(xué)習(xí),讓整體的成本降下去。
我們?nèi)ツ昕吹叫袠I(yè)里面大家去做大模型落地的時(shí)候,很多的場(chǎng)景都還需要做微調(diào),這個(gè)邊際成本就很高。我們相信,隨著模型能力的提升,慢慢從微調(diào)逐步地只需要做Promot generate(提示生成),慢慢地連Promot generate都不需要做,模型直接就問(wèn)你到底有什么需求。如果你講不清楚,我來(lái)問(wèn)你。通過(guò)這種方式,我相信未來(lái)的門(mén)檻會(huì)越來(lái)越低,成本會(huì)越來(lái)越低。低到接近于零的時(shí)候,我覺(jué)得AGI基本就到來(lái)了。? ?
我還想補(bǔ)充一個(gè)觀點(diǎn)?,F(xiàn)在大家都在講怎么把模型做大。剛才小川提到一個(gè)關(guān)鍵詞,叫“智能密度”。我們覺(jué)得大模型的智能密度也是一個(gè)非常重要的事情。當(dāng)有一天達(dá)到AGI的時(shí)候,還要做的事情是大模型的小型化。如果用一個(gè)10萬(wàn)億的參數(shù)模型做到AGI,能不能把10萬(wàn)億的參數(shù)降到1萬(wàn)億、降到1000億,這也是一個(gè)要持續(xù)去突破的事情。
張鵬:在我們看AGI這件事,與其說(shuō)它有一個(gè)很?chē)?yán)格的定義,我更愿意相信它是我們的一種信念,是一個(gè)符號(hào),它的內(nèi)涵外延是在不斷變化的?,F(xiàn)在的問(wèn)題就在于,沒(méi)有人能夠說(shuō)清楚。反過(guò)來(lái)講是一個(gè)好事,這個(gè)事情還有很多未知空間等待我們探索。AGI對(duì)于我們來(lái)說(shuō),可以把它定義成我們的目標(biāo)。我們一直相信,當(dāng)前我們的目標(biāo)是以人為參照,讓機(jī)器像人一樣思考。這是我們的愿景。當(dāng)然,機(jī)器的能力遠(yuǎn)不止人的水平,我們期待它可以出現(xiàn)超越人的能力,所以AGI里邊我們會(huì)提到有super intelligence(超級(jí)智能)。下一步它是否能產(chǎn)生超過(guò)人的水平,我們會(huì)不斷更新AGI的內(nèi)涵和外延。
Scaling Law未來(lái)會(huì)持續(xù)演進(jìn)
王仲遠(yuǎn):今天早晨大家反復(fù)提到一個(gè)詞Scaling Law,我不知道植麟對(duì)Scaling Law還是特別堅(jiān)信嗎?它會(huì)繼續(xù)在未來(lái)這些年起作用嗎?
楊植麟:對(duì)。怎么定義Scaling Law?Scaling Law是什么?如果說(shuō)就沿著當(dāng)前現(xiàn)在的方法做next token prediction,再去scale(規(guī)模)很多個(gè)數(shù)量級(jí),用跟現(xiàn)在完全一樣的數(shù)據(jù)去分布,我覺(jué)得它的上限是很明顯的。但是,Scaling Law本身并不受這個(gè)東西的限制,只要有更多的算力,數(shù)據(jù)模型參數(shù)變大,持續(xù)產(chǎn)生更多的智能,但是并沒(méi)有定義模型是什么樣的。比如要多少個(gè)模態(tài),中間數(shù)據(jù)是什么樣的,數(shù)據(jù)是生成出來(lái)的還是用Web text,也沒(méi)有規(guī)定你的Loss function是什么樣的。所以,Scaling Law是會(huì)持續(xù)演進(jìn)的,只是在這個(gè)過(guò)程中要scale的方法可能會(huì)發(fā)生很大的變化。像大家一直在講的世界模型,本質(zhì)上現(xiàn)在的大語(yǔ)言模型是世界模型的一個(gè)特例,只是先把里面一部分給做了,但是還能做更多持續(xù)的擴(kuò)充訓(xùn)練方式,所以我覺(jué)得Scaling會(huì)持續(xù)。? ?
王仲遠(yuǎn):您對(duì)Scaling Law未來(lái)幾年持續(xù)發(fā)揮作用怎么看?您覺(jué)得在未來(lái)幾年是否會(huì)持續(xù)發(fā)揮作用?
王小川:我對(duì)Scaling Law到目前為止沒(méi)有看到持續(xù)的發(fā)揮,美國(guó)號(hào)稱(chēng)要買(mǎi)30萬(wàn)片B200來(lái)做。在這種情況下,美國(guó)確實(shí)在這方面的認(rèn)知程度,甚至投入程度是遠(yuǎn)遠(yuǎn)高于中國(guó)的。在我看起來(lái),我們?cè)赟caling Law之外,一定要去尋找范式上新的轉(zhuǎn)化,比如數(shù)據(jù)算法算力。Scaling Law在里面很明確,在美國(guó)跟進(jìn)的維度。不管從戰(zhàn)略上講還是從信仰上,我認(rèn)為在Scaling Law之外都還有范式的變化,不只是去簡(jiǎn)單的變成壓縮模式,會(huì)走出這樣一個(gè)體系,才有機(jī)會(huì)走向AGI,才有機(jī)會(huì)跟前沿技術(shù)產(chǎn)生較量能力。
王仲遠(yuǎn):張鵬,對(duì)Scaling Law呢?
張鵬:我剛才在講AGI的時(shí)候已經(jīng)表達(dá)了一些觀點(diǎn)。Scaling Law本身這個(gè)定義,到目前為止人類(lèi)認(rèn)識(shí)所有的規(guī)律也好、物理定律也好、什么也好,都有可能有推翻的一天,只是看它的有效期是多長(zhǎng)。前面加一個(gè)定語(yǔ)的話,到目前為止還沒(méi)有看到Scaling Law會(huì)失效的預(yù)兆。未來(lái)的相當(dāng)一段時(shí)間之內(nèi)它仍然會(huì)有效。當(dāng)然,所謂的會(huì)有效也是一個(gè)動(dòng)態(tài)的概念,在于它本身所包含的事情會(huì)不斷演進(jìn)。就像小川說(shuō)的,Scaling Law早期關(guān)注的就是參數(shù)量規(guī)模,現(xiàn)在慢慢擴(kuò)展到參數(shù)量很重要,數(shù)據(jù)量也很重要,數(shù)據(jù)質(zhì)量也很重要,變成了一種計(jì)算量。它的內(nèi)涵也在慢慢變化。隨著大家對(duì)規(guī)律的認(rèn)知越來(lái)越深,規(guī)律的本質(zhì)越來(lái)越揭示,所以掌握本質(zhì)就能掌握通往未來(lái)的鑰匙?;诂F(xiàn)在大家對(duì)本質(zhì)認(rèn)識(shí)的深淺,至少在我們看來(lái),仍然還會(huì)起效,會(huì)是未來(lái)我們主力想要推進(jìn)的方向。? ?
王仲遠(yuǎn):我想追問(wèn)一個(gè)問(wèn)題。我們現(xiàn)在也看到,像GPT-5,之前傳過(guò)幾次說(shuō)要發(fā)布,但是一直在推遲。張總,咱們自己也在訓(xùn)練大模型,如果我們從追逐GPT-4到要突破GPT-4,到要往GPT-5發(fā)展,Scaling Law有突破效應(yīng)嗎?我不知道您怎么看這個(gè)問(wèn)題。
張鵬:因素有很多種,包括傳說(shuō)的4.5和5什么時(shí)候發(fā)布,這里面的因素非常多。就拿我們自己來(lái)說(shuō),我們自己也在選擇一個(gè)道路,不斷地去遵循Scaling Law往前前進(jìn)。舉個(gè)例子。我們開(kāi)始做悟道的時(shí)候就討論過(guò)一個(gè)方案,我們是否去做一個(gè)稠密的單體模型,還是去做MOE稀疏的多體模型,這就是當(dāng)時(shí)我們認(rèn)為,如何去滿(mǎn)足Scaling Law或者追尋Scaling Law的不同路徑。發(fā)展到今天這個(gè)地步的時(shí)候,你會(huì)發(fā)現(xiàn)里面維度已經(jīng)非常多,可以在很多方面去做這個(gè)事情。同樣,反過(guò)來(lái)看這個(gè)問(wèn)題,你會(huì)發(fā)現(xiàn)復(fù)雜度又上升了,不是簡(jiǎn)單地追求參數(shù)量上去就行的,難度也變大了。所以我理解,想要實(shí)現(xiàn)GPT-5或者再下一代,我們自己想要實(shí)現(xiàn)下一代模型,里面的技術(shù)可能性、要探索的東西還是非常多的。也是一樣的,正反兩方面。
王仲遠(yuǎn):大海,面壁主要是關(guān)注在端側(cè)的大模型,我不知道在輕量級(jí)的大模型上,您認(rèn)為Scaling Law也是有效的嗎?? ?
李大海:我認(rèn)為Scaling Law是非常重要的。我也非常認(rèn)同張鵬的意見(jiàn)。就是Scalinglaw是一個(gè)經(jīng)驗(yàn)公式,是行業(yè)對(duì)大模型這樣一個(gè)復(fù)雜系統(tǒng)觀察以后的經(jīng)驗(yàn)總結(jié),隨著訓(xùn)練過(guò)程中實(shí)驗(yàn)越來(lái)越多、認(rèn)知越來(lái)越清晰,會(huì)有更細(xì)顆粒度的認(rèn)知。
比如我們自己發(fā)現(xiàn),除了前面說(shuō)的維度之外,訓(xùn)練模型中的訓(xùn)練方法本身對(duì)于Scalinglaw、對(duì)于智能的影響是比較顯著的。這個(gè)顯著的影響在我們固定住參數(shù)規(guī)模以后變得非常重要,因?yàn)楝F(xiàn)在參數(shù)規(guī)模不斷往上,它是低垂的擴(kuò)勢(shì),只要擴(kuò)就可以,先往上放大。但是固定讓端側(cè)芯片能夠支撐這個(gè)規(guī)模的模型,能夠做到足夠好的智能,那數(shù)據(jù)質(zhì)量、訓(xùn)練方法這些都變得非常重要。
王仲遠(yuǎn):我們最近關(guān)注到一個(gè)熱門(mén)新聞是關(guān)于開(kāi)源社區(qū)的事情,斯坦佛LlaMA這個(gè)團(tuán)隊(duì)抄襲了咱們的MiniCPM,不知道您對(duì)這個(gè)事件怎么看?
李大海:最近這個(gè)事情在國(guó)內(nèi)引起非常大反響,我們完全沒(méi)有想到我們的工作會(huì)以這種方式出圈,挺惶恐的。這里澄清一下,我們自己認(rèn)為這其實(shí)是海外個(gè)別學(xué)生組成的一個(gè)小團(tuán)隊(duì)做的個(gè)人行為,它不代表任何更大的像斯坦佛這樣的學(xué)校。因?yàn)槭录l(fā)生以后,斯坦佛系主任和西方同行都表達(dá)了價(jià)值觀非常正的觀點(diǎn)。
另外,因?yàn)檫@個(gè)事件,我們更加堅(jiān)定相信開(kāi)源的力量,這個(gè)事件的發(fā)現(xiàn)也是靠開(kāi)源的熱心參與者發(fā)現(xiàn)的,并不是我們自己發(fā)現(xiàn)的。我們是5月20日把這個(gè)模型開(kāi)源出來(lái),到了5月29日時(shí)這幾個(gè)本科生小朋友就做了一些非常簡(jiǎn)單的工作,在我們的模型上做了一個(gè)高斯疊加,疊加一些高斯噪聲,就號(hào)稱(chēng)是自己的模型。當(dāng)然,這個(gè)模型一下子變得很受歡迎,主要原因是因?yàn)樗麄冃Q(chēng):這個(gè)模型的多模態(tài)能力是跟GPT4-V和完全對(duì)標(biāo),但是參數(shù)只有后者的1%,并且只需要500美金就能夠訓(xùn)練出來(lái)。前兩項(xiàng)是真的,我們模型確實(shí)有這個(gè)能力,但是500美金訓(xùn)練不出來(lái),需要花很多錢(qián)。? ?
AGI當(dāng)下的能力不足以顛覆人類(lèi)
王仲遠(yuǎn):隨著大模型發(fā)展,AI安全問(wèn)題被不斷討論。各位都是做企業(yè)的,我想了解一下AI安全在大模型產(chǎn)業(yè)怎么去看?是當(dāng)下最急迫的問(wèn)題嗎?
楊植麟:AI安全是非常重要的,它可能不一定是當(dāng)前最急迫,但是一個(gè)需要我們提前去準(zhǔn)備的事情。因?yàn)殡S著模型的進(jìn)展,Scaling Law的發(fā)展是每N個(gè)月算力乘10倍,這里你的智能會(huì)得到提升,是一個(gè)逐漸去適應(yīng)的過(guò)程。它不一定是當(dāng)前最大的矛盾或者最緊急的事情,但它肯定是長(zhǎng)期儲(chǔ)備。
這里面最重要的是兩個(gè)方面,一個(gè)是模型本身會(huì)因?yàn)橛脩?hù)本身有些惡意意圖,導(dǎo)致它去做一些本來(lái)不應(yīng)該做的事情。比如現(xiàn)在有研究在prompt里注入一些不太恰當(dāng)?shù)囊鈭D,這些需要去關(guān)注。第二個(gè)是你的模型本身會(huì)不會(huì)有自己的motivation,這是跟訓(xùn)練方式相關(guān)的,包括能不能在模型的底層去注入比如AI的憲法,去框定它的行為,不管用戶(hù)給什么指示,都不會(huì)違背這個(gè)憲法。
王小川:安全有不同的內(nèi)涵和外延,所以我想提三個(gè)與安全相關(guān)的事情。
第一個(gè),意識(shí)形態(tài)的安全。做to C有這樣一個(gè)服務(wù),作為中國(guó)的大模型,意識(shí)形態(tài)上跟國(guó)家發(fā)展保持一致是大家的基本功,每個(gè)模型有他們的價(jià)值觀,我們有我們的價(jià)值觀,這個(gè)安全是對(duì)民族、對(duì)社會(huì)負(fù)責(zé)任的一件事情,這個(gè)安全是底線,大家得把它做好了。
第二個(gè),大家空談得比較遠(yuǎn)的這種安全:這個(gè)模型是不是把人類(lèi)毀滅了?以后人就沒(méi)了,然后機(jī)器掌握世界了。我內(nèi)心最不希望像核彈一樣把人類(lèi)文明搞沒(méi)了,人類(lèi)發(fā)展好幾千年,好不容易有這樣一種智慧及模型,不希望把地球搞沒(méi)了。但是至于這個(gè)模型是不是比人更聰明,能夠取代人做事情,我覺(jué)得這件事情是值得鼓勵(lì)的一件事情。因?yàn)閺娜祟?lèi)文明,生孩子、發(fā)展技術(shù)去延續(xù)人類(lèi)和延續(xù)文明才是重要的,人的肉身會(huì)死亡的,今天大家不回避這個(gè)問(wèn)題。所以技術(shù)跟我們?nèi)祟?lèi)一塊拓展文明是有意義的,不要限制。我去年寫(xiě)了一封公開(kāi)信,AGI幫助我們延續(xù)和繁榮人類(lèi)文明是一個(gè)目標(biāo),讓人類(lèi)更好地延續(xù),而不是讓機(jī)器當(dāng)我們的奴隸、當(dāng)我們的工具,這是在安全里面以文明為標(biāo)準(zhǔn)去看待它,這是第二層安全的理想色彩 。
第三個(gè)安全是比較現(xiàn)實(shí)的,剛才提到AGI是什么、怎么評(píng)測(cè)?當(dāng)我跟很多人聊拿AGI做個(gè)醫(yī)生,大家覺(jué)得很難,現(xiàn)在搞不定。如果連這個(gè)都做不到,那它能力如此之弱,我們就不要想它會(huì)顛覆人類(lèi)這個(gè)復(fù)雜的事。所以,近期還不存在這個(gè)安全的問(wèn)題。
王仲遠(yuǎn):前一段時(shí)間智譜簽了AI安全承諾,張鵬當(dāng)時(shí)是什么考量?
張鵬:當(dāng)時(shí)有15家AI相關(guān)的企業(yè),來(lái)自全球各地各大洲,一起簽署負(fù)責(zé)任的AI承諾書(shū)。安全只是其中一部分,我們叫“負(fù)責(zé)任的AI”,安全的AI包括剛才小川講的三個(gè)方面的安全,但還有更低的問(wèn)題,就是如何保證和如何努力讓這個(gè)技術(shù)幫助人類(lèi)、社會(huì)、地球,而不是去為惡。?
當(dāng)然,人有兩面性,很難保證沒(méi)有人拿這個(gè)事情去作惡,現(xiàn)實(shí)社會(huì)中已經(jīng)發(fā)現(xiàn)有人在做這件事情,這件事情永遠(yuǎn)是防守比破壞要難,需要大家一起共同努力。我相信這個(gè)事情更重要的意義并不是我們現(xiàn)在能拿出多么安全的技術(shù)、方法或者管理規(guī)定去約束大家,而是增強(qiáng)大家對(duì)這件事情的了解,對(duì)這件事情統(tǒng)一的認(rèn)識(shí),大家能夠坐下來(lái)正面面對(duì)這些問(wèn)題,把這些問(wèn)題擺在桌面上來(lái),希望更多人一起參與討論這件事情,總有解決問(wèn)題的辦法。
王仲遠(yuǎn):大海對(duì)AI安全的看法呢?
李大海:我比較同意前面各位老板說(shuō)到的觀點(diǎn)。我認(rèn)為現(xiàn)在這個(gè)階段,安全主要還是聚焦在基礎(chǔ)安全跟內(nèi)容安全這兩個(gè)方向上,現(xiàn)在的大模型本質(zhì)上是只讀的,模型訓(xùn)練也好,權(quán)重是固定的,推理不會(huì)影響權(quán)重,權(quán)重都是在線下持續(xù)階段去訓(xùn)練的。有一天,當(dāng)我們把模型部署到機(jī)器人,部署到我說(shuō)的終端上,它能夠去動(dòng)態(tài)更新自己的權(quán)重以后,我覺(jué)得安全問(wèn)題會(huì)變成一個(gè)非常重要的問(wèn)題。
價(jià)格戰(zhàn)對(duì)中國(guó)大模型的發(fā)展是有利的
王仲遠(yuǎn):最近有好多記者朋友也都在問(wèn)我:對(duì)于最近的大模型價(jià)格戰(zhàn)怎么看?我當(dāng)時(shí)給他們的回復(fù):智源研究院堅(jiān)定地?fù)肀ч_(kāi)源,免費(fèi)給整個(gè)產(chǎn)業(yè)界、整個(gè)社區(qū)使用。但我想請(qǐng)教一下諸位對(duì)于大模型價(jià)格戰(zhàn)的看法,它是更有利于大模型的普及,還是不利于企業(yè)的發(fā)展。
楊植麟:這是很好的問(wèn)題。如果我們把時(shí)間線拉足夠長(zhǎng)的話,最終還是會(huì)回歸價(jià)值本身。我自己有三個(gè)判斷。第一個(gè),我們?nèi)タ此懔Φ耐度?,可能投入在推理上的算力,在某個(gè)時(shí)間點(diǎn)之后應(yīng)該是可以顯著超過(guò)訓(xùn)練的算力。我覺(jué)得這個(gè)標(biāo)志價(jià)值開(kāi)始得到釋放,前面用來(lái)訓(xùn)練的成本是可以很大程度上被覆蓋。第二個(gè)很重要的節(jié)點(diǎn),如果從C端的角度來(lái)說(shuō),推理成本可能會(huì)顯著低于獲客成本,所以從商業(yè)本質(zhì)上來(lái)講,可能不會(huì)跟之前的各種商業(yè)模式有非常本質(zhì)的區(qū)別。我覺(jué)得這兩個(gè)是很重要的。第三個(gè)因素,AI在整個(gè)人的工作流程里面的占比還是很低的,可能是1%。也就是說(shuō),人做的事情要遠(yuǎn)遠(yuǎn)多于AI做的事情。AI本身做的事情,可能會(huì)在某個(gè)時(shí)間點(diǎn)超過(guò)人做的事情。這個(gè)時(shí)候,它就可能會(huì)產(chǎn)生新的商業(yè)模式,它可能不是像今天說(shuō)的在B端用API做價(jià)格戰(zhàn),可能是一個(gè)普惠的AI,同時(shí)根據(jù)它產(chǎn)生的價(jià)值從這里面去分成產(chǎn)生的商業(yè)模式。這三個(gè)點(diǎn),可能會(huì)是改變商業(yè)模式本身或者ROI這個(gè)問(wèn)題很重要的方式。? ??
王仲遠(yuǎn):小川,你對(duì)近期的大模型價(jià)格戰(zhàn)怎么看?
王小川:我先說(shuō)結(jié)論,今天的價(jià)格戰(zhàn)對(duì)中國(guó)發(fā)展大模型是非常特別的事。我是積極看待這個(gè)事情。首先,好不好,得看對(duì)單個(gè)公司還是對(duì)整個(gè)市場(chǎng)。因?yàn)閮r(jià)格戰(zhàn)通常是市場(chǎng)行為,是競(jìng)爭(zhēng)的導(dǎo)向,至少帶來(lái)兩個(gè)好的后果:第一個(gè),更多公司、更多人用上大模型了,使得大模型在中國(guó)迅速普及,不管是個(gè)人還是企業(yè)都能入場(chǎng)了。第二個(gè),很多企業(yè)但凡有點(diǎn)技術(shù)能力都要自己訓(xùn)練點(diǎn)大模型,甚至來(lái)找我們聯(lián)合訓(xùn)練,明明它該是大模型的用戶(hù)、消費(fèi)者、使用方,但都想轉(zhuǎn)型成為大模型的供給方,這種情況下,帶來(lái)很多人才、資金和社會(huì)的浪費(fèi)。價(jià)格戰(zhàn)之后,很多企業(yè)清醒了,退回來(lái)成為大模型的用戶(hù)。我們不需要一千、一萬(wàn)個(gè)大模型。
王仲遠(yuǎn):張鵬你贊同小川的觀點(diǎn)嗎?
張鵬:基本上是贊同這個(gè)觀點(diǎn)的。有人跑過(guò)來(lái)跟我們說(shuō):你們是這輪價(jià)格戰(zhàn)的發(fā)起方。我說(shuō)子虛烏有。在那個(gè)之前,我們一直秉持的概念就是你說(shuō)的ROI,給用戶(hù)帶來(lái)最大的收益價(jià)值,用我們的技術(shù)、用我們的創(chuàng)新降低使用成本,就是為了讓技術(shù)能夠更多的普及,讓更多人能夠享受這個(gè)收益。在很長(zhǎng)一段時(shí)間,我們的價(jià)格都是行業(yè)內(nèi)極低的。因?yàn)槲覀兊募夹g(shù)確實(shí)能做到那一步,能把中間的成本空間釋放出來(lái)當(dāng)作大家的收益。從宏觀角度來(lái)講,對(duì)中國(guó)大模型產(chǎn)業(yè)是有利的,讓更多人來(lái)使用,讓更多人真的把大模型當(dāng)作我們一開(kāi)始提到的那件事情,就是它會(huì)變成基礎(chǔ)設(shè)施。基礎(chǔ)設(shè)施什么意思?當(dāng)真的有一天AI大模型能力變成水、電基礎(chǔ)能力的時(shí)候,這個(gè)事對(duì)我們來(lái)講、對(duì)企業(yè)來(lái)講一個(gè)更好的發(fā)展空間、更好的發(fā)展態(tài)勢(shì),這也是我們一直在堅(jiān)持做的事情。包括最近20號(hào)發(fā)的新模型,真的是把成本已經(jīng)壓到我們都不好意思跟大家報(bào)價(jià)的地方,就是幾分錢(qián),把單位變成100萬(wàn)Token多少錢(qián),已經(jīng)到了這樣的地步了。這件事情對(duì)整體上大的是有好處的,但是也要注意,不要過(guò)多地關(guān)注和宣揚(yáng)這件事情。商業(yè)上,你去犧牲企業(yè)短期的成本,虧本做買(mǎi)賣(mài)不是正常的商業(yè)邏輯,只能持續(xù)很短的時(shí)間,真正還是要回歸最終的用戶(hù)價(jià)值、生產(chǎn)力價(jià)值。
王仲遠(yuǎn):在端側(cè)的大模型會(huì)面臨價(jià)格戰(zhàn)的困擾嗎?
李大海:我們做端側(cè),就是看到了端側(cè)能更早更快落地的可能性。最近有機(jī)構(gòu)做過(guò)一個(gè)調(diào)研,發(fā)現(xiàn)全國(guó)10億用戶(hù)的手機(jī)端側(cè)的算力,相當(dāng)于差不多100萬(wàn)片A100。這是一個(gè)非??鋸埖臄?shù)字。如果不同的手機(jī)上的算力能夠被好好利用起來(lái),很多應(yīng)用就可以落地了。當(dāng)然,現(xiàn)在這個(gè)階段,包括到未來(lái),都需要端側(cè)跟云側(cè)模型好好協(xié)同。端側(cè)有端側(cè)的優(yōu)勢(shì),它的優(yōu)勢(shì)是隱私性好、更可靠,但是云上的模型肯定要比端側(cè)好,我們跟其他所有模型公司要一起協(xié)作的事。? ?
我也非常同意前面大家所說(shuō)的觀點(diǎn)。當(dāng)前所謂的價(jià)格戰(zhàn),多多少少有一些營(yíng)銷(xiāo)的成分在,但是我相信未來(lái)一定會(huì)比現(xiàn)在還要便宜,并且大家都有利潤(rùn),這才是健康的方式,并且才真的能讓千行百業(yè)的應(yīng)用往下落地。
文章鏈接:http://m.bjsbxl.com/news/1009.html
發(fā)表評(píng)論
2024-06-18 01:04:11
2024-06-18 01:04:11
2024-06-18 01:04:11
2024-06-18 01:04:11