分享到微信打開微信,點(diǎn)擊底部的“發(fā)現(xiàn)”, |
“所有0和1我這輩子都沒做,我做的全是看到美國(guó)人做了0和1,我做1×10、10×100的事?!遍_源中國(guó)董事長(zhǎng)馬越對(duì)第一財(cái)經(jīng)表示。他認(rèn)為國(guó)內(nèi)的一些知名企業(yè)家做的也是類似的工作。
馬越是一位在科技領(lǐng)域闖蕩多年的老兵。DeepSeek以及人工智能的進(jìn)展,讓他感慨新一代的科技創(chuàng)業(yè)者,更可能做出從無到有的創(chuàng)新性工作。
人工智能正在開啟大航海的時(shí)代,沒有人手里有明確的航海圖,但年輕創(chuàng)業(yè)者們更有冒險(xiǎn)精神?!拔覀兛船F(xiàn)在的大模型公司,誰(shuí)家的研發(fā)團(tuán)隊(duì)大量聘用年輕的研究員,并給予充分的授權(quán),它的發(fā)展一定很好。如果一個(gè)廠家有太多的學(xué)界、權(quán)威、層級(jí)很多,它的研發(fā)效率多半比較慢的?!盡iniMax副總裁劉華也說。
炮灰的覺悟
馬越生于中國(guó)改革開放之前,既經(jīng)歷過中國(guó)的貧困時(shí)期,也見證過中國(guó)的經(jīng)濟(jì)騰飛。
盡管他是一位連續(xù)的創(chuàng)業(yè)者,而且在科技企業(yè)里有所成就。但他回頭看自己的過往,他這一輩人從小受的教育的經(jīng)歷等,塑造了他的工作方式。馬越自我調(diào)侃“也就這么點(diǎn)出息,沒有想象能力”。
在科技領(lǐng)域,想象力與創(chuàng)造力緊密相關(guān)。那些科技發(fā)展歷程中顛覆性的創(chuàng)新,比如半導(dǎo)體、計(jì)算機(jī)圖形界面、智能手機(jī)以及大模型等,都是從美國(guó)市場(chǎng)上走出來的。
馬越認(rèn)為,一些國(guó)內(nèi)知名的企業(yè)家,做出的也不是開創(chuàng)性的工作,而是摸著石頭過河。過去二十年間,中國(guó)市場(chǎng)上風(fēng)生水起的搜索、電商、云計(jì)算等概莫能外。
這一輪的大模型浪潮,OpenAI珠玉在前,但DeepSeek是中國(guó)創(chuàng)業(yè)者帶來的驚奇。
DeepSeek一夜之間給美國(guó)股市造成萬(wàn)億美元的蒸發(fā)。它以史上最快的速度觸達(dá)了上億用戶,B端的企業(yè)投入開源模型的懷抱。它也改變了很多大模型企業(yè)的發(fā)展道路。
OpenAI在考慮某種形式的開源,百度也摒棄閉源道路,轉(zhuǎn)而選擇開源其最新的大模型產(chǎn)品。
一些初創(chuàng)型科技企業(yè),此前融資數(shù)億,購(gòu)買算力卡,訓(xùn)練自己的模型,在尚未成功之際發(fā)現(xiàn)DeepSeek以一種更具性價(jià)比的方式實(shí)現(xiàn)了更優(yōu)的模型性能。關(guān)鍵是,DeepSeek開源,任何企業(yè)都可以學(xué)習(xí)模仿,并在此基礎(chǔ)上二次開發(fā)。
大模型公司的估值和融資機(jī)會(huì),因此受到DeepSeek的壓制。
“過去的估值都建立在做這件事必須投大錢的基礎(chǔ)上,因?yàn)槠鹗值哪繕?biāo)融資10億美金,你不給我100億美金估值都不行?!币患彝顿Y機(jī)構(gòu)的合伙人認(rèn)為,現(xiàn)在融資會(huì)變得更難了,“大家覺得你不需要幾十億美金,10億美金是不是就行了,幾億美金是不是也能干得不錯(cuò)?!?/p>
科技創(chuàng)新的代價(jià)一直很高。一些大模型企業(yè)此前為研發(fā)、預(yù)訓(xùn)練而做的巨大投資,面臨迅速貶值。
“中國(guó)本身這種沉沒成本就是巨高?!瘪R越說:“今天的積累都是給年輕人做土壤,我們變成炮灰。產(chǎn)業(yè)燒了幾百億,可能最終成就的是DeepSeek這樣的公司。沒有一點(diǎn)問題,我樂見其成。”
OpenAI沒有出現(xiàn)在谷歌,也不是誕生于亞馬遜。DeepSeek并非產(chǎn)生于騰訊或者阿里巴巴。
馬越認(rèn)為,顛覆式的創(chuàng)新,大廠很難。國(guó)內(nèi)大廠習(xí)慣了拿來主義的路徑依賴,內(nèi)部是職業(yè)經(jīng)理人的思維,“我完成 KPI還不簡(jiǎn)單,寫PPT就完了,我跟自己較什么勁?徹底的創(chuàng)新這件事兒,大廠員工背著免責(zé)盾牌搞創(chuàng)新,拳頭根本揮不開?!?/p>
新一代的科技創(chuàng)業(yè)者,更可能做出0-1的、從無到有的創(chuàng)新性工作。
“至少比我們這代人靠譜得多了。”馬越表示:“因?yàn)槲覀兏F,沒想象力。年輕人現(xiàn)在不應(yīng)該這樣了?!?/p>
大模型創(chuàng)新靠誰(shuí)
中國(guó)大模型向前發(fā)展,推動(dòng)力是什么?
“我們認(rèn)為依賴于高度組織化精細(xì)化的研發(fā)團(tuán)隊(duì),它絕對(duì)不僅僅依賴于學(xué)界權(quán)威、院士、教授、博導(dǎo)。”劉華說。
MiniMax是大模型六小虎之一,它的產(chǎn)品已經(jīng)開始落地海外20多個(gè)國(guó)家,是中國(guó)地域覆蓋范圍最廣的大模型開放平臺(tái)。
2017年,谷歌幾位員工提出Transformer架構(gòu)。大模型剛出現(xiàn)的時(shí)候,是以Transformer為底層架構(gòu)的稠密模型。但是經(jīng)過八年發(fā)展,企業(yè)界認(rèn)為Transformer碰到了它的瓶頸?,F(xiàn)在企業(yè)在探索非Transformer架構(gòu),稠密模型已經(jīng)被逐漸放棄,MoE(混合專家模型)成了共同的選擇。
“Transformer處理任務(wù)的長(zhǎng)度跟它的算力消耗程度是成平方的關(guān)系。比如我現(xiàn)在處理100Token任務(wù)的算力消耗是一個(gè)恒定值。如果處理10000Token的任務(wù),處理的任務(wù)增加100倍,算力消耗要增加100的平方,一萬(wàn)倍。”劉華說。
隨著多模態(tài)的發(fā)展,大模型處理Token的規(guī)模遠(yuǎn)不止百倍增長(zhǎng),將來可能是萬(wàn)倍。大模型解決超長(zhǎng)文本處理能力,需要研發(fā)新的模型底層架構(gòu),MiniMax選擇的是線性注意力機(jī)制,其新一代的MiniMax-01模型,可以做到基本性能和GPT4o、Claude3.5齊平,但是能夠處理400萬(wàn)Token的長(zhǎng)文本,是4o和Claude3.5的20倍、30倍。
MiniMax在2023年擁抱MoE架構(gòu)。大模型研發(fā)的底層框架迭代,MiniMax的經(jīng)驗(yàn)是,要去聘用年輕的研究員,給予充分的授權(quán),讓他們敢于嘗試新的思路,讓他們用充沛的算力做大量的實(shí)驗(yàn),才可以敏銳地捕捉到大模型迭代的方向。
劉華表示:“現(xiàn)在的大模型公司,如果誰(shuí)家的研發(fā)團(tuán)隊(duì)是大量聘用年輕的研究員,并給予充分的授權(quán),它的發(fā)展一定很好。如果一個(gè)廠家有太多的學(xué)界權(quán)威、層級(jí)很多,它的研發(fā)效率多半是比較慢的?!?/p>
馬越認(rèn)為,中國(guó)傳統(tǒng)文化里缺少對(duì)年輕人的尊敬,更不必提敬畏了。老一輩的人都是基于功利主義,而年輕人的價(jià)值觀跟過去不一樣了。
“DeepSeek是一個(gè)年輕的團(tuán)隊(duì)打造的,少年強(qiáng)則中國(guó)強(qiáng)。我們這種年過半百的封建殘余,滿腦子的舊認(rèn)知,一天到晚吹牛也好,抱大腿也好?!瘪R越說,“你得有覺悟,我們這一輩子到今天是給年輕人當(dāng)梯子的?!?/p>
人工智能拉開了一個(gè)大航海的時(shí)代,年輕人是更好的冒險(xiǎn)者。
“新大陸在哪兒,我們不知道,每條海岸線都是迷霧。所有的舊認(rèn)知都沒價(jià)值,我們沒有羅盤,也不知道自己的方向在哪里,也不知道終點(diǎn)在哪里,所以它才有意思?!瘪R越表示。
當(dāng)DeepSeek掀了大模型的牌桌,進(jìn)攻是百度繼續(xù)留在AI牌桌的唯一機(jī)會(huì)。
向老師學(xué)習(xí),老師的智能就是天花板;向自然學(xué)習(xí),就可以突破人類智能的極限。所以AI的優(yōu)勢(shì)在可擴(kuò)展性,它發(fā)展的絕對(duì)瓶頸常在數(shù)據(jù)和能源。
這一模型迭代可能預(yù)示著R2模型將是另一個(gè)重大飛躍。
怎么才能用好如今“百模大戰(zhàn)”之下各種層出不窮的AI模型?關(guān)鍵就是要分清楚它們所處的層次,以匹配你想達(dá)到的目的。
隨著DeepSeek免費(fèi)開源崛起,數(shù)據(jù)問題成為阻礙大模型落地進(jìn)程新的攔路虎。很多央企國(guó)等大型企業(yè)業(yè)務(wù)數(shù)據(jù)分散且格式多樣,需解決非結(jié)構(gòu)化數(shù)據(jù)的清洗、標(biāo)注和知識(shí)化問題。