一名“佛系”大模型創(chuàng)業(yè)者:行業(yè)很卷,但我不考慮融資

“員工做錯了,我恨不得跟他說5遍,就像用GPT一樣一直重復,直到讓他理解記住為止!

文|《中國企業(yè)家》記者 孔月昕

編輯|馬吉英

頭圖攝影|鄧攀

與王慧文、王小川、李開復等投身大模型的創(chuàng)業(yè)者相比,出門問問創(chuàng)始人、CEO李志飛的身上,缺少了點“明星”光環(huán);但靠著一直以來在AI領域的積累,他在這一波AI創(chuàng)業(yè)中“搶跑”了。

曾有友人評價他,“每次都能無比準確地踩在一個點上,并且有備而來!

2012年10月,李志飛從美國谷歌總部離職后,回國創(chuàng)立了出門問問。彼時,他既沒有團隊也沒有產(chǎn)品,用一個簡單的demo打動了紅杉資本和真格基金,拿到了1000萬元天使輪融資。隨后,李志飛在AI創(chuàng)業(yè)道路上一路狂奔,5年內(nèi)完成了五輪融資,項目估值一度高達10億美元。

在李志飛看來,創(chuàng)業(yè)最迷人的地方在于,創(chuàng)業(yè)者能夠在別人看不到機會和希望的時刻,自己找到一條破題的路。他自己的親身經(jīng)歷也可以證明這一點,“2015年,在我不知道怎么商業(yè)化的時候,我想到了做智能硬件,雖然這條路不一定準確,但在當時看確實是一個surprise;2019、2020年,當別人覺得我們陷入智能硬件的‘坑’里出不來時,我又借助SaaS服務擴大了營收規(guī)模;2020年,我們有意無意地投入了生成式AI,并嘗試商業(yè)化,為大模型研發(fā)打下了基礎。”

在數(shù)次“化險為夷”背后,李志飛也幾度遭遇打擊。在公司經(jīng)營上,他“栽過急速擴張的跟頭”,不得已只能裁員;他也從技術角度對AI的價值產(chǎn)生過困惑;在2020年底就開始做大模型,但又沒有選擇大力推進……

“AI可以打敗世界上最聰明的一類人如圍棋手,卻學不會連五歲小孩都會的自然語言對話,為什么呢?” 2017年接受《中國企業(yè)家》采訪時,他稱給自己提出過這樣的問題。

而ChatGPT的面世,解釋了李志飛多年來的困惑,讓他無比興奮,他覺得自己的時代到了。今年2月,在ChatGPT引發(fā)科技圈、創(chuàng)投圈討論熱潮的時候,李志飛也表示自己要進行大模型創(chuàng)業(yè),做“中國的OpenAI”。

“未來大模型賽道會非常卷。”3月底,在北京辦公室接受《中國企業(yè)家》采訪時,李志飛預測道,“我認為一兩年后,中國至少50家以上公司都會擁有自己的大模型。” 這也帶給李志飛更多信心,“大模型的落地是一件長期主義的事情!痹谒磥,經(jīng)過十年發(fā)展的出門問問在生成式AI領域,“已經(jīng)有了技術的積累和應用落地的優(yōu)勢”。

李志飛還透露,4月20日,出門問問AIGC戰(zhàn)略發(fā)布會將在北京舉行,他將攜出門問問的自主中文大模型和面向全球創(chuàng)作者的AIGC產(chǎn)品亮相。

以下為李志飛的采訪整理,有刪節(jié)。

世界觀被顛覆了

剛剛得知OpenAI做出ChatGPT的消息時,我特別興奮。

早在10年前,甚至讀博士期間,我就已經(jīng)在思考AI的認知問題,但一直沒找到答案。所以當OpenAI的ChatGPT可以自然地進行上下文對話,且隨便聊都不會被問倒時,我覺得自己的世界觀被顛覆了。

因為它不單單是能在規(guī)則和邊界很清晰的環(huán)境里計算下象棋/圍棋的程序,還解決了在我們看來最難的問題――認知,并學會了用自然語言跟人交互。在微軟那篇《AGI的火花:GPT-4早期實驗》的最新論文里,GPT-4還幫人寫了一道很多大學生都做不出的動態(tài)規(guī)劃程序題,我自己看到那道題都想了一會兒。

這些讓我成為AGI的無腦支持者的同時,也對ChatGPT和OpenAI產(chǎn)生了巨大的好奇心:ChatGPT到底是怎么做出來的?為什么是OpenAI而不是別人?帶著這兩個疑問,我在春節(jié)后第二天飛往美國,和很多人聊,其中就包括OpenAI的工程師。

聊過之后我發(fā)現(xiàn),ChatGPT不是單純地靠很多聰明人以及前沿的技術去實現(xiàn)的。在硅谷,天才到處都是,Google Brain更是有超過1000個博士在專門研究AI,而且ChatGPT的底層技術中的Transformer、Instruction Tuning等都是谷歌研發(fā)的。

但為什么是OpenAI?我覺得核心是因為他們創(chuàng)造了一個環(huán)境,既有top down的規(guī)劃,高層對AI有足夠強的信念,堅持不動搖;又有bottom up的執(zhí)行,員工可以完美執(zhí)行這些規(guī)劃,兩種因素疊加造就了OpenAI能夠在這一路徑上走得長遠。并且,從GPT-3開始,OpenAI就得到了正向的反饋,這也鼓勵他們在這個方向上不斷迭代,越來越強。

這種極度的興奮感持續(xù)了近兩個月。不僅是我,前兩個月所有人都很急,大家都怕被大浪卷走。

但我現(xiàn)在的心態(tài)比前兩個月好很多,也冷靜得多。ChatGPT并不完美,關于它的落地,有太多問題需要解決,實現(xiàn)AGI是一件長期主義的事情?赡芪磥5~10年,我都要all in其中。我能做的,就是在理性狀態(tài)下,把這件事做好,同時也經(jīng)營好公司。因為訓練大模型一直是我們的企業(yè)行為,而非我個人,所以在投入上得理性。

在大模型創(chuàng)業(yè)上,我們其實早有準備。很多近一年成立的生成式AI的公司,整個團隊可能就幾十個人,我們公司有幾百人。2020年GPT-3剛出來時,我們就開始嘗試做大模型,2022年9月ChatGPT還沒有問世時,我們已經(jīng)嘗試做大模型的應用落地,當時是被Jasper.AI啟發(fā),我覺得內(nèi)容生成才是最適合GPT-3落地的應用。我當時和團隊溝通,不能只做應用,我們一定要夯實自己的大模型能力,于是我們開始重新做長期規(guī)劃。

很多人聽了OpenAI的投入后會產(chǎn)生一種誤解,覺得大模型研發(fā)訓練要10億美元,但我們做的偏落地,因此我們不見得需要10億美元。

盡管很多投資人對我的項目感興趣,但我依然覺得,我們公司有足夠的錢去做自己想要做的事情。除非是我自己單獨出來做這件事,否則投資人要看的是出門問問整體的狀況,包括公司估值、未來故事、商業(yè)模式等,這些加起來就會變得很復雜,因此我目前沒有考慮融資的事情。

目前國內(nèi)還沒有探索AI能力天花板的充足環(huán)境,因此在公司層面,我更多考慮的是AI應用和落地,能夠解決真正的問題,AGI變得越平民化越好,這也更適合出門問問現(xiàn)在的狀態(tài)。

至于AGI未來的形態(tài)以及技術的演化,它只是我個人的研究興趣。畢竟,OpenAI這種能夠探索AI能力天花板的公司,在全世界都是鳳毛麟角的;復制或重做一個中國的OpenAI,既沒有那么大的價值,也沒有那么大的概率。

我覺得我們現(xiàn)在的狀態(tài)是最好的。雖然沒有OpenAI的“特種軍”,但我有一支“常規(guī)軍”,包含訓練模型、產(chǎn)品研發(fā)、商業(yè)化等部門,可以跟上技術潮流不斷去迭代。我們有幾款產(chǎn)品跟生成AI有很大關聯(lián)。除了語音助手這一拳頭產(chǎn)品外,我們還做過很多AIGC產(chǎn)品,比如AI聲音平臺“魔音工坊”、AI寫作平臺“奇妙文”、AI繪畫平臺“言之畫”、數(shù)字人(8.960, 0.04, 0.45%)視頻與直播平臺“奇妙元”等,能打通從大模型到產(chǎn)品到商業(yè)化的商業(yè)閉環(huán),且擁有很好的營收規(guī)模,這可能在全世界都是獨一無二的。

其次,我不會為了融資去給資本講很多故事,某種程度上迎合資本不可避免地會導致變形,我們有自己的產(chǎn)品和落地場景,這是我們最好的地方。從長期來看,我們的優(yōu)勢在于堅信AI,未來5年時間我們可以為它不停地迭代,然后比較長期地做這件事。

還有一點優(yōu)勢在于,國內(nèi)AIGC創(chuàng)業(yè)CEO里,我能看懂所有的前沿論文,也清楚整個語言模型的發(fā)展歷程及其理論進化的來龍去脈,我肯定比絕大部分CEO更懂這些東西。

調(diào)整力度最大的一年

盡管我現(xiàn)在堅定不移地相信AI,對長期主義保持了樂觀心態(tài),但其實幾年前我特別悲觀。

2020年之前,我沒那么信AI,雖然我們是一家AI公司,但我既不堅信這個東西一定能夠做得好,也不認為它會給社會帶來巨大的價值。有時我甚至會想,“有生之年我都看不到AGI(通用人工智能)了”。

2019年之后,我甚至不想對外發(fā)聲了,覺得很多時候說話沒有意義,既改變不了行業(yè),也改變不了大家對AI的普遍認知,除非能證明自己比別人厲害,否則就是浪費時間。

除了對技術的失望外,2019年也是我和公司發(fā)展的一個低谷期。

最初創(chuàng)業(yè)時,尤其是2017年前,我一股腦地投入到技術、產(chǎn)品的研發(fā)和商業(yè)化上,完全不care其他東西。但到了2018年,尤其是2019年后,我感覺自己見到了商業(yè)或者說創(chuàng)業(yè)的真相,發(fā)現(xiàn)想要變成一家賺錢的科技公司,沒那么容易。

過往因為AI商業(yè)模式的問題,很多營收并不可持續(xù)。如果繼續(xù)投入,只會飲鴆止渴、越陷越深,從而把自己禁錮住。

看到真相后,經(jīng)慎重考慮,在2019年,我對出門問問進行了一輪大的調(diào)整,精簡了業(yè)務線,放棄部分虧錢的to B項目以及智能硬件等業(yè)務。

2020年,我又進行了一輪大的調(diào)整,甚至可以說這一年是調(diào)整力度最大的一年。幸運的是,由于我們及時地進行業(yè)務線調(diào)整,有了多出來的人手,一部分產(chǎn)品經(jīng)理在2020年初開始做AIGC領域的嘗試,并積累了AI生成方面的經(jīng)驗。

同時,2020年OpenAI的GPT-3橫空出世后帶來行業(yè)巨變,直接推動了我信仰的轉變,讓我見到了AGI實現(xiàn)的可能,我也重新燃起了探索AGI的興趣。

2021年,我在公司內(nèi)組建了一個十幾人團隊,拿出不超過一百萬美元的算力費用,訓練出了一個60億參數(shù)的模型。由于當時大家參考的都是GPT-3,對比之下,我們60億模型的“舉一反三”能力很弱,這讓我們很絕望,覺得太難了。因此我們直接下了結論,60億模型根本涌現(xiàn)不出in-context learning(上下文學習)能力。

還有一點,如果要進一步增大參數(shù)規(guī)模,訓練一個千億級別的規(guī)模,就太燒錢了。因為OpenAI,大家都知道了,1750億參數(shù)的模型,訓練一次就要400多萬美元,而且需要多次訓練才有可能成功,這個費用幾乎上不封頂。

不僅如此,當時我們也沒有找到模型落地的應用形態(tài)和商業(yè)化方式。我每天帶著團隊像搞科研一樣讀論文,這個狀態(tài)對于一家創(chuàng)業(yè)公司來說很奇怪,我們又不是一家科研公司。

現(xiàn)在回想起來,我們當時在應用端挑戰(zhàn)“舉一反三”的能力完全沒必要,甚至可以說是鉆牛角尖。如果我們換成后來谷歌在2022年提出的instruction tuning(指令微調(diào))方向研究,效果可能更好。

不過,這也不代表我們的嘗試是無用功。至少比起市面上其他大模型創(chuàng)業(yè)團隊,我們已經(jīng)部分領先了關于分布式訓練框架的選擇標準,以及數(shù)據(jù)標記、團隊分工、人才需求等方面的認知。

非典型創(chuàng)業(yè)者找到了“第二春”

現(xiàn)在,我們的員工都在為了大模型的發(fā)布而加班加點的工作,但某種程度上,我不希望公司(員工)太努力。

這種“反卷”也體現(xiàn)在我們辦公地點的選擇上。2020年,我們北京的辦公室從中關村(6.300, 0.07, 1.12%)搬到了西直門附近,減少團隊長期在一個固定地點被“一窩端”挖角的可能性。

在此基礎上,我們現(xiàn)在采取了極度分布式的辦公模式,把員工分散在北京、上海、武漢、深圳、臺北、蘇州、南京等城市辦公。如果這樣公司能不“掛掉”,而且能正常產(chǎn)出,我認為這在未來可能有很大的競爭力。

可以說,在中國的創(chuàng)業(yè)圈里,我肯定不是一個“正!钡膭(chuàng)業(yè)者。我有時候會對靠組織、文化、時間拼出來的企業(yè)產(chǎn)生質(zhì)疑。我總覺得搞這些事情會讓很多人喪失想象力,或者他們會因此疲于奔命。

我一直以來都是把更多時間花在做事情本身上,這可能是一個缺陷,但我覺得任何公司的成功都沒有套路,不要去嘗試把自己變得跟別人一模一樣。我覺得必須承認人就是人,不是神。每個人包括我,都有自己的興趣愛好,我就是對做事情本身更加感興趣,我愿意花更多時間在事情上,我對組織、文化就是沒那么“感冒”,而且某種程度上我是反對這些東西的。

我把自己的這種狀態(tài)歸結于偏向硅谷。因為我希望能夠用高度分布式的、某種程度上算作躺平式的管理方式來做出創(chuàng)新,在這種狀態(tài)下,偶爾加班可以做得更好。我覺得硅谷很多公司,尤其是創(chuàng)業(yè)公司都如此。

如果在硅谷仔細觀察,大家就會發(fā)現(xiàn)硅谷絕對是躺平的:躺得妥妥的,員工都不去上班。Facebook的員工為什么還去上班?是因為他們大部分是想去公司充電、吃午餐。

盡管他們都不上班,但這一個多月以來美國科技公司產(chǎn)出的東西依然讓人眼花繚亂,每個公司都是如此。我認為這也證明了組織力或者“好拼好努力”的文化,不見得能搞出最頂尖的創(chuàng)新。

我覺得現(xiàn)在國內(nèi)太喜歡把事情模式化或者格式化,但公司的成功有不同的原因,如果我們這樣(佛系)的公司也能成功,我覺得對于國內(nèi)來說也是很大的進步。

因此,我一直對公司文化沒那么敏感,而且過去我也不喜歡組織,我甚至都不愿意去討論它。

但這次OpenAI的組織,真的太令我好奇了,為什么它能搞出來(GPT)?這確實是一個問題,在中國創(chuàng)業(yè)要做得很成功,可能還是要在組織、文化上花很多精力。

在公司管理上,我認為就是找到適合自己的方式,即用事情來驅(qū)動人,比如說我會給員工找一些有意思的事情,然后讓他在事情中去成長,而不是說跟員工談心。

我不是那種能夠給員工鼓勵打雞血式的領導者。在我看來,錯的就是錯的。員工做錯了,我恨不得跟他說5遍,就像用GPT一樣一直重復,直到讓他理解記住為止。

對于出門問問的未來,我覺得信心比兩三年前強很多,很多時候一個公司能不能做大或者做成什么樣,除了自己努力外,也取決于時代趨勢。我覺得我們正在一個很好的趨勢上。我們現(xiàn)在好像找到了“第二春”,而且都提前布局好了,對未來的發(fā)展,我的預期是:上不設限。


微信掃描分享本文到朋友圈
掃碼關注5G通信官方公眾號,免費領取以下5G精品資料
  • 1、回復“YD5GAI”免費領取《中國移動:5G網(wǎng)絡AI應用典型場景技術解決方案白皮書
  • 2、回復“5G6G”免費領取《5G_6G毫米波測試技術白皮書-2022_03-21
  • 3、回復“YD6G”免費領取《中國移動:6G至簡無線接入網(wǎng)白皮書
  • 4、回復“LTBPS”免費領取《《中國聯(lián)通5G終端白皮書》
  • 5、回復“ZGDX”免費領取《中國電信5GNTN技術白皮書
  • 6、回復“TXSB”免費領取《通信設備安裝工程施工工藝圖解
  • 7、回復“YDSL”免費領取《中國移動算力并網(wǎng)白皮書
  • 8、回復“5GX3”免費領取《R1623501-g605G的系統(tǒng)架構1
  • 本周熱點本月熱點

     

      最熱通信招聘

      最新招聘信息