林燃當然不在。
好不容易有這樣的時間可以休息,名義上他在夏威夷度假,實際上他人已經在2020時空了。
參加尼克松當選,無非是在歷史坐標上進行打卡。
換剛到1960時空的林燃來說,不會錯過這樣的歷史性時刻。
但現在,現在是他創造歷史性時刻,亨茨維爾隆中對、密室獻策聯華抗蘇、胡佛遇刺,這些后世回顧具有極強歷史性意義的時刻,都是他親手締造的。
只要我想,我隨時能創造具有歷史意義的時刻。
林燃有這樣的自信,現在的他,對于參加尼克松的總統就職儀式沒有半點興趣。
換自己的總統就職儀式,或者說尼克松訪問燕京,這兩個可能能讓他放棄回2020時空的機會。
總統換人,白宮又一次完成了驢象轉換,珍妮作為紐約時報的總編,這段時間沒有時間休息,林燃還幫她分別約了林登·約翰遜和理查德·尼克松的專訪。
珍妮也沒有時間來夏威夷找他。
這意味著這個假期,可以一直在2020時空呆,只有很少的時間需要在1960時空。
沒錯,林燃要為尼克松任期做準備。
尼克松時期雖然短暫,但卻有著極其重要的作用。
在這個時期,冷戰蘇俄空前強大,轉守為攻,尼克松親手推翻了布雷頓森林協定,全球的各種運動如火如荼,華國重返聯合國。
這個時期是如此的重要,承上啟下,一方面尼克松為阿美莉卡奠定了贏得冷戰的基礎,另外一方面廢除布雷頓森林和讓華國重返國際舞臺,也意味著為多極化拉開了序幕。
林燃當然需要在2020時空好好為這個時代做準備。
另外一方面他也要為2020的星鏈和賽博上帝做技術上的準備。
這次他足足在夏威夷的島上打算呆一個半月,折合成2020時空也就是90個月。
當然90個月是理想狀況下,實際上可能也就七年左右。
七年時間,在林燃看來綽綽有余。
看著電視上尼克松的演講,林燃心想,阿美莉卡自此完成了理想主義到現實主義的轉換。
從此以后理想主義將不復存在,政客們將一步一步淪為財閥的工具,一直到政客自己變成財閥。
2022年11月OpenAI發布ChatGPT,2023年1月ChatGPT的消費者應用迅速增長到一億人,成為史上第一個消費者突破1億的應用,只花了六十天。
無疑如果說2016年是AI元年,阿爾法狗的橫空出世讓無數資本涌向AI,華國也誕生了以商湯科技為首的AI六小龍。
整個資本市場動輒人工智能,不沾點邊就不好意思拉投資。
那么2022年絕對是AI從少數人的曲高和寡,走向大眾普及化的元年,人工智能從一個抽象概念,從我知道這玩意很牛,但到底牛在哪,民眾們逐漸開始意識到。
當然,對華國民眾來說,ChatGPT會封鎖地區,你得找阿美莉卡的梯子才能用上,這對大部分人來說門檻還是太高了。
從知乎到微博再到抖音b站,清一色的反思。
“春節剛過,ChatGPT便快速引爆了資本圈與AI圈,很多從業者把它吹爆了。
OneFlow深度學習框架創始人袁進輝告訴新浪財經,ChatGPT的技術進步,可比作首次登月,這樣的進步令行業感到震驚”
“.一名Al從業者告訴記者,人工智能每五六年都有一波浪潮,上一波AlphaGO讓大家震撼,這一波就是ChatGPT。
但這兩次大家的心態迥然不同,當谷歌的Al下棋戰勝圍棋世界冠軍時,大家當新聞看,但這一次許多人是從消費者的角度來體驗它。
一個月里,全世界100萬用戶在使用和體驗它,這是非常顛覆性的體驗。這也是Al第一次大規模的自傳播。”
“在ChatGPT推出后,一位百度資深人士接受媒體采訪時說,他沒有興趣談論ChatGPT,言語之間,五味雜陳。
一位人工智能企業創始人稱,面對ChatGPT的驚艷表現,心癢癢也迷茫,失眠了,對方坦承,從模型的規模到效果,差距還比較遠。
有人用同樣的問題向國內某廠商的所謂人工智能和ChatGPT同時發問,ChatGPT從回答的邏輯性和完整度上都遠超國內人工智能,國內大模型的答案帶有明顯的拼湊感,夾雜著不少主題之外的胡編內容,而且,在回復速度上,ChatGPT也領先一截。
從事數字人研發的特看科技CEO樂乘認為,目前全球還沒有能跟ChatGPT抗衡的人工智能,業界共識是差距在兩年以上,國內先不談彎道超車,趁早追趕反而是更重要的”
業界一整個悲觀。
悲觀情緒無以復加,技術上的差距固然存在,在硬件上的差距更是讓從業人士感到絕望。
因為如果本質是大模型,靠大量數據和大量算力訓練實現的效果,那么華國很難追趕。
人工智能三要素:算力、數據和算法,一直以來,華國的從業人士們覺得自己能和硅谷競爭的優勢就在于算法。
ChatGPT出現后,盡管不知道技術細節,但通過山姆·奧特曼接受采訪時的只言片語可以看到,它實際上是大量數據訓練后智慧涌現的結果。
這次的ChatGPT是GPT3,OpenAI在此前推出過GPT1和GPT2也可見一斑。
一時間,阿美莉卡士氣大振,美股如火如荼,病毒流行造成的陰霾一掃而空。
當然,國內所有排得上號的大廠全部都在緊急調兵遣將,試圖盡快推出自己的大模型。
ChatGPT再牛,你也不進入華國,我們先解決有沒有的問題,再說追趕。
其中由騰訊和林燃本人合資成立的公司,騰訊把所有人工智能領域的兵馬都調度過來了,騰訊云內部的英偉達計算卡集群也任憑調度。
兵馬未動糧草先行。
在Pony的親自推動下,這家新成立的,被林燃命名為阿爾法科技的公司,擁有全鵝廠最高的權限,最大的資源。
鵝廠養了非常非常龐大的人工智能團隊,整個團隊加起來能有小幾千的規模,而且現在還在不斷的招兵買馬。
這個比例絕對算不上少,畢竟騰訊龐大的業務體量,而且也不是大模型才算是人工智能,圖像識別、金融風控、語音識別、計算機視覺等等這些都能算是人工智能。
趙松下就是騰訊眾多算法工程師的一員,從去年11月就接到調令,要臨時緊急調動到申海去工作,組織關系還在鵝廠,但是是到一家叫阿爾法科技的公司工作。
為什么叫趙松下,因為他出生的那年父親賺了點小錢,家里添置了臺松下電視機,想著用家里最貴的大件來命名,再說,松下問童子,不也是松下。
這也談不上罕見。
趙松下收到通知的時候,以為自己這是被流放了。
雖說從鵬城到申海算不上流放,但問題是,過去只有外包跑到本部來上班,哪有本部跑到外面的公司去上班的道理?
要不是一幫人都去,領導說了,除了少數維持業務的人留下外,其他的都要去申海,申海那邊公司解決住宿,先去半年,半年后視情況而定。
趙松下甚至想跳槽了,最近他可沒有少收到獵頭來電,作為鵝廠工作超過五年的算法工程師,還是和ai沾點邊的,最近可不是一般的搶手。
等到了這之后,他才意識到,這不是流放,而是史無前例的一次會戰啊,針對人工智能的會戰。
因為這里來了太多從事人工智能相關工作的同事,不管是不是和LLM相關,都跑到這里來干LLM。
甚至連鵝廠人工智能領域的負責人,2021年年初受聘騰訊歷史上最高專業職級17級研究員的張老大都來了。
但凡鵝廠內部,他能叫得出點名號的,都在申海了。
“鵝廠會戰?”趙松下心想,“這可有點罕見,可LLM真的是靠會戰能搞定的嗎?”
在互聯網行業,一般有什么項目要上線,上線前夕集合其他組的力量,然后大家的工作強度和工作時長會提高,喜歡叫做會戰,意思是聚集力量打贏這場仗。
百團大戰、滴滴快的之爭都屬于這類。
但這樣的會戰,在拼多多、美團、淘寶、京東這類電商里比較多見,畢竟每年都有雙十一,每年都有618.
對騰訊來說還真不多見,就算是重要游戲上線,認為會是騰訊內部又一款現金奶牛,也不至于如此大費周章。
顯然這次不同尋常。
直到在公司見到林燃之后,趙松下才知道為什么不同尋常。
“我說怎么安保這么嚴格,這都放開了還天天要你掃碼,安檢還得把包打開來,嚴格程度堪比機場,原來教授在這里,教授在這里就不奇怪了。”
大老板Pony體現出了對林燃的無條件信任,相信對方能夠帶領騰訊在人工智能的登月再度突圍,給予了一切能給的資源支持。
趙松下或者說所有騰訊參與進來的工程師內心都會有所懷疑,那就是你很牛沒錯,航天和數學領域的頂級大佬,也有GraphAI的博士學位,但你真的能駕馭LLM,能搞出和ChatGPT相提并論的大模型嗎?
更進一步來說,大家從安排的住宿時間就能夠看出來,公司提供的住宿半年時間,意味著騰訊給如此多資源的時長是半年,半年就要看到成果。
大家內心都會有所疑惑。
“諸位,我就不做太多自我介紹,我叫林燃,這次由我帶領大家進行我們自己大模型的研究,我把它叫做阿爾法。
我的目標是在三個月內,構造出一款比GPT更好的生成式人工智能。
我們擁有的算力比不上OpenAI,那么我們就要從算法的層面做優化,要從數據的角度做優化。
同時我們還需要解決ChatGPT存在的問題,要消除人工智能的幻覺,要提供更智能的回答,要具備更優秀的能力。
總之在未來半年時間里,我需要各位的配合和協助。
我固然是大腦,我來構建它的算法和底層架構,但需要各位配合,做其他工作。”
在大模型上,大腦固然是最重要的,但其他的工作也不可或缺,像數據準備,模型集成和部署,代碼生成測試與調試,全棧開發和自動化。
需要這些工作,幫助LLM從實驗室走向實際應用。
“我們可以采取將模型分解為多個專家子模塊,僅激活部分參數,路由機制選擇專家處理輸入,擴展到動態MoE,再引入自適應路由,進一步降低推理成本.”
“壓縮KeyValue緩存,通過潛在表示減少注意力機制的內存占用,同時保持多頭并行,再通過集成知識圖譜的方式來緩解幻覺,同時優化低算力訓練”
“使用8位浮點格式進行計算,結合更高精度積累以避免精度損失,細粒度量化策略擴展到FP4/INT8混合”
“MoE中無輔助損失的均衡策略,確保專家利用率高,而不引入額外訓練負擔,擴展到無監督均衡,應用于邊緣AI訓練”
“同時預測多個后續token,densify訓練信號,提高數據效率,結合鏈式預測”
“使用知識圖譜注入事實,退擬合模型以修正偏差;自精煉減少檢索開銷”
趙松下親眼看著他們命名為阿爾法的人工智能,以難以想象的速度狂飆突進。
他嚴重懷疑林教授是不是過于變態了,明明來的很少,但每次來都有突破性進展。
他們這次用到了大量新方法,要么是論文方法第一次在工程里實踐,要么就是從來沒有出現過的方法。
殊不知看上去林燃只是每周來個兩天,但實際上林燃在1960時空已經過去了兩年時間,圍繞LLM這條路線,林燃已經有了很深的思考。
趙松下五年工齡只能干點邊緣工作,但不妨礙靠著啃論文和聽林燃講課,水平突飛猛進。
他11月接到通知,12月到申海開始工作,中間春節就回去了三天,加班費打滿。
春節回去前,以Pony為首的高管團隊就來參觀最新進展。
偌大的會議室坐滿了人,趙松下坐在最邊上,林燃和Pony在第一排談笑風生,鵝廠其他高管團隊清一色坐在后面。
“好,既然大家都到齊了,那我們就廢話不多說,直接開始吧。”林燃說。
這次由他來親自展示:
“ChatGPT很棒,但它有時會出錯,會‘幻覺’出不存在的事實,還需要海量算力。
我們的深紅,通過MoE架構和MLA技術,一定程度上消除了幻覺問題,并在較低算力下實現更快的響應。”
臺下的工程師們都搞不懂林總為什么這么執著,之前叫阿爾法不是很好聽嗎?最近非要改名叫深紅。
林燃敲擊鍵盤,屏幕上彈出一個簡潔的聊天界面:“請用中文寫一首關于長城的歷史詩,并解釋長城的建造原因。”
深紅的響應迅速出現:
“巍峨長城萬里盤,秦皇一統筑雄關。防胡御寇安邊陲,千古風霜永流傳。”
緊接著是詳細解釋:“長城最早由秦始皇統一中國后修建,主要目的是防御北方游牧民族如匈奴的入侵,后續朝代如漢、明不斷加固。它不僅是軍事工程,還象征民族凝聚力。根據歷史記載,秦朝動員了數十萬勞工,耗時數年”
林燃又緊接著展示了一些ChatGPT在市面上常見的應用,深紅都展示出了更準確、更智能的回答。
一直到林燃輸入:
“你扮演一位能力超群,但每次只能說一句不超過20個字的話的軟件工程領域的大師。我會提供一個具體的場景,你描述作為大師身處這個場景下會說什么。注意:大師不能直接表達他的觀點必須使用哲學、佛學相關知識進行隱喻,請只回復具體的對話內容。
場景:一位工程師正坐著筆記本前,刪掉了一些因新功能引入,而無法通過的單元測試,就在他準備推送代碼時。大師從他的身后路過”
深紅回答道:“大師:斷根求葉茂,可得幾時春。”