導(dǎo)讀:當?shù)貢r間27日,DeepSeek應(yīng)用登頂蘋果美國地區(qū)應(yīng)用商店免費App下載排行榜。95后成群的應(yīng)用如何一夜破圈?當?shù)貢r間27日,DeepSeek應(yīng)用登頂蘋果...
當?shù)貢r間27日,DeepSeek應(yīng)用登頂蘋果美國地區(qū)應(yīng)用商店免費App下載排行榜。95后成群的應(yīng)用如何一夜“破圈”?
當?shù)貢r間27日,DeepSeek應(yīng)用登頂蘋果美國地區(qū)應(yīng)用商店免費App下載排行榜,在美區(qū)下載榜上超越了ChatGPT。Meta、Open AI等科技巨頭員工發(fā)帖稱,公司內(nèi)部已開啟了“恐慌模式”,緊急制定對策。德國經(jīng)濟學家豪爾格·查皮茲表示,DeepSeek將成為“美國股市的最大威脅”。美國“投資百科”網(wǎng)站稱,特朗普才剛剛喊出5000億美元的“星際之門”計劃,就被中國一個僅僅訓(xùn)練了2個月的AI模型打擊了信心。
當?shù)貢r間27日,阿斯麥、英偉達、博通盤前跌超10%,臺積電跌超9%。
據(jù)報道,DeepSeek創(chuàng)始人梁文鋒1985年出生于廣東省湛江市吳川市,根據(jù)領(lǐng)英等網(wǎng)站公開可查的資料,DeepSeek團隊成員約超過一半為95后,90后占比超過75%。梁文鋒曾表示,公司員工“都是一些Top高校的應(yīng)屆畢業(yè)生、沒畢業(yè)的博四、博五實習生,還有一些畢業(yè)才幾年的年輕人”。DeepSeek內(nèi)部的團隊氛圍也較為寬松,梁文鋒曾表示團隊中每一個成員可以調(diào)用的資源都“沒有上限”,并且管理制度上非常推崇扁平化。
“低成本訓(xùn)練”震撼美國巨頭
專家:對美股泡沫沖擊大
去年12月26日,DeepSeek發(fā)布的V3模型就初露鋒芒,以大約Open AI二十分之一的訓(xùn)練成本獲得了比肩世界頂級性能的大模型。緊接著在今年1月20日,DeepSeek再度發(fā)布R1模型。美國加州的Scale AI公司致力于測評各種AI模型的實際性能,其創(chuàng)始人亞歷山大·王在接受采訪時表示:“老實說,我覺得DeepSeek在很多項指標上都達到了美國最先進模型的水平”。
除了性能優(yōu)異,DeepSeek作為一個開源模型,對終端用戶始終免費開放,而它對于開發(fā)者調(diào)用API的收費定價水平幾乎為Open AI的百分之一。此前DeepSeek曾公開回應(yīng)“價格戰(zhàn)”的指控,表示在這樣的定價之下自己仍有合理的利潤結(jié)構(gòu)。低廉的價格來源于該公司在軟件算法層面的創(chuàng)新,改變了美國科技巨頭們囤積GPU顯卡“堆算力”的慣性思維。據(jù)悉R1的訓(xùn)練只調(diào)用了2000余塊顯卡,為期53天,總的訓(xùn)練成本僅為558萬美元,不到其他世界頂級大模型一次訓(xùn)練成本的十分之一。
這樣的極致性價比,讓在AI熱潮下被炒高了兩年的美國科技股感到巨大的“寒意”。豪爾格·查皮茲25日寫道:“這家中國公司以極端低廉的成本,在缺少最頂尖芯片供應(yīng)的情況下打造出一個震動世界的模型,這是對美股泡沫構(gòu)成的最大威脅。”美國經(jīng)濟學家亞德尼表示,“DeepSeek的成功可能會給美股財報季帶來壓力,尤其是在谷歌、Meta和微軟等公司加大AI資本投入的情況下。尤其是微軟,它是OpenAI的最大投資者。”
在DeepSeek熱潮的帶動下,英偉達股價在當?shù)貢r間26日下跌3.12%。27日盤前,英偉達股價重挫超10%,帶動納指期貨下跌4%。英偉達下一次財報公布預(yù)計在2月26日。27日,A股市場迎來春節(jié)前最后一個交易日,一些“算力概念股”也因DeepSeek的成功受到影響。不過和DeepSeek公司關(guān)聯(lián)較深的浙江東方、每日互動等個股出現(xiàn)一字漲停。
此外有Meta員工在論壇匿名發(fā)帖表示,公司內(nèi)部針對DeepSeek崛起的威脅感到高度緊張。“畢竟人家模型的訓(xùn)練成本還不如Meta一位高管的年薪,而我們這里有幾十位這樣的高管,想想這些人怎樣才能向上級交差吧。”
創(chuàng)始人梁文鋒:
85后“老股民”從量化投資起家
據(jù)湛江發(fā)布,DeepSeek創(chuàng)始人梁文鋒是吳川市覃巴鎮(zhèn)米歷嶺村人,父母都是小學語文老師。“85后”的梁文鋒從小就是“學霸”,在數(shù)學方面天賦突出。同學們反映,梁文鋒并非“書呆子”類型,而是很有獨立思考的精神。梁文鋒本科和碩士都就讀于浙江大學,2008年,研究生畢業(yè)的梁文鋒并沒有走上“碼農(nóng)”的道路。當時推崇“量化投資之父”西蒙斯的他和朋友一起在出租屋內(nèi)刻苦鉆研,想要找到對股票價格建模的方法。
2010年,滬深股指期貨推出,這給了梁文鋒充分發(fā)揮計算機建模天賦的機會。很快他的自營資金盤就達到了5億元的水平。2015年,梁文鋒與校友一起共同創(chuàng)立幻方量化,在A股市場系統(tǒng)性地進行量化交易。2021年,幻方量化的資產(chǎn)管理規(guī)模達到千億水平,被譽為國內(nèi)四大頂級量化私募之一。
幻方量化的成功離不開人工智能的深度融合,梁文鋒很早就產(chǎn)生了用AI自動制定量化交易策略的想法,并堅持不懈地付諸實踐。2020年,英偉達發(fā)布了A100芯片,這是英偉達下一代旗艦作品,而幻方量化成為亞太地區(qū)第一批拿到貨的客戶。幻方量化多年來不僅儲備了大量的尖端芯片,而且在軟件算法層面不斷推陳出新,這給梁文鋒在AI領(lǐng)域的創(chuàng)業(yè)奠定了扎實的基礎(chǔ),2023年7月他創(chuàng)立了DeepSeek(全稱“杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司”)。
DeepSeek團隊:
90后、95后為主,喜歡“高潛力年輕人”
據(jù)報道,DeepSeek的員工規(guī)模不到140人,是Open AI的十分之一左右。據(jù)領(lǐng)英網(wǎng)站檢索樣本發(fā)現(xiàn),DeepSeek員工85%以上擁有碩士學位,40%以上有博士學位。團隊成員平均年齡約為28歲,90后占比超75%,95后(1995年后出生)員工占比50%以上。該公司成員大多畢業(yè)于北大、清華、中科大等國內(nèi)頂尖院校,也有少數(shù)畢業(yè)于麻省理工學院、卡內(nèi)基梅隆大學等海外知名高校。同時DeepSeek的員工中也有相當一部分具有交叉學科背景。
和動輒上千人的“大廠”AI開發(fā)團隊相比,DeepSeek百余人的規(guī)模顯得相當精煉,并且在選人標準上兩者也大有不同:互聯(lián)網(wǎng)公司一般看重成熟的經(jīng)驗,最好有在核心項目成功過的經(jīng)歷,而DeepSeek則喜歡“高潛力年輕人”。以該公司選擇的“稀疏訓(xùn)練”技術(shù)路徑為例,剛畢業(yè)的博士生由于在學校里接觸過相關(guān)前沿課題,對這一技術(shù)路徑更加熟悉,而“業(yè)界老鳥”則不一定對最新技術(shù)能保持高度敏感。
據(jù)“智能涌現(xiàn)”,一名曾與DeepSeek有過合作的獵頭表示,DeepSeek非常偏愛沒有工作經(jīng)驗的年輕人,而且指明不要資深人士,“工作經(jīng)驗在3~5年已經(jīng)是最多的了,工作超8年的基本就pass了”。
梁文鋒曾在采訪中表示,留住年輕人才的方法主要是“高薪”和“算力管夠”兩條路。業(yè)內(nèi)人士表示,DeepSeek的薪資水平能夠?qū)藰I(yè)內(nèi)任何頂尖機構(gòu),而且人才如果在字節(jié)跳動等取得offer,DeepSeek還會加碼競爭。DeepSeek開出的應(yīng)屆工程師薪酬已經(jīng)等同于業(yè)界同等崗位的“總監(jiān)/經(jīng)理”的薪酬了。
此外梁文鋒非常推崇“極客文化”,在公司內(nèi)部推行扁平化管理,并且鼓勵員工個人發(fā)揮潛能進行學習和創(chuàng)新。DeepSeek也不會采用互聯(lián)網(wǎng)巨頭常用的“賽馬”機制,減少團隊內(nèi)耗。在算力資源的調(diào)配上,梁文鋒對每個人都不設(shè)上限,只要提出有潛力的思路,他都會給員工調(diào)撥足夠的資源進行嘗試研究。據(jù)悉產(chǎn)生R1模型的技術(shù)思路就是一名年輕員工“突發(fā)奇想”提出的點子,梁文鋒為他搭配了一個團隊,“花了幾個月時間才跑通(技術(shù)路線)”。事實證明,DeepSeek這種“輕經(jīng)驗、重潛力”的用人思路,為中國AI界迎來了一次劃時代的創(chuàng)新發(fā)展。
上一篇:中國空間站送來蛇年新春祝福 祝偉大祖國時和歲豐繁榮昌盛
下一篇:最后一頁