自從 DeepSeek 那次震撼科技界的事件發生,轉眼已經進入第二個禮拜。隨著時間沉澱,各位業界大佬的深入分析也讓我對這件事有了更清晰的認識。今天想在這裡嘗試用更白話的方式分享給大家。
當事情剛發生時,先不說直接被影響的同行ChatGPT,但芯片行業也被影響,當時的我是覺得有點過度恐慌,多麽不應該啊。畢竟AI根本還沒有很普及,需求不可能沒有。後來沉澱了一天發現,那是因為自己用了長遠的眼光看待事情。而市場是存在短期的交易的資金,所以總是會受短期的好壞影響。那麼問題來了,短期內到底是什麼原因導致美國芯片尤其Nvidia如此下跌呢?還聽說其他芯片如AMD,Intel 等其他半導體公司可能有機會受惠是不是真的?看完這篇希望各位心中能有一個答案。
廉價高效的DeepSeek
DeepSeek 最吸引人的地方在於它的低成本高效——這可以說是它唯一且最突出的優勢。因為他並沒有超越目前的領頭羊ChatGPT。我就是从這點出發,去尋找它是怎麼辦到的,希望能得到啟發,摸清未來。
經過一番調查,我總結出三個值得深究的疑點:
📌不需強大算力卻能做到 ChatGPT 那樣精準的回答?
市場上有人質疑:這是不是因為 DeepSeek 利用模型“蒸餾”技術,從 ChatGPT 那裡偷學了回應秘訣?
📌DeepSeek 是否藉由 PTX 技術繞過了 Nvidia 的CUDA?
有傳言說,因為 DeepSeek 使用了更低階的 PTX 技術,而不是依賴高階 CUDA 函式庫,它未來就能擺脫對 Nvidia 芯片的依賴,甚至在 AMD 等其他晶片上運行。
📌DeepSeek 背後是否仍然使用大量 Nvidia 晶片?
最近有報導質疑 DeepSeek 是否透過新加坡的中介,繞過美國出口限制,取得了許多受限的高階 Nvidia 晶片。
模型蒸餾技術(Model Distillation)
市場上包括OpenAI本身都有懷疑DeepSeek靠“蒸餾”ChatGPT來達成短時間低成本的訓練模型。什麼是“蒸餾”?老高與小茉在他的DeepSeek視頻中講的很直白,就是一種類似對先進模型ChatGPT問各種問題,讓新模型DeepSeek从問答中優化,不需要从0開始培養,少走冤枉路從而實現低成本短時間見效的成果。
被認為是模型蒸餾,其實是因為,很多人在運用DeepSeek時發現答案和ChatGPT相似。有趣的是,它生成的本文曾經被人使用AI檢測工具判斷為“ChatGPT 風格”而且相似度高達99%。搞得好像是有人發現了和你家味道一模一樣的秘製醬料,讓人不得不懷疑秘方是不是被偷走了。
其他跡象包括 OpenAI 的報告及業內人士,David Sacks也指出,DeepSeek 不僅複製內容,甚至連回應格式、API 金鑰結構等細節都與 ChatGPT 相似。此外,安全研究人員發現 DeepSeek 相關帳號頻繁查詢 ChatGPT API(獲取數據的連結口),可能是系統性擷取回應以訓練自身模型。
總之,這些跡象讓市場普遍懷疑 DeepSeek 很可能使用了模型蒸餾技術,但目前這還不足以作為法律指控的證據。
PTX技術可減少對Nvidia芯片的依賴?
要理解什麽是PTX技術,就要懂什麽是 CUDA,要懂 CUDA 就要先懂芯片的基層電板,二進制碼,聽了都覺得可怕?別怕。這幾個課題,大多數網絡上都是分開的大課題,你鏈接不起來就聽起來複雜,好比:oo w h raye u 和 how are you 一樣,即便一樣的字母但沒有好好排整齊和鏈接,就特別難理解一樣。但今天我嘗試將它簡單的連在一起讓大家更能明白。
你知道今天電腦/軟件是怎麽形成的嗎?他的最底層就是電,電板硬件,而Transistor(晶體管),它的作用類似於電流開關的門,是重要硬件之一,電能通過就是 On 或 1,不通就是 Off 或 0。那麽Transistor一連串下來的開關就會形成1和0的二進制碼,一串1和0就能夠代表很多東西了,數字,字母甚至顔色,到動畫等等,一堆 transistor 的結合就是 IC(集成電路),一堆IC結合可以形成 CPU/GPU 等芯片,以此類推,就形成今天强大的軟件應用。
但問題來了,如何控制這些0和1,讓它們形成我們日常使用的軟件?我們不可能直接操控每個Transistor的開關,因此才有了高級編程語言,比如Python、C/C++、Fortran等,這些語言的作用,就是讓我們用更易理解的簡單英語來與硬件溝通。而Nvidia的CUDA,正是一種整合軟硬件的開發平台,讓開發者能夠透過簡單的高級編程語言,那麽通過CUDA你就能靠一些軟件界面,按鍵,設計好的功能,一些比較簡單的高級編程語言來和GPU硬件進行溝通,來開發你想要的模型。而什麽是PTX? PTX就是比CUDA低層,更接近GPU芯片hardware的低級編程語言。可以把它想像成是一種更接近GPU硬件的“機器鄉音”,讓開發者可以更精細地控制GPU資源,提高運行效率。看下圖幫助理解:
其實Nvidia 真正的護城河是CUDA。因為它做到了軟硬件的深度整合。應用CUDA比起直接編程容易許多,但你要使用CUDA,你就必須用Nvidia芯片,這種強制綁定形成了巨大的市場壟斷。上次就因爲這樣被很多反壟斷監管盯上的。現如今,DeepSeek透過直接使用PTX進行低層次優化,在某些任務上達到高達 10 倍的效率提升,展現了很强大的工程能力。好,到這裏是不是和網絡上的傳聞説的一樣,未來大家(尤其被制裁不能用Nvidia的地區)是不是都可學習DeepSeek不再依賴Nvidia CUDA,甚至其芯片了呢?很可惜,NO!
我從tom's Hardware的網站(鏈接)的資料得知,PTX其實是Nvidia CUDA生態的一部分。即使避開了高階的 CUDA 函式庫,轉而手動調整 PTX 代碼,這仍然依賴於 NVIDIA 芯片的架構。換句話說,儘管PTX可以在更底層調整運行效率,甚至可能讓某些代碼適應更廣泛的硬件環境,但它仍然是專為Nvidia的GPU設計的,並不能簡單地移植到AMD或其他廠商的芯片上。結論是?芯片?還是需要的。只不過會對CUDA的依賴可能減少了。
説到底背後好像用了不少Nvidia芯片?
近期有報導質疑中國人工智慧初創公司 DeepSeek 是否透過新加坡的中介,繞過美國對高階 NVIDIA 晶片的出口限制,取得這些受限的晶片。美國官員正在調查此事,以確定是否有違反出口管制的行為。
DeepSeek 自己也表示,其模型訓練主要使用 NVIDIA 的 H800 晶片,這些晶片符合美國的出口規範。然而,有報導指出,DeepSeek 可能擁有約五萬個 NVIDIA H100 晶片,這些晶片的取得方式引發外界關注。還有數據指向可能經由新加坡進口這些被限制的高端芯片。因爲新加坡小國家居然是 NVIDIA 晶片的第四大買家,佔公司收入的 15%。這讓許多人懷疑,中國是否通過新加坡進口這些受限的高端芯片。但目前也只是傳聞階段沒有證據。
但明眼人的都知道的,美國對中國制裁,中國肯定有辦法繞過。除非美國對全球所有國家實施封鎖,否則中國總能通過第三方市場獲取高端芯片。美國政府也清楚這一點,他們的目標不是完全阻止中國獲取高端芯片,而是拖慢中國的技術進步,迫使中國以更高的成本、更長的時間來獲取這些關鍵技術罷了。
結論
那麽説到底,從長期來看,Nvidia芯片還是會供不應求的。對於CUDA方面,其實有能力繞道CUDA的公司,我覺不多,這是需要硬實力的。其實DeepSeek目前爆出來的低成本,很可能并不包括其背後幻方量化的人才和資本的貢獻。因此,真正能夠完全擺脫CUDA依賴、走出Nvidia生態圈的公司,可能寥寥無幾。
喜歡我粗淺内容的話,可以訂閲,按下方"隨緣捐款"請我喝杯咖啡支持一下我喲~ 謝啦!