Please ensure Javascript is enabled for purposes of website accessibility DeepSeek標誌著人工智能競爭格局的潛在轉變 - 駿利亨德森投資 - 香港零售投資者(中文)
香港投資者專用

DeepSeek標誌著人工智能競爭格局的潛在轉變

投資組合經理Richard Clode討論目前市場關注DeepSeek的LLM最新發展形勢,以及可能對投資者造成的影響。

Richard Clode, CFA

投資組合經理


2025年1月27日
6 分鐘閱讀

焦點分析:

  • DeepSeek創新的V3 LLM及強化學習推理模型R1似乎表明該公司在提供更有效、更具成本效益的人工智能解決方案上取得進展。
  • 這促使投資者重新評估人工智能投資策略,並且更著重於人工智能的資本支出能否持續、其競爭格局及變現能力。
  • 隨著這股新科技浪潮到來,透過優選方法識別人工智能資本開支受益者,以及展望下一階段的人工智能投資機會至關重要。

DeepSeek(「深度求索」)在大型語言模型 (LLM) 創新路上至今取得的成果。

中國人工智能初創企業和開源大型語言模型 (LLM) 開發商DeepSeek於2024年12月推出第三代V3 LLM。DeepSeek-V3是一種專家混合 (MoE) 模型,與西方最出色的LLM相比可謂不相伯仲。而本月,強化學習推理模型DeepSeek-R1與OpenAI的o1生成預訓練轉換程式 (GPT) 相比亦旗鼓相當。V3使用MoE模型,以幾個較小的模型共同協作,該模型共有6,710億個參數,而在推理過程中每個詞元在任何指定時間只有370億個活動參數。而V3的創新更進一步,例如多頭潛在注意力 (MHLA) 減少緩存和記憶體大小/使用量、FP8的混合精準運算和訓練後階段重構。鑑於MoE在詞元推理期間的任何指定點,只有一部分總參數為處理的狀態,因而似乎更有效。而搭載MoE的V3效率比其他模型大約高出10倍,與其他創新方法相比大約是3-7倍,故V3看來更有效實在不足為奇。據稱,DeepSeek-R1模型的獨一無二之處是棄用監督微調。即使許多主要改進為標準技術,但當中確實有點新意。然而,大家亦對DeepSeek本身究竟下了多少功夫,以及利用了多少開源第三方LLM方面存疑。

市場對DeepSeek憂慮的3大原因

1. DeepSeek的訓練成本明顯較低

DeepSeek聲稱在兩個月內只用2,048張NVIDIA H800 GPU就完成訓練V3。按其大字標題的500萬美元總成本計算,即每小時成本只需2美元。與西方超大規模企業在LLM培訓中所投入資金相比,這只佔一小部分(例如,只佔Meta的LLaMA 3.1 405B模型的9%)。

2. 即使美國實施限制,中國仍可參與競爭

DeepSeek表明,儘管中國目前在獲取美國先進半導體技術上受到限制,但中國公司仍可與美國一流的人工智能公司競爭。這令人想起俄羅斯的一代程式設計師,他們在後蘇聯俄羅斯時期發明了巧妙的編碼方法,以限制個人電腦的使用時間。中國是否亦以相同方法出奇制勝?半限制迫使中國加強LLM架構創新,而美國則只靠傾盡全力作為問題的對策?

3. 人工智能變現

DeepSeek對使用其模型的收費遠低於OpenAI(約低20-40倍),考慮到西方投入的巨額資本開支,眾人自然憂慮人工智能的變現能力。

一股值得關注的人工智能力量

全球人工智能生態系統對DeepSeek的發展虎視眈眈。儘管DeepSeek僅在兩年前(2023年)推出,但背後獲幻方資本 (High-Flyer Capital Management) 量化基金團隊的支持,以及受惠於其上一代模型的成功和創新。現在外間才看清RI的推理能力是一項尖端技術,因而即使V3早於12月推出,而R1則於本月初推出,但市場現在才作出反應。此外,DeepSeek於上週末已超越ChatGPT成為Apple AppStore上最熱門的免費應用程式。發文稱DeepSeek的「此突破是我所見中最驚人和印象最深」,此高度讚揚來自一位信譽昭著的資深業內人士。此類評論令市場更憂慮人工智能的資本開支及NVIDIA等相關公司的可持續發展情況。

我們該如何看待這一切?

  • 全新科技浪潮需要創新思維

任何新的科技浪潮都需要創新,以隨著時間降低成本曲線,從而實現大規模應用。我們正在見證多種途徑的人工智能創新技術,以解決訓練LLM以及更有效推理的擴展問題。DeepSeek似乎為通用和推理模型的架構帶來真正的創新。創新和降低成本是釋放人工智能潛力並實現長期大規模應用的關鍵。

  • 知識蒸餾

DeepSeek的模型利用一種名為「知識蒸餾」的技術,並在人工智能行業中得以廣泛應用。知識蒸餾是指透過將較大的教師模型學習轉至較小的學生模型,使較小的模型具備較大模型的能力。然而,值得注意的是,DeepSeek的知識蒸餾技術都依賴其他人的工作。而依賴程度的多寡是市場目前正在努力解決的重要問題。

  • 認清真實的資本開支數據:

有關上述內容,所提及的資本開支只是拿兩種毫不相關的事情相提並論。上述500萬美元僅涉及一次訓練,並無納入任何之前的訓練和更大的教師模型訓練,無論是在DeepSeek或基於第三方開源LLM。

  • 開源創新

正如人工智能大師楊立昆所言,這是一場推動社群創新的開源模型勝利,DeepSeek利用Meta的Llama和阿里巴巴的Qwen開源模型。這對人工智能的長期發展、推動和促進創新再次賦予正面意義。但鑑於目前的地緣政治局勢,大家可能會認為美國政府將對其他國家/地區在美國使用最先進的人工智能LLM執行更嚴格的審查。

  • LLM商品化?

我們一直認為,鑑於競爭激烈,包括來自開源開發商和尋求透過其他方式變現的競爭對手的競爭,長遠來看,LLM變現將會面臨重重挑戰。DeepSeek的公告只會令人更密切注意通用基礎模型開發商所花的巨額資本開支的投資回報率 (ROI)。

投資啟示

圍繞DeepSeek的憂慮加劇有關人工智能擴展挑戰,以及人工智能資本開支投資回報率的爭論,最終引發大家憂慮人工智能資本開支受益者的可持續收益和市場願意支付的價格。正如最近Meta和Stargate AI項目發佈的公告所述,我們預計人工智能資本開支將繼續保持強勁。但我們認為,我們需要小心選擇人工智能資本開支的受益者,並隨著新科技浪潮的發展思考下一階段的人工智能投資機會。

我們將基礎架構描述為新浪潮的第一階段,其次是平台,然後是軟件、應用程式和服務。我們正接近由雲端主導的平台階段,但仍然觀望人工智能基礎架構的長期投資機會。市場已從憂慮人工智能資本開支過高,扭轉為擔憂人工智能資本開支將會暴跌。然而,兩者不可能同時發生,最終實際結果將會介乎兩個極端之間。而我們認為這些發展最終有利於人工智能的長期健康和發展。我們將繼續甄別人工智能基礎架構受益者,並加大對從更有效的人工智能運算、訓練模型和推理中受益的平台所暴露的風險。

DeepSeek資料來源: https://api-docs.deepseek.com/news/news250120

人工智能詞元(AI token):語言模型處理和生成文字的最小數據單位。

Capex/capital expenditure: company spending to acquire or upgrade physical assets such as buildings, machinery, equipment, technology etc. to maintain or improve operations and foster future growth.

GPT或生成預訓練轉換程式:使用轉換程式架構的神經網絡模型系列,為ChatGPT等生成人工智能應用程式提供支援。

GPU:執行圖形渲染(graphics rendering)所需的複雜數學和幾何計算的圖形處理器,亦被用於遊戲、內容創作及機器學習。

推理或推論:指人工智能處理方法。機器學習和深度學習是指訓練神經網絡,而人工智能推理則應用來自經訓練的神經網絡模型知識,並用這些資料來推理結果。

科技巨企(hyperscalers):大規模提供雲端、網絡及互聯網服務基礎設施的公司,實例包括Google Cloud、Microsoft Azure、Facebook Infrastructure、阿里雲及Amazon Web Services。

LLM(大型語言模型):一類專門的人工智能,利用大量文本進行訓練,以了解現有內容並生成原始內容。

MoE(混合專家模型):一種機器學習方法,將人工智能模型劃分為單獨的子網絡/專家系統以共同執行任務。由於每項任務都使用特定的專家系統,而不是為每個任務啟動整個神經網絡,因此可以顯著降低成本並提高推理效能。

開源軟件:在檢閱、修改和分發方面可公開存取的代碼。

強化學習 (RL):一種人工智能技術,即透過與環境互動並以獎懲形式接收意見回饋以進行學習。這允許人工智能可適應和發展,並提高其邏輯和解決問題的能力。

ROI(投資回報率):用作衡量投資表現的財務比率,計算方法是將淨利潤/虧損除以投資的最初成本。

任何對個別公司的參考,僅供說明用途,並不構成買入或賣出投資建議,法律或稅務事項的忠告。

主要投資風險:

  • 本基金投資於股票,須承受證券價值波動的股本證券風險 。
  • 投資本基金涉及一般投資、貨幣、人民幣貨幣及兌換、流動性、對沖、市場、經濟、政治、監管、稅務、有關證券借出、有關反向回購交易、金融及利率風險。在極端的市場環境下,閣下可能會損失全部投資。
  • 本基金可使用金融衍生工具降低風險及更有效率地管理基金,並涉及對手方、流動性、槓桿、波動性、估值及場外交易風險,可能蒙受重大損失。
  • 本基金的投資集中於科技行業,或會具較高波動性,並承受科技相關公司風險。
  • 本基金可能投資於歐元區, 或會蒙受歐元區風險。
  • 本基金可能徵收業績表現費。即使投資資本虧損,投資者也可能需要支付此費用。
  • 投資者不應只根據此文件而作出投資決定,並應細閱有關基金銷售文件,了解風險因素資料。