AI前沿解密》DeepSeek V4低成本神話的現實界線(朱玉昌)
DeepSeek V4於4月底推出Pro與Flash兩種版本,採用混合注意力架構,標配百萬詞元(token)上下文,在編碼、長文本處理和代理任務上展現競爭力,權重以開放許可釋出,應用程式介面(API)也同步提供低價折扣,但市場反
朱玉昌
DeepSeek V4於4月底推出Pro與Flash兩種版本,採用混合注意力架構,標配百萬詞元(token)上下文,在編碼、長文本處理和代理任務上展現競爭力,權重以開放許可釋出,應用程式介面(API)也同步提供低價折扣,但市場反應相當平穩,並不如V3或R1推出時那般轟動,根據市場測試回饋,它在特定技術場景和成本控制上仍有優勢,但前端生成細膩度、多模態支援,以及大規模API穩定性則有待改進空間。
這次發布像單純的技術迭代,平靜的市場回響,恰恰凸顯DeepSeek長期以來的核心特質,團隊出身於量化基金(Quant Fund)背景,擅長算法調優與工程效率極大化,能在算力受限的條件下把模型效能推到接近前沿的水準。V3系列曾以遠低於對手的訓練成本,證明中國AI能在效率這一維度實現突破,這類似過去製造業和新能源領域,用更低成本追趕品質的路徑。
然而,AI競爭不只是單一模型的聰明程度,還是服務規模化、推理基礎設施、安全合規與生態協調的整體體系。V4預覽版在這些產品化與企業級面向的準備略顯薄弱,API雖已開放,但要支撐大規模穩定部署,尚需更多打磨,這也充分反映了團隊優先選擇攻克技術難點,並非把資源先放在產品細節和長期穩定上。
DeepSeek的強項,在於大幅壓低成本,它僅用一萬多張舊世代顯卡,透過深度工程優化就能產出具競爭力的成果,直接把全行業價格預期拉下來,這種低價策略,讓它成為許多開發者和中小團隊的實用工具,卻也難以成為大型企業的首選合作對象,蘋果過去在中國尋找AI夥伴時,最終偏好基礎設施更完善、可控性更高的廠商,不是單純模型效能突出的DeepSeek。畢竟,企業客戶最在意的是長期穩定,不出亂子,而不要短期的基準測試(benchmark)領先。
此刻,DeepSeek正面臨規模擴張帶來的必然壓力,用戶需求已從單純展示模型,轉向服務千萬級日活用戶、支援代理應用、出海競爭,以及與中國製硬體的深度整合,每一項都需投入大量資金。母公司高飛量化(High-Flyer Quant)過去能將大部分收入持續投入研究,支撐不靠外部融資也能穩步前進的獨特模式,在面對需求爆炸與下一代模型開發,這種內部輸血已難完全支撐。近期DeepSeek全力接觸投資人,尋求首輪外部融資消息頻傳,目標融資超過3億美元,估值傳聞在100億至200億美元之間,騰訊與阿里都在洽談中。
這一轉折,顯示著DeepSeek過去那種不一樣的優勢開始進入階段性尾聲。一年前,它最吸引人的地方,不是參數規模,是與OpenAI等公司有著截然不同的做法,拒絕外部資本、低調專注工程、靠內部資源和耐心迭代,即使團隊執行者都極少公開露面,它曾讓許多人相信,AI競賽或許存在另一條路,不必一路巨額融資、快速擴張、講故事推高估值,僅需透過嚴謹的研究和工程優化來累積實力,創始人梁文峰早前那句「我們面對的問題從來不是錢,而是高階晶片禁運」,就是這種氣質的代表。
現實很骨感,不走主流路線的做法,在公司規模還小時是種可行的奢侈,一旦需求暴增,需要建構可靠的推理服務、處理安全調教、協調大客戶,以及維持第一梯隊的技術節奏,獨立運作的代價就迅速升高,堅持不融資,會逐漸失去領先位置;選擇融資,又必須適應業界常態規則,與擁有雲端、客戶和大規模基礎設施的巨頭展開更直接競爭。就算騰訊和阿里等大廠真的投資DeepSeek,其背後也是多線戰略性布局,並非把核心戰場完全交出。
DeepSeek尋求融資的經歷不是特例,那是AI產業乃至更廣泛科技領域常見的成長拐點,低成本、高效率的模型突破具有重要意義,它延續了中國在資源約束下實現追趕的工業傳統,但AI的長期競爭,最終落在體系能力上,算力生態、人才穩定、產品可靠性、合規框架,以及如何在資本與技術之間取得平衡。V4預覽版的平穩落地,加上融資討論的浮出水面,完全勾勒出DeepSeek當前的微妙位置,它依然重要,重要到業界需要它的成本優勢與技術貢獻,卻未必願意讓它成為絕對的核心。
這家公司未來能否在引入外部資金後,繼續保留部分極客文化與工程優化優勢,或者逐步融入標準的擴張路徑,仍有待觀察,無論結果如何,V3時代那種獨特的吸引力已在淡化,取而代之的,是極其務實的商業規模與體系約束的產業現實。
(作者為富瑜文教基金會執行長)
來源:中時新聞網