性能比肩OpenAI 中國DeepSeek爆紅

近年來美國對中國晶片產業的出口管制不斷升級，兩國科技戰如火如荼。中國初創公司「深度求索」（DeepSeek）近日推出一款廉價計算機大模型，可比肩美國AI（人工智能）公司龍頭OpenAI最新模型的超高性能，挑戰美國在該領域的霸主之位。由於訓練成本遠低於同級產品，該模型受到矽谷及多間西方媒體的高度關注。

近日一篇在匿名平台teamblind上發佈的文章遭瘋傳，有一位自稱是Meta員工稱公司內部因DeepSeek模型而進入恐慌模式，並提到「DeepSeek-V3」在基準測試中，已經讓（Meta推出的）Llama4相形見絀，而更讓人難堪的是一家「僅用550萬美元訓練預算的中國公司」就做到這一點。

該帖文又指，Meta工程師正爭分奪秒分析DeepSeek，試圖複製其中的一切可能技術；而「DeepSeek-R1」的出現，也讓情況更加嚴峻。

此外，AI科技新創公司ScaleAI創辦人AlexandrWang接受媒體採訪時表示，DeepSeek的AI大模型效能大致與美國最好的模型相當；過去十年美國可能一直在AI競賽中領先中國，但DeepSeek可能會「改變一切」。

翻查資料顯示，DeepSeek創辦人梁文鋒甚少接受訪問，去年7月內地媒體「36氪」刊登梁文鋒的長篇專訪，由他親身講述中國AI現况。他認為中國過往30多年科網浪潮中，中國沒有真正參與創新，希望DeepSeek幫助形成創新文化，幫中國走出模仿別人的困局，但認為先進芯片禁運仍是眼前難題。梁文鋒當時又表示，DeepSeek短期內無融資計劃，但研發預算充足，他表示，DeepSeek面臨的問題從來不是錢，而是高端芯片被禁運。被問到大廠是否可用科技拉開差距時，梁文鋒指「技術沒有秘密」，如Nvidia的顯示卡技術「很容易複製」，但重組團隊及追趕下一代技術都需要時間，「所以實際（大廠）的護城河還是很寬。」

推薦閱讀

《新時代治國理政紀實》繁體版新書在港發布

兩「黃店」包括田園書屋涉售煽動刊物兩男三女落網

255天徒步6000公里鄭鎮炎重走長征路新書記錄沿途見聞

推薦閱讀

《新時代治國理政紀實》繁體版新書在港發布

兩「黃店」包括田園書屋 涉售煽動刊物兩男三女落網

255天徒步6000公里 鄭鎮炎重走長征路 新書記錄沿途見聞

兩「黃店」包括田園書屋涉售煽動刊物兩男三女落網

255天徒步6000公里鄭鎮炎重走長征路新書記錄沿途見聞