性能比肩OpenAI 中國DeepSeek爆紅

近年來美國對中國晶片產業的出口管制不斷升級,兩國科技戰如火如荼。中國初創公司「深度求索」(DeepSeek)近日推出一款廉價計算機大模型,可比肩美國AI(人工智能)公司龍頭OpenAI最新模型的超高性能,挑戰美國在該領域的霸主之位。由於訓練成本遠低於同級產品,該模型受到矽谷及多間西方媒體的高度關注。
近日一篇在匿名平台teamblind上發佈的文章遭瘋傳,有一位自稱是Meta員工稱公司內部因DeepSeek模型而進入恐慌模式,並提到「DeepSeek-V3」在基準測試中,已經讓(Meta推出的)Llama4相形見絀,而更讓人難堪的是一家「僅用550萬美元訓練預算的中國公司」就做到這一點。
該帖文又指,Meta工程師正爭分奪秒分析DeepSeek,試圖複製其中的一切可能技術;而「DeepSeek-R1」的出現,也讓情況更加嚴峻。
此外,AI科技新創公司ScaleAI創辦人AlexandrWang接受媒體採訪時表示,DeepSeek的AI大模型效能大致與美國最好的模型相當;過去十年美國可能一直在AI競賽中領先中國,但DeepSeek可能會「改變一切」。
翻查資料顯示,DeepSeek創辦人梁文鋒甚少接受訪問,去年7月內地媒體「36氪」刊登梁文鋒的長篇專訪,由他親身講述中國AI現况。他認為中國過往30多年科網浪潮中,中國沒有真正參與創新,希望DeepSeek幫助形成創新文化,幫中國走出模仿別人的困局,但認為先進芯片禁運仍是眼前難題。梁文鋒當時又表示,DeepSeek短期內無融資計劃,但研發預算充足,他表示,DeepSeek面臨的問題從來不是錢,而是高端芯片被禁運。被問到大廠是否可用科技拉開差距時,梁文鋒指「技術沒有秘密」,如Nvidia的顯示卡技術「很容易複製」,但重組團隊及追趕下一代技術都需要時間,「所以實際(大廠)的護城河還是很寬。」