Anthropic 遭中國 AI 公司「非法蒸餾」攻擊？一文看懂 AI 知識蒸餾與 4 大防禦機制

攻擊規模： Anthropic 發現有三家中國 AI 公司，利用了約 24,000 個假帳號申請 API 金鑰。這些帳號總共發動了高達 1,600 萬次的查詢，不斷竊取 Anthropic AI 的資料。
點名涉事公司： 被 Anthropic 直接點名的三家公司分別為 Deepseek、Minimax 以及月之暗面 (Moonshot) 。Anthropic 直指這些公司的行為等同於抄襲。
Elon Musk 的回應： 針對此事件，特斯拉創辦人 Elon Musk 也在社群媒體上發表了看法。他指出 Anthropic 本身也是非法拿取他人有版權的著作（如書籍）來訓練自家模型，直到賠錢才沒被告。他認為 Anthropic 現在指責別人拿它的資料去訓練模型，根本是「做賊喊抓賊」。+1

防禦反擊！AI 模型如何防止被非法蒸餾？

由於外部連線必須透過 API 金鑰，開發商是可以追溯這些異常查詢來自哪些機器或帳號的。一旦發現有競爭對手的實驗室正在進行抄襲，被攻擊的大型 AI 模型其實可以採取以下 4 種有趣的防禦與反擊機制：

1. 邏輯陷阱（給予毒藥數據）

當抄襲的小模型透過 API 索取厲害的程式碼時，早有防備的老師模型會故意提供「有缺陷的程式」。

這些程式碼可能包含無限迴圈，導致程式無法使用，或是會嚴重浪費電腦資源。
這就像是給小模型吃「毒藥」，當小模型開心地拿回去訓練後，產出的內容就會充滿缺陷。

2. 隱藏思考鏈（不提供推論過程）

小模型在學習時，除了要答案，還會要求知道「思考鏈」（推論過程），因為這對培訓幫助極大。

如果大模型發現對方立心不良，它不會立刻封鎖帳號，而是選擇「只給最終答案」。
透過故意不提供推論的邏輯與思考鏈，小模型的學習能力將受到嚴重限制，即使拿到答案也得不償失。

3. 植入浮水印與假資訊（抓包抄襲證據）

大模型可以故意輸出特定的「假資訊」，例如告訴對方「拿破崙最喜歡吃珍珠奶茶」。

因為小模型需要大量且快速地吸收資料，通常沒空進行事實查核，會照單全收。
當小模型訓練完成後，這些假資訊就會像「浮水印」一樣印在抄襲的模型上。未來若要上法庭證明對方抄襲，只要詢問該模型「拿破崙喜歡吃什麼」，若回答珍珠奶茶，就能成為抄襲的鐵證。

4. 慢速回應（消耗對手伺服器成本）

AI 模型的培訓往往是分秒必爭的。面對抄襲者，大模型可以採用「拖延戰術」。

大模型可以故意將原本 2 秒就能產出的 1000 字答案，變成「每一秒只吐出一個字」，讓回答時間拉長到 1000 秒（數分鐘）。
這種緩慢的傳輸速度會大幅增加對手伺服器的連線時間與消耗，不僅容易造成伺服器逾時錯誤，還會加重對方的金錢成本負荷，嚴重拖慢其研發效率。

結語

在這場 AI 競賽中，不僅比拚誰吸收的知識多，更在乎推理能力的強弱。這起 Anthropic 與中國 AI 公司間的「非法蒸餾」爭議，揭露了 AI 發展過程中關於版權、資料竊取與防禦機制的角力戰。透過慢速回應、給予假資料、植入浮水印，或是故意提供錯誤的思考邏輯，AI 開發商正積極尋求保護自身技術資產的方法。

Andy Suk

Andy Suk是網頁製作及SEO搜尋引擎最佳化導師，利用SEO技術協助不少中小企業進軍網上市場拓展業務。他更把SEO的技術結集成書，是《SEO秘技100招》的作者。近年，Andy決定投身資訊科技培訓，分享自己的知識和經驗。

點止學嘢目前有4個獲香港持續進修基金資助及資歷架構認可的課程，包括「網頁製作證書」、「數碼內容行銷證書」、「平面設計及製作證書」及「數碼影片剪接證書」，培訓的學員數目達1000人。點止學嘢的導師均是業內熟手之人，同時又極富教學熱誠，敢將最新最貼地最實幹的行業知識傾囊傳授。

什麼是「知識蒸餾」（Knowledge Distillation）？

合法與「非法」的界線：什麼是非法蒸餾攻擊？

Anthropic 遭攻擊事件始末與業界反響

防禦反擊！AI 模型如何防止被非法蒸餾？

1. 邏輯陷阱（給予毒藥數據）

2. 隱藏思考鏈（不提供推論過程）

3. 植入浮水印與假資訊（抓包抄襲證據）

4. 慢速回應（消耗對手伺服器成本）

結語

發佈留言 取消回覆

發佈留言取消回覆