fbpx
Anthropic 遭中國 AI 公司「非法蒸餾」攻擊?一文看懂 AI 知識蒸餾與 4 大防禦機制

Anthropic 遭中國 AI 公司「非法蒸餾」攻擊?一文看懂 AI 知識蒸餾與 4 大防禦機制

近期 AI 領域爆發了一起備受關注的爭議事件。知名 AI 公司 Anthropic 發布聲明指出,其長期遭到三家中國 AI 公司的「非法蒸餾」攻擊 。這並非傳統試圖癱瘓伺服器的駭客攻擊,而是一種針對知識與推理能力進行的竊取行為

本文將帶您深入了解什麼是「知識蒸餾」,合法與非法的界線在哪裡,並解析這起事件的始末,最後將探討 AI 模型可以透過哪 4 大機制來防禦這類竊取攻擊。


什麼是「知識蒸餾」(Knowledge Distillation)?

在探討攻擊之前,我們需要先了解「知識蒸餾」原本的用意。在 AI 領域中,知識蒸餾其實是一種合法且正常的 AI 訓練技術

  • 運作原理: 開發者會先培訓一個知識淵博的大型「老師」模型 。為了讓模型能放入一般電腦中運作,會再建立一個體型較小、原本什麼都不懂的「學生」模型 。
  • 學習過程: 學生模型會不斷向老師模型發問(例如:什麼是狗、什麼是貓) 。因為老師模型已經學習了世界上許多知識,所以能快速提供答案給學生模型學習 。
  • 邏輯推理的傳承: 近期的技術不僅傳遞知識,還包含「邏輯分析」技能 。學生模型會詢問數字的解釋或事情的處理方式,老師模型則會回答其思考模式與邏輯 。
  • 最終成果: 透過這個過程,可以快速培訓出一個體型較小,卻充滿知識與推理能力的模型 。

合法與「非法」的界線:什麼是非法蒸餾攻擊?

既然知識蒸餾是正常技術,那為何會變成「非法攻擊」呢?

非法的知識蒸餾,是指在「老師模型」擁有者不同意的情況下,第三方透過大量發問,以低成本且快速的方式,偷偷擷取該大模型的知識與推理能力 。對手利用 API 不斷詢問問題,將提煉出的資料帶回自己的實驗室進行培訓 。這種「教識徒弟無師傅」的行為,可能導致抄襲者的 AI 模型最終超越原創者的心血 。+1

Anthropic 遭攻擊事件始末與業界反響

Anthropic 此次的聲明,正是針對這種未經授權的資料竊取行為開砲。

  • 攻擊規模: Anthropic 發現有三家中國 AI 公司,利用了約 24,000 個假帳號申請 API 金鑰 。這些帳號總共發動了高達 1,600 萬次的查詢,不斷竊取 Anthropic AI 的資料 。
  • 點名涉事公司: 被 Anthropic 直接點名的三家公司分別為 Deepseek、Minimax 以及月之暗面 (Moonshot) 。Anthropic 直指這些公司的行為等同於抄襲 。
  • Elon Musk 的回應: 針對此事件,特斯拉創辦人 Elon Musk 也在社群媒體上發表了看法 。他指出 Anthropic 本身也是非法拿取他人有版權的著作(如書籍)來訓練自家模型,直到賠錢才沒被告 。他認為 Anthropic 現在指責別人拿它的資料去訓練模型,根本是「做賊喊抓賊」 。+1

防禦反擊!AI 模型如何防止被非法蒸餾?

由於外部連線必須透過 API 金鑰,開發商是可以追溯這些異常查詢來自哪些機器或帳號的 。一旦發現有競爭對手的實驗室正在進行抄襲,被攻擊的大型 AI 模型其實可以採取以下 4 種有趣的防禦與反擊機制:

1. 邏輯陷阱(給予毒藥數據)

當抄襲的小模型透過 API 索取厲害的程式碼時,早有防備的老師模型會故意提供「有缺陷的程式」

  • 這些程式碼可能包含無限迴圈,導致程式無法使用,或是會嚴重浪費電腦資源 。
  • 這就像是給小模型吃「毒藥」,當小模型開心地拿回去訓練後,產出的內容就會充滿缺陷 。

2. 隱藏思考鏈(不提供推論過程)

小模型在學習時,除了要答案,還會要求知道「思考鏈」(推論過程),因為這對培訓幫助極大

  • 如果大模型發現對方立心不良,它不會立刻封鎖帳號,而是選擇「只給最終答案」 。
  • 透過故意不提供推論的邏輯與思考鏈,小模型的學習能力將受到嚴重限制,即使拿到答案也得不償失 。

3. 植入浮水印與假資訊(抓包抄襲證據)

大模型可以故意輸出特定的「假資訊」,例如告訴對方「拿破崙最喜歡吃珍珠奶茶」

  • 因為小模型需要大量且快速地吸收資料,通常沒空進行事實查核,會照單全收 。
  • 當小模型訓練完成後,這些假資訊就會像「浮水印」一樣印在抄襲的模型上 。未來若要上法庭證明對方抄襲,只要詢問該模型「拿破崙喜歡吃什麼」,若回答珍珠奶茶,就能成為抄襲的鐵證 。

4. 慢速回應(消耗對手伺服器成本)

AI 模型的培訓往往是分秒必爭的 。面對抄襲者,大模型可以採用「拖延戰術」

  • 大模型可以故意將原本 2 秒就能產出的 1000 字答案,變成「每一秒只吐出一個字」,讓回答時間拉長到 1000 秒(數分鐘) 。
  • 這種緩慢的傳輸速度會大幅增加對手伺服器的連線時間與消耗,不僅容易造成伺服器逾時錯誤,還會加重對方的金錢成本負荷,嚴重拖慢其研發效率 。

結語

在這場 AI 競賽中,不僅比拚誰吸收的知識多,更在乎推理能力的強弱 。這起 Anthropic 與中國 AI 公司間的「非法蒸餾」爭議,揭露了 AI 發展過程中關於版權、資料竊取與防禦機制的角力戰。透過慢速回應、給予假資料、植入浮水印,或是故意提供錯誤的思考邏輯,AI 開發商正積極尋求保護自身技術資產的方法

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

想查詢課程?WhatsApp即時回覆