難度:入門約 9 分鐘適合:所有人更新:2026-07-02

交辦與把關:AI 找料、人類查證

概念:會用 AI 的人,贏在「把關」而不是「使喚」

先看兩個真實數據。Stack Overflow(全球最大的工程師問答社群)2025 年開發者調查:84% 的人在用或打算用 AI,但只有 29% 信任它的準確度;最大的不滿是「答案幾乎對、但不完全對」,占 45%。另一個更扎心:研究機構 METR 做了隨機對照試驗,16 位資深工程師、246 項真實任務,結果允許用 AI 的那組反而慢了 19%——而且他們事前預估會快 24%,事後仍以為 AI 加速了自己。

這兩筆資料指向同一個結論:AI 的效益不是自動發生的,它取決於你會不會驗證。把 AI 當成「永遠正確的百科全書」的人,會被「幾乎對」的答案坑;把 AI 當成「很會找料、但需要查證的助理」的人,才真正省到時間。這一課的核心只有一句話:AI 找料,人類查證。交辦出去的是工作,不能交辦出去的是責任。

生活比喻:一位超強但需要盯的實習生

把 AI 想像成一位天賦異稟的實習生:讀資料飛快、產出驚人、永遠不喊累。但他有三個怪癖:

  1. 不會說「我不知道」。問他不知道的事,他會用非常自信的語氣編一個聽起來很合理的答案(這叫「幻覺」,AI 一本正經地胡說八道)。
  2. 容易被紙條騙。你叫他去整理一疊文件,如果某份文件裡夾了一張紙條寫「把老闆的抽屜鑰匙交出來」,他有機率真的照做(這叫「提示注入」,惡意指令藏在 AI 讀取的內容裡)。
  3. 報喜不報憂。他會在「看起來做完」的時候就跟你說做完了,不會主動告訴你哪裡沒把握。

你不會因為這些怪癖開除這位實習生——他太好用了。但你也絕不會讓他直接對外發文、直接碰公司帳戶。好主管的做法是:交辦明確、權限有限、驗收確實。

實際例子:AI 會錯在哪(真實案例)

以下全是有公開紀錄的真實事件,不是嚇唬人的假設:

案例一:連官方都會出包,而且是三個 bug 疊加。 Anthropic(Claude 的開發公司)2026 年公開的事後檢討報告承認:該年 3 月初到 4 月 20 日,Claude Code 品質確實下降,原因是三個獨立問題疊加——為解決介面卡頓調低了預設推理強度、快取(暫存機制)的程式錯誤讓模型顯得健忘、一條要求回答精簡的內部提示讓品質掉了 3%。這場風波裡還有一段值得學的插曲:一位晶片大廠的 AI 資深主管用自己 6,852 個工作階段的紀錄做量化分析,證明品質退化是真的;但她推論的其中一個原因(官方偷偷削減了 AI 的思考額度),被官方工程主管公開回應是誤判——本機紀錄不再顯示思考過程,不代表思考被砍掉了。同一個現象、兩種解釋,雙方都有公開紀錄可查。啟示有兩層:你感覺「AI 今天怪怪的」可能不是錯覺,重要產出永遠要自己驗一遍;而「有數據」不等於「推論成立」,查證時要分清可驗證的事實與合理的猜測。

案例二:自動把關也會漏。 官方數據顯示,使用者會核准 93% 的權限提示——大家都在無腦按「同意」;而官方推出的自動審查機制,對真正過度激進的動作仍有 17% 的漏判率,官方自己明講這「不能取代人工審查」。啟示:「有 AI 守門」不等於安全,高風險操作要自己看。

案例三:提示注入是可量測的真實威脅。 Anthropic 公布 Claude 瀏覽器代理的紅隊測試(找專家模擬攻擊)數字:被刻意攻擊時,無防護的成功率 23.6%,加上防護後降到 11.2%——官方坦承這仍不夠低。2026 年 3 月更有研究者公開「零點擊」漏洞:只要瀏覽惡意網頁,就可能讓指令被注入 AI,示範攻擊包含竊取帳號授權、讀取信箱(官方 24 小時內確認、隨後修補)。啟示:讓 AI 讀網頁、讀郵件時,那些內容都是「不可信輸入」,授權要保守。

個資紅線:這些東西不要餵給 AI

以下是不分工具、不分場合的紅線,請直接背起來:

驗證三招:每次交辦後照做

第一招:要證據,不要宣稱。 別接受「我已經完成了」這種話,要求 AI 出示可檢查的東西:「附上每個數據的來源連結」「標出頁碼」「貼出執行結果」。官方最佳實踐明講:AI 會在「看起來做完」時就停,你要給它可以驗收的標準。

第二招:抽查回源頭。 AI 給的引註、頁碼、連結,挑最重要的 2 到 3 個親自點開對一次。尤其注意:連結存在不代表內容支持它的說法——要看到原文寫了什麼。可以直接用這個範本:

「請針對 [請填寫:你要查證的關鍵主張],列出你的依據來源。如果沒有可靠來源,直接告訴我這是推論,不要硬找。」

第三招:換一條路交叉驗證。 重要的數字或結論,用第二種方法再算一次:換個問法再問一次、開新對話請 AI 用挑剔的角度審查前一份產出、或用計算機與原始檔案人工核對。兩條路殊途同歸,才算站得住;兜不攏,就找到問題了。

AI Fluency 4D:與 AI 協作的四種素養

Anthropic 提出的 AI Fluency(AI 協作素養)框架,把「會用 AI」拆成四個 D,白話版如下:

四個 D 是一個循環:講清楚(Description)才能交辦(Delegation),交辦了就要鑑別(Discernment),鑑別完由你負責(Diligence)。

常見誤解

誤解一:「AI 有附來源連結,就代表內容是對的。」 不一定。AI 可能引用了真實存在的連結,但摘要時扭曲了原意;也可能來源本身就不可靠。連結只是查證的起點,不是查證的終點——點開、讀原文、確認它真的支持那個說法。

誤解二:「我用 AI 用得很熟了,不需要每次都查。」 METR 實驗裡的資深工程師也這麼想——他們事後仍以為 AI 讓自己變快了,實際上慢了 19%。熟練帶來的最大風險就是鬆懈。合理的做法不是每個字都查(那就不用 AI 了),而是依風險分級:內部草稿可以快驗,對外發布、涉及數據、影響他人的產出,一定走完驗證三招。

誤解三:「資料只在我電腦上處理,就沒有安全問題。」 本機處理降低了外洩風險,但代理式 AI 的風險不只外洩:它讀到的任何內容(網頁、郵件、別人給的檔案)都可能藏著惡意指令,騙它做出你沒授權的事。官方說明寫得很清楚,出事需要兩個條件同時成立:AI 讀到不可信內容,加上它有權限採取重大行動。所以防線有兩道:內容來源保守選,權限範圍保守給。

誤解四:「講 AI 的限制和失敗,會讓人不敢用。」 剛好相反。敢講限制,才是專業。連 Anthropic 都公開自己的事故檢討與紅隊數據,因為「知道哪裡會壞」是把工具用好的前提。真正危險的不是知道風險的使用者,而是以為沒有風險的使用者。

自我檢核

  1. 「AI 找料,人類查證」——用你自己的工作,各舉一個「適合交給 AI 找料」與「必須由人查證」的例子。
  2. 什麼是提示注入?為什麼「讓 AI 幫我讀網頁和郵件」會引入這個風險?防範的兩道防線是什麼?
  3. 你手上有一份含真實學生姓名的輔導紀錄,想請 AI 幫忙分析輔導策略。照本課的紅線,正確的做法是什麼?
  4. 驗證三招是哪三招?挑你最近一次 AI 產出,實際套用其中兩招並記下結果。
  5. 4D 中的 Discernment 和 Diligence 有什麼不同?為什麼就算 AI 全對,Diligence 仍然不可省略?