AICOACH.TW — 2026/6/13

建立 AI 內容自動化的第一週：9 個讓品質穩定的系統設計

大多數人在設計 AI 內容系統時，只關注流程能否跑起來，不關注輸出品質。第一週的三個根本問題與 9 項系統設計，說明讓 AI 穩定產出可信內容的核心邏輯。

⚠️ 不合格／AI自動生成：這篇文章是 30 天 Blog 內容自動化實驗期間（2026-06-08～2026-07-01）由 AI 全自動生成，經內部審查後判定品質未達最低標準，僅保留作為歷史存檔。完整記錄與根因分析請見《30 天 Blog 內容自動化實驗完整記錄》。

大多數人在設計 AI 自動化系統時，只關注「流程能跑起來」，不關注「輸出的品質是什麼」。

6 月 8 日，Antigravity 2.0 正式上線。五個站台，Claude Opus 每天定時觸發，自動讀章節、生成文章、部署上架。第一週的執行記錄看起來完美：所有任務成功，全數推送。

但當你仔細讀那些文章，會發現三個根本問題。而這三個問題，幾乎每個建立 AI 內容系統的教練或創作者都會犯。

第一週發現的三個根本問題

問題 1：AI 會自行填補沒有設定邊界的空白

一篇文章裡出現了這句：「根據最新研究，使用 AI 工具的創作者收入提升了 340%」。

這個數字沒有來源。原始資料裡根本沒有這個百分比。系統在「這裡放數字會更有說服力」的推斷下，自行生成了一個看起來合理的數字。

大語言模型的預設行為是填補空隙。你沒有明確設定「只能使用原始資料裡的數字」，它就用「看起來合理」的數字填進去。

這不是模型能力不足的問題——是工作環境設計沒有設定清楚邊界。

問題 2：跨站身份混淆

五個站台各有對應的主理人設定。第一週，有一篇文章把 A 站主理人的名字和事蹟，混入了 B 站的文章裡。

對讀者而言，這不只是一個名字錯誤——整個「主理人公開建造，分享真實歷程」的可信度都會因此瓦解。

教練事業的核心是信任。如果你的內容系統會輸出身份不一致的文章，這個系統在建立信任上是反效果的。

問題 3：開場缺乏情緒共鳴設計

大多數第一週的文章使用了這樣的開場：

「本文將介紹如何利用 AI 工具提升創作效率，以下是三個步驟……」

這是說明書的寫法，不是讓讀者產生共鳴並繼續閱讀的寫法。讀者在開頭三段感受不到情緒連結，就不會讀完——更不會點擊行動按鈕。

根本原因：系統工作環境的設計不足

這三個問題有同一個來源：系統的 Harness（工作環境）設計得不夠精確。

Harness Engineering 是這樣定義的：設計讓 AI 穩定產出高品質結果的工作環境與規則框架。

這個概念對教練事業有直接的應用：你雇用了一個 AI 助理（或自動化系統），但沒有給它明確的工作規範——它就會用「合理推斷」代替你的判斷，在每個邊界模糊的決策點上做出你未必認可的選擇。

結果是：系統跑起來了，但輸出的品質不穩定，需要大量人工複查和修正。這恰恰抵消了自動化的效益。

9 個讓品質穩定的系統設計

問題發現後，對系統做了 9 項調整，全部寫入了 AGENTS.md（系統作戰手冊），每次執行前強制讀取。

P1：來源章節化排程

問題：系統每天自由選題，內容來源無法追溯，容易重複或失焦。設計：建立 30 天章節序排程，每天只讀指定的章節範圍（約 5,000–12,000 字），而非全書（約 103,000 字）。

結果：Token 用量減少約 95%，更重要的是，每篇文章的來源變得可追溯——可以確認「這個論點來自原始資料的第幾行」。

P2：寫作模板庫

從認可的好文章萃取寫作技法，建成參考模板庫。系統動筆前先讀模板，套用 2–3 個技法（結論先行、具體數字、作者判斷、FAQ 結構）。

這個設計的邏輯：不讓系統從空白開始決定文章結構，而是給它已驗證有效的結構範本。

P3：開場公式框架

強制每篇文章的開頭使用以下三種公式之一：

| 公式 | 結構 | |------|------| | A型 | 描述讀者的一個具體日常行為 → 指出背後的結構性問題 → 「這不是你的問題」| | B型 | 直接點名一個讀者熟悉但說不清楚的情緒 → 比讀者更精準地解釋情緒來源 | | C型 | 提出一個讀者以為知道答案的問題 → 給出反直覺的答案 → 解釋為什麼 |

框架式說明開場（「本文將介紹……」）明確禁止。

H1：受眾語言橋接

每個站台的讀者群不同，相同的核心概念在不同站台需要翻譯成不同的表達方式。

規則：動筆前，必須先把今日核心概念翻成該站讀者的日常語言，才能開始撰寫。如果文章中出現讀者不熟悉的術語，必須搭配讀者熟悉的語言解釋，不能單獨使用。

H2：準備資訊滲漏測試

系統在準備階段會聲明「今日目標查詢：___」，這是給系統自身的 meta 資訊，不應出現在文章正文中。

設計：在 git push 前強制搜尋文章本體，確認這個字串不存在。看似細節，但真的發生過。

H3：數字真實性規則（最關鍵）

文章中的所有數字——百分比、金額、時間、人數——必須來自今日章節原始資料，或主理人的真實記錄。

沒有可查證出處的數字一律刪除，改用具體對比描述：

> 「原本需要 3 小時的工作，現在 20 分鐘完成」

這樣的表述沒有百分比，但有畫面感，而且是真實的。

H4：發布前五點驗證清單

在 git push 前，強制執行以下五點確認：

□ 文章主理人身份屬於本站台？
□ 所有數字有原始資料出處？
□ 開場使用了 A/B/C 公式之一？
□ 準備階段 meta 資訊未出現在正文中？
□ 結尾有今天可執行的具體行動？

任何一點未通過 → 修正後重新驗證，不得跳過。

H5：反例資料庫

將第一週真實出現過的失敗句子整理成反例資料庫。系統每次執行前讀取。

設計邏輯：讓系統不只知道「應該做什麼」，也明確知道「做這個等於直接失敗」。已知的失敗模式是比任何正向規則更有效的約束。

H6：主理人身份鎖定

建立站台身份對應表：每個站台的主理人只屬於該站台，不能跨站混淆。

跨站身份混淆採用零容忍機制——不是警告，是強制修正後才能繼續。

這對你的 AI 教練事業意味著什麼

如果你正在建立任何形式的 AI 輔助教學或內容系統，第一週的這些問題是幾乎可以預期的。

核心洞見只有一個：

讓 AI 系統穩定運作的核心工作，不是讓模型更聰明，而是設計讓它無法做錯的工作環境。

你設計框架，AI 執行重複工作——但框架本身的品質，決定了系統輸出的品質上限。這個邏輯和你設計課程 SOP 是一樣的：SOP 設計得越精確，學員的成果越可預期。

AI 系統的 Harness，就是你的 AI 教練事業的 SOP。

今天可以開始的一件事：

檢視你目前給 AI 的任何指令或提示詞，找出其中「沒有明確禁止就可能發生」的空白決策。

把那個空白寫成一條明確的規則，放進你的工作環境裡。

一條規則，解決一個重複發生的品質問題。這是 Harness Engineering 最小的起點。

// 下一步

I Dream. AI Works.
你的主線任務，從這裡開始。

加入探索