Home
AI Cowork · Chat Management Backstage

Collaboration Insight

後台聊天管理系統 — 6 天 77 個 session 的人機協作全紀錄
2026-03-14 ~ 2026-03-19

77Sessions
583.5MTokens
12Phases
Scroll
本報告所有數據均來自 Claude Code 對話紀錄的自動抓取與分析,包含 session 時間、token 用量、對話主題等原始資料,再由 AI 進行統計、歸納與視覺化呈現。
Project

聊天管理後台系統 — 供管理人員即時監控聊天訊息、管理玩家黑名單、審核暱稱變更、發送系統廣播訊息,以及追蹤所有管理操作紀錄。

Three-Phase Rhythm
研究期
3/14, 3/16
爆發期
3/17 — 6 modules
收斂期
3/18
收尾
3/19
研究 2天 爆發 1天 收斂 1天 收尾
9 Functional Modules
認證登入
聊天監控
聊天室管理
黑名單管理
IP 封鎖
操作紀錄
系統廣播
暱稱審核
玩家檢舉
Core Methodology — Document-Driven Flow
素材
PRD
RFC
Gherkin
Tasks
Code
Test
Commit
Tech Stack
React 18 Vite TypeScript Ant Design 6 Express.js SQLite Knex.js JWT Playwright Vitest

Derived Data

從原始 session 資料計算出的次級指標 — 模型分布、時段熱力圖、並行協作曲線、各 Phase 投入量。

Activity Heatmap

每日 × 每 3 小時時段的 session 數量(深色 = 高活躍度)

Insight — 開發節奏一目了然:3/14 僅有下午單格活動,3/15 完全空白,3/16 從早到晚均勻分布,3/17–18 呈現密集連續區塊。 最暗的格子是 3/18 06:00–09:00(10 sessions)與 3/18 21:00–00:00(8 sessions),代表兩個高峰爆發期。

Session Concurrency per 3-hour Bucket

每個 3 小時時段中,同時進行中的 session 數量(跨越該時段的 session 計入)

Insight — 平行 Agent 協作模式:多數時段有 3–6 個 session 同時進行,最高峰 3/18 09:00–12:00 達到 11 個並行 session。 這正是「平行 Agent」協作模式的直接體現 — 多個獨立任務同步推進。

Per-Phase Token Investment

各 Phase 的 total tokens 加總(依 topicMap 分類)

Insight — 投入量反映任務複雜度:測試實踐(Phase 11)以 118.7M tokens 遙遙領先,主要因為包含一個 102.8M 的超長 Opus session;認證與回應格式(Phase 1)以 97.8M 位居第二,因為該階段建立了整體框架與 19 個相關 session。Docs/Research 的 66.3M 則反映了前期大量研究投入的價值。

Collaboration Timeline

從需求拆解到產品收斂,60+ 個 session 的完整協作紀錄。

2026-03-14 專案起點:需求拆解與架構規劃
Research
#1

拆分模組理解關聯

  • design-draft.md 中的 6 個功能模組拆分成獨立的 module-*.md 檔案
  • 先自己理解整體關聯與需求,針對每個模組大概設計 API endpoint、資料結構、tech stack
Research
#2

整體架構規劃

  • 以「資深 JS 架構師」角度請 Claude 規劃整體方案,產出 claude-plan.md
  • 向 AI 提出技術選型的新增或調整
2026-03-16 上午 技術研究與協作方法論
Research
#3

技術 Best Practice & Skill 研究

  • 初步規範 RBAC、coding style、design system、error handle、response message
Research
#4

文件架構確立

  • 確認文件架構:PRD → Gherkin .feature → RFC → Tasks
  • 討論如何最有效率地和 Claude 協作(最少 token、最可預測的產出)
  • 思考哪些內容該寫入 global memory vs 專案文件
2026-03-16 下午 工具鏈搭建
Research
#5–6

規劃 AI 協作方式 & 安裝外部 Skill

  • 反覆確認 Claude Code 工作習慣,確定將每個功能模組拆解,一次只規劃一個模組
  • 詢問 plugin 跟 skill 的差別,學習如何安裝 Claude Code skill
2026-03-17 上午 建立工作流 & Phase 0
Build
#7

建立 /generate-docs Custom Skill(文件產生工作流)

  • 流程:素材 → CLAUDE.md → PRD → RFC → Gherkin .feature → Tasks
  • 使用 skill-creator 建立 project-level skill
  • 設定要求:task 粒度以一個 commit 為標準
Build
#8

Phase 0:專案初始化

  • 執行 phase0-init-tasks.md 的初始化任務
  • 將前端頁面 inline style 模組化,改用 Antd custom 設定
  • 討論 commit 粒度 best practice
Build
#9–10

產生 Phase 1 文件 & 設定 npm/npx 權限

  • 執行 /generate-docs,輸入素材:response-and-error.md、module-authentication.md、testing-strategy.md
  • 更新 hooks 設定(config)
2026-03-17 中午 Phase 1 開發
Build
#11

執行 Phase 1:認證與回應格式

  • 執行 tasks_01-auth-and-response.md,要求在文件中新增 progress 追蹤
  • 指定執行到 Task 1.7t 先停止,更新 CLAUDE.md progress
Build
#12

Token 安全性 & Auth 調整

  • 需求:不要使用 localStorage 驗證;已登入者進入 login 頁要跳轉主頁;未定義路徑顯示 NotFoundPage
  • 確認 POST /api/auth/login 仍回覆 token(方便 Postman 測試)
2026-03-17 下午 Phase 1 完成 & 文件產出
Build
#13–15

完成 Phase 1 & Debug

  • 執行 tasks_01 的 task 1.12 到最後
  • 產生 Phase 2 文件(操作紀錄)
  • Debug:Client 登入頁 authContext getMe 一直觸發 rerender,使用 systematic-debugging skill 除錯
2026-03-17 傍晚 Phase 2 & Phase 3
Build
#16–20

操作紀錄 → 聊天室與聊天模組

  • 執行 Phase 2(操作紀錄):新增 login/logout 操作紀錄 task,討論 OPERATION_TYPES 跟 permission 的關係
  • 按 doc → shared → server → client 順序分批 commit
  • 執行 Phase 3(聊天室與聊天):多次要求 continue 繼續執行
2026-03-17 晚間 Phase 3 Commit & Phase 4
Build
#21–25

黑名單 & IP 封鎖 → 暱稱審核文件

  • Phase 3 commit plan + 執行 7 個 commits
  • 執行 Phase 4:討論 blacklist block/unblock 邏輯(deleted_at 軟刪除 vs is_blocked boolean)
  • 討論 DB unique 限制與最佳設計
  • 產生 Phase 5 文件(暱稱審核 & 檢舉)
2026-03-17 深夜 Phase 5 & 收尾
Build
#26–31

暱稱審核與檢舉 → 使用者管理頁面

  • 使用 writing-plans skill 建立實作計畫
  • 頁面列表搜尋加上 status selector,列表新增 status 欄位
  • 產生 Phase 6 文件(廣播訊息)
  • 檢查 Gherkin 與 DB 一致性
  • 新增 ManagerPage(使用者管理頁面)任務
2026-03-18 凌晨 Phase 5 Commit & Design System
Polish
#32–35

Design System:Dark & Light Mode

  • 參考 iOS 介面風格結合 Ant Design token
  • 逐步微調 dark mode(input 白色背景、focus 樣式修正)
  • 反覆調色 primary 藍色 — 想要「接近莫蘭迪但又接近正色」,來回調深調淺
  • 移除 ant-menu border-inline-end,調整主題切換 transition duration
2026-03-18 凌晨 E2E Test & Video Compose & 需求對照
Build
#36–37

E2E Test & Video Compose 功能文件化

  • 討論可行性:整合到 E2E 測試、最後產生影片
  • 要求寫成文件(RFC + Tasks),更新 project_tech_stack
  • 對照 assignment 需求 vs 已實作功能(打勾清單)
2026-03-18 上午 Phase 8:E2E 測試與 Demo 影片
Build
#38–42

E2E 測試 + Demo 影片

  • 使用 executing-plans skill 開始執行
  • Demo 影片除錯:中文標題卡 fontfile 路徑問題,安裝 imagemagick 後修復
  • 要求提升 Playwright 錄影解析度、放慢動作
  • 發現 data-testId 問題:Playwright 很多錯誤都是「找不到元件」
2026-03-18 下午 測試開發準則 & Phase 9 UI 統一
Polish
#43–47

測試準則設計 → UI 行為統一優化

  • 設計 data-testid 命名規範,決定用 Gherkin 作為測試唯一真相來源
  • Phase 9 優化:表單禁用 enter 送出、搜尋改為「點按鈕才觸發 API」、Selector 固定寬度 250px
  • 多次 context overflow 需 /compact
2026-03-18 傍晚 Phase 10 & DB 審查
Build
#48–51

系統設定 → NicknameReview 重構

  • 執行 Phase 10(系統設定 / 環境變數)
  • DB 結構審查:找出文件內欄位名稱與實作不一致的地方
  • NicknameReview 邏輯移入 player module,API 路徑調整
2026-03-18 晚間 文件審查 & Bug 修復 & 架構圖
Review
#52–57

全面審查 → Bug 修復

  • 確認所有 tasks 文件可刪除(知識已轉移到 RFC/Feature/PRD)
  • PRD & RFC 完整性檢查,Assignment 符合度二次確認
  • 專案設計亮點分析
  • Bug 修復:訊息列表暱稱更新問題、自己不能重設自己密碼、Selector focus 字消失
Review
#58–59

系統架構圖 & 資料庫設計圖

  • 使用 excalidraw-diagram-skill 產出系統架構圖
  • 反覆調整多次,最終產出滿意的版本
  • 接續產生資料庫設計圖(table、column、type、relation)
2026-03-19 凌晨 專案評分 & Production 設定
Review
#60–63

專案評分 → Production 模式 → 測試實踐

  • 請 Claude 以「資深架構師」角度評分整個專案
  • 規劃優點文件 + 缺點文件(附帶改善方案)
  • 指出專案缺少 production mode 設定與 local 運行步驟
  • Phase 11:先選 nickname 做示範,為 component 加上 data-testId

Collaboration Insights

從 60+ 個對話 session 中提煉的協作模式與深度觀察。

🔬

研究 → 爆發 → 收斂

花了兩天「只研究不動手」,甚至在研究期間就設計了可重用的 /generate-docs skill。這讓爆發期的產出密度異常高 — 一天完成 6 個模組不是因為趕工,是因為前置準備做足了。

🔄

Builder → Auditor 角色切換

3/17 是 builder:一路往前衝,Phase 接著 Phase。3/18 轉變為 auditor:對照 assignment 需求(兩次)、檢查 Gherkin/DB 一致性、審查 PRD/RFC、請 Claude 以架構師角度評分。

「中斷-重導」主動監督

大量 [Request interrupted by user]。看到方向不對立刻打斷,看到產出品質不夠立刻調整。全程主動監督 AI 的產出,不是把它當黑盒子。

🏗️

遇到問題 → 制度化

Playwright 找不到元件 → 設計完整的 data-testid 命名規範。搜尋行為不一致 → 設計 Phase 9 統一所有頁面。不修症狀修根因,不加 patch 而是建規則。

📈

AI 使用方式在演化

前期:探索式(「plugin 跟 skill 的差別?」)→ 中期:流程化(固定 workflow)→ 後期:彈性判斷(選擇性地使用不同 skill,質疑建議)。一個完整的工具掌握曲線。

🎨

美學品味是手動控制的

顏色經歷:莫蘭迪 → 「接近莫蘭迪但接近正色」→ 「再深一點」。transition、header 灰度、selector 寬度反覆調整。設計品味始終握在自己手上,AI 是執行工具。

📄

文件是跨 Session 的持久記憶

context overflow 頻繁發生,應對策略是讓 task 文件本身承載狀態(而不是依賴對話記憶)。這也解釋了堅持「文件驅動」的原因 — 文件是跨 session 的持久記憶,對話不是。

🧪

這是一場方法論實驗

不只是「用 AI 寫了一個專案」。在測試「文件驅動 + AI 協作」是否可行,把協作流程本身也當作產品在迭代,最後做了自我評審形成完整 PDCA 循環。

工作流程

每個 Phase 的固定執行模式

素材
/generate-docs
Tasks
executing-plans
Commit Plan
Commit

使用的 Claude Code Skills

7+ 種 skill 靈活搭配使用

skill-creator writing-plans executing-plans systematic-debugging react-best-practices brainstorming excalidraw-diagram-skill /generate-docs(自建)

開發進度總覽

Phase 模組 狀態
0 專案初始化 完成
1 認證與回應格式 完成
2 操作紀錄 完成
3 聊天室與聊天 完成
4 黑名單與 IP 封鎖 完成
5 暱稱審核與檢舉 完成
6 廣播訊息 完成
7 Design System 完成
8 E2E 測試與 Demo 影片 完成
9 UI 統一行為優化 完成
10 系統設定(環境變數) 完成
11 測試實踐 + data-testId 完成
12 Production 模式 完成
使用者管理頁面 完成
NicknameReview 重構 完成
架構圖 & 資料庫設計圖 完成

AI Collaboration Evaluation

以下評分與建議皆由 AI 基於 77 個對話 session 的完整紀錄分析產出,非人工自評。

88 / 100

AI GENERATED SCORE

「方法論先行」的人第一次跟 AI 深度協作的紀錄,完成度和思考深度都遠超預期。

95
前置規劃

兩天純研究再動手,文件架構(PRD→RFC→Gherkin→Tasks)設計完整

92
品質控制

雙重 assignment 對照、Gherkin/DB 一致性檢查、架構師評分

90
工具鏈建設

自建 /generate-docs skill、熟練運用 7+ 種 skill

90
AI 監督力

全程主動監督,不盲從建議,美學判斷握在自己手上

85
文件紀律

每個 Phase 都先文件再 code,後期出現文件與實作不一致需校正

75
指令效率

核心需求明確,但調色和架構圖各花 5+ 輪來回

70
Context 管理

大量 /compact 和 overflow,屬於被動應對而非主動規劃

65
可持續性

40 小時 marathon 產出驚人,但這個節奏不可複製

AI 優化建議

基於協作紀錄分析,把已經在做的好事自動化、系統化的方向。

01 — Skill 自動化

把重複流程包裝成 Skill

「依照合適的 commit 粒度先產生 commit plan 確認後再執行」這句話在 60+ session 中出現了至少 8 次。將它包裝成 /commit-phase skill(含自動讀取 git diff、按 doc→shared→server→client 分類),每次 Phase 結束一鍵完成。

同理可包裝:/check-consistency(Gherkin vs DB、Feature vs 實作)、/start-phase(讀 task 文件、載入 RFC、設定 progress tracking)
02 — Context 管理

從被動應對到主動規劃

25 個 session 中多次出現 context overflow 和 /compact。改為主動規劃:一個 session 對應一個交付物,結束前要求產出 handoff summary 存到文件,下一個 session 開頭直接讀取。

經驗法則:預期需要 3 次以上 /compact 的任務,一開始就拆成多個 session。
03 — 指令精準度

先小樣再放量

Design System 調色和 Excalidraw 架構圖各花了 5+ 輪來回。改為:先提供具體參考(hex 色碼範圍、參考圖),先要求只做一個模組的示意確認風格,再展開全圖。

核心:Claude 對具體數值的理解遠比抽象美學概念準確。用「不要什麼」框定範圍比用「要什麼」更精確。
04 — 給 Claude 更多「為什麼」

附上原因讓原則可泛化

當給出看似反直覺的決策時,附上原因能讓 Claude 在後續類似情境自行判斷。例如:「BlacklistPage useEffect 不要改 — 因為我們的設計原則是所有搜尋都手動觸發」。

效果:多給一句「為什麼」,Claude 就能把這個原則泛化到其他地方,減少重複糾正次數。這些也適合寫入 CLAUDE.md 或 memory。
05 — 錯誤處理

讓 Claude 自己除錯

在 task 文件中加入驗證步驟(「完成後執行 npm test 確認無錯誤」),建立「失敗後的 SOP」寫入 CLAUDE.md:先讀取錯誤訊息 → 檢查相關檔案 → 嘗試修復 → 再跑一次 → 仍失敗才回報。

原則:發現一個 bug 就立即處理,避免 bug 之間的交互影響。善用 systematic-debugging skill。
06 — 協作節奏

區分「需要盯」和「可以放著跑」

40 小時 marathon 產出驚人,但不可複製。設定每 2-3 小時 checkpoint commit,區分需要判斷的任務(Design System 調色)和可委託的任務(CRUD 開發),後者用 background agent。

原則:CRUD 類任務放著跑,設計決策類任務才需要盯。即使任務還沒完成,checkpoint commit 也保護進度不會因中斷而丟失。

All Sessions Detail

77 個 session 的完整明細。

Session Start (UTC+8) End (UTC+8) Model User Asst Topic Output Cache Create Cache Read Total
← Scroll horizontally for more →