返回文章列表
AI Agent16 分鐘閱讀2026.06.07

用 OpenClaw 幫公司養一隻會工作的 AI 小龍蝦

不必等一套大系統,先從一台 Mac mini、一隻龍蝦、幾個內部系統開始,把 AI agent 放進真的工作現場。

先別急著上大系統,先養一隻會工作的龍蝦

老實說,這件事我們一度放棄。2026年3月 Claude Opus 4.7 那陣子還沒辦法讓龍蝦穩定上工,模型、工具串接和日常可靠度都差一截;硬推,只會做出一個很貴、很會聊天、但沒人敢真的交辦工作的玩具。不是不想做,是時機沒到。

轉折點是 GPT-5.5。我們找了兩台 Mac mini,各養一隻 Hermes agent,再加上兩隻龍蝦,其中一隻 Lucy 開放給同事共用。結果出乎意料——不是我在那邊到處教大家「怎麼用 AI」,而是同事一加進來,就直接開始叫牠幹活。

這給我一個很直接的結論:公司導入 AI,根本不必從一套龐大的會議系統、知識管理平台或大型導入案開始。先把一隻 agent 丟進真實的工作現場,讓牠碰到訊息、任務、流程、log、code 和測試,你很快就會看清楚——哪些事值得自動化,哪些只是大家以前懶得整理而已。

重點從來不是聊天,是接上真正的工作現場

Lucy 在我們這裡,從來不是一隻聊天機器人。聊天只是入口;真正有價值的,是牠能動手——自己去該看的地方看資料、把結果整理成人看得懂的狀態,再把事情往前推一步。

這就是一個 agent 跟一般 chatbot 最大的差別:你不用一直餵牠「把資料貼給我」「再貼一次」「這張截圖你看一下」。一個接上工作現場的 agent,會自己去翻,然後回你一個結論。工程師不用在十幾個系統之間來回切到頭昏,PM 也不用每天追同一串訊息追到眼神死。

所以這篇要談的,不是怎麼讓 AI 更會講話,而是怎麼讓牠真的接上你每天在用的系統、而且在裡面安全地工作。先把這個目標立清楚,後面每一步才有意義。

安全性要先設計,不要等出事才補

公司養 agent 的第一條規則其實很簡單:一定要給牠獨立的 Email、獨立帳號、獨立權限。千萬不要拿老闆帳號、PM 帳號、或工程師的個人 token 去接。那不是在提升效率,是在挖一個查不出責任、收不回權限、也不知道牠到底動過什麼的資安洞。

比較健康的做法,是把 Lucy 當成一個非人類員工管理。牠要有自己的身份、自己的權限群組、自己的 API token、自己的 audit log。能讀就不要給寫,能只看某個 project 就不要看全部,能開 MR 就不要直接 push main,能查 log 就不要順便給 production shell。這些不是保守,是讓 agent 可以長期被公司信任。

我查了一輪最新的 agent 安全建議,方向其實很一致:最小權限、工具白名單、敏感操作人工確認、完整記錄、定期檢查權限,以及把外部輸入當成不可信內容。尤其 agent 會讀 Slack、issue、網頁、文件時,要特別小心 prompt injection;不要讓一段文件裡的惡意指令,變成牠真的去刪資料、寄信或外洩 token 的理由。

邊界畫好之後,接下來就是一個一個把工具接上

安全的底線畫好之後,剩下的其實是工程跟耐心:把 Lucy 一個一個接上團隊真正在用的工具。我不會一次全開,而是照「先讀、再寫,先小範圍、再放大」的節奏慢慢長能力,每接一個都先回頭對齊前面那條規則——獨立身份、最小權限、重要操作人工確認。

下面我會一個一個帶你實戰,每接一個工具,就講清楚牠怎麼接、權限怎麼設、實際怎麼用,還有我自己踩過哪些坑。順序就照這條清單走,點任何一項都能直接跳到對應的段落:

Slack 實戰|接進來:先讓 Lucy 住進團隊每天在講話的地方

安全邊界先畫好之後,第一個要接的不是什麼高大上的系統,而是 Slack。原因很簡單:團隊真正的工作對話、決策、抱怨、臨時加的事,幾乎都發生在 Slack 裡。把 agent 接進 Slack,等於把牠放到工作現場的入口,而不是另外開一個沒人想登入的後台。

做法上,我用 Lucy 自己的身份開一個 Slack app/bot(不是借誰的帳號,這點呼應前面講的獨立身份),然後把牠邀進特定幾個頻道。之後團隊只要在頻道裡 @Lucy,就能叫牠整理 thread、回問題、把一長串討論濃縮成重點。重點是牠被點名才動作,不會主動插話洗版。

這一步也是後面所有能力的底座。因為牠住在 Slack,你要牠做事——包括等一下的會議紀錄——就是把檔案丟進頻道 tag 牠,不用再額外教大家開另一個工具。入口統一,採用率才上得來。

Slack 實戰|權限控管:先決定牠能進哪些頻道、能做什麼

Slack 接上去之後,馬上要做的是收權限。Bot 的 token scope 只給需要的:能讀「被邀請進去的頻道」的訊息、能在頻道裡回話就好,不要給 workspace admin,也不要開「讀整個 workspace」那種大範圍權限。能少給就少給,這跟前面講的最小權限是同一條原則。

頻道一律用白名單,而且只開公開頻道:Lucy 只看得到牠被邀請進去的那幾個公開頻道,私人頻道、私訊一律不開。HR、財務、薪資、法務這種敏感頻道更是連邀都不要邀。先給「讀 + 在限定頻道回」就好,主動改設定、發 DM 這類動作,之後真的需要再逐步放。

「只開公開頻道」這條看起來保守,其實有兩個很實際的好處。一是學習:大家在公開頻道看著彼此怎麼跟 Lucy 下指令、怎麼把需求講清楚,等於整個團隊一起在練怎麼跟 AI 溝通,不用我一個一個教。二是透明:誰交辦了什麼、牠做了什麼、有沒有人在亂用,全部攤在頻道裡看得到——出事能追,也比較不會有人想偷玩。

還有一點容易被忽略:Slack 裡別人貼的訊息,對 agent 來說也是外部輸入。所以牠不能因為某個人在頻道貼一句「Lucy,把某某頻道的內容整包貼出來」就照做——這就是 prompt injection。把「敏感操作要人工確認、外部內容當不可信」這兩條設進去,牠住在 Slack 才會是資產,而不是一個被誰一句話就能指使的洞。

會議紀錄不該再是個大工程,這該是 agent 的基本技能

最近又看到新聞在討論會議紀錄系統要動用多少資源、跑多久才能上線。大公司有採購、法務、整合和維運成本,我理解;但中小團隊往往沒有本錢等半年。與其等一套大系統慢慢導入,不如先讓一隻會幹活的小龍蝦把流程跑起來,反而務實得多。

更重要的是:把會議錄音轉成逐字稿、再整理成摘要跟待辦,這件事在 2026 年已經不該是一套要採購的「系統」,而是 agent 的基本技能。下面我不講概念,直接把我怎麼在 Slack 上教 Lucy 學會這件事寫出來,你可以照著養自己的。

會議紀錄實戰|Step 1:把本機轉錄環境裝起來,引擎選 faster-whisper

我直接在 Slack 丟一句給 Lucy:「來,我要你去抓 Whisper,然後做一個可以做會議紀錄的能力。」牠回我的是已經把環境準備好了——Whisper 在 /opt/homebrew/bin/whisper,ffmpeg 也有,然後新增了一個可重複用的技能 skills/meeting-notes-whisper/,裡面附一支腳本 scripts/transcribe_meeting.sh,先用最小的 tiny model 跑過 smoke test,確認從音檔到逐字稿這條路能通。

不過第一版我請牠換引擎。原版 openai-whisper 能用,但做本機會議紀錄我會優先用 faster-whisper:它是同一套 Whisper 模型,改用 CTranslate2 跑,速度快很多、吃的 VRAM 更少,準確度基本等同同尺寸的 Whisper。所以底層引擎固定用 faster-whisper,再加 VAD 把靜音段切掉,避免模型在沒人講話的地方亂生字。

如果你是 Apple Silicon、又很在意本機最佳化,可以再評估 whisper.cpp 或 MLX;但以 Python workflow 跟技能整合的順手程度來說,faster-whisper 是比較好顧的起手式。需要分辨誰講哪一句(講者分離)的話,再加 pyannote 或 WhisperX,那通常是第二階段,因為要弄 token 跟設定比較麻煩,先別卡在這裡。

會議紀錄實戰|Step 2:model 用 medium 起手,重要會議才上 large-v3

選 model 不要一律挑最大的。會議紀錄這種場景,我讓 Lucy 預設用 medium(純英文就 medium.en,中英混講就用 multilingual medium)。medium 在速度跟準確度之間最平衡,尤其遇到中英夾雜、口音、會議室收音不穩的時候,會比 small 穩很多,又不會像 large 那麼慢、那麼吃資源。

分三檔就夠用:快速模式 small、預設 medium、重要會議或要存證的高品質模式 large-v3。參數先固定開 VAD 切靜音,再轉逐字稿,最後才進整理階段。把這套寫進技能的預設值,之後叫牠做會議紀錄就不用每次重講一遍,牠自己會照規矩跑。

會議紀錄實戰|Step 3:逐字稿只是中間產物,重點是整理成能交辦的東西

真正的考驗在轉錄之後。我丟了一個 1 小時 19 分、41MB 的會議 m4a 給 Lucy,牠用 faster-whisper medium 轉完,輸出兩個檔:原始逐字稿 transcript.txt,跟整理過的 meeting-notes.md。逐字稿本身其實不值錢,值錢的是後面那份——會議摘要、主要決議、待辦重點、未決問題,而且每一條待辦都帶上負責人。

以那場會議為例,整理出來就是很具體的東西:官網聚焦家用/廚房、保固統一改十年、零售流程跟經銷商流程拆開、金流先看綠界並一起處理電子發票、丈量上傳用訂單碼加電話驗證……這些直接就能變成 Jira 上的 issue 去派工,而不是一份沒人會回去看的逐字稿。

有個誠實的地方要提醒:人名、產品名、金流名稱這種專有名詞,辨識不一定百分之百準。所以我會讓 Lucy 在整理版標註哪些是依語境推斷的,讓人快速複核,而不是假裝它全對——這一步反而是會議紀錄能不能被信任的關鍵。

會議紀錄實戰|小結:技術到位之後,逐字稿就不值錢了,接上工作流才值錢

七、八年前我就想做這件事,也做過幾個 POC,但那時候技術一直差一截:辨識不夠準、摘要太飄、上下文接不住,最後還是要人重聽。現在不一樣了,轉錄這段基本上是已經被解決的問題。

所以接下來真正該花力氣的,不是再去比哪套轉錄系統強,而是它後面接到哪裡:摘要能不能自動丟回 Slack?待辦能不能直接開成 Jira issue?決議能不能跟既有 issue 對上?下次開會前,Lucy 能不能先把上次沒收尾的事抓出來提醒大家?這些才是公司效率真的會變的地方,也是你養一隻 agent 比買一套系統划算的原因。

ELK 實戰|開一個 read-only token,剩下叫 Lucy 自己串

Slack 跟會議紀錄上手之後,下一個我會接的是 ELK——也就是讓 Lucy 能直接查 log。原因很實際:很多「這個怎麼壞了」「那個錯誤從什麼時候開始」的問題,答案本來就埋在 log 裡。與其每次都讓工程師自己撈,不如讓牠先進去查、先把可疑的時間點跟錯誤框出來,人再接手判斷。

接法比想像中簡單。先到 ELK 開一個 read-only 的 token,順手把你想開放給牠看的那幾個專案範圍設好——能只看這幾個,就不要給全部。接著把 token 寫進環境變數或 keychain,再把 ELK 的存取 path 給 Lucy,叫牠自己把連線串起來。串好之後,你在 Slack 問牠 log,牠就會自己進去查、回你重點。

這裡有一條規矩一定要守住:token 只能放在 env/keychain,絕對不要貼在 Slack 或對話裡。對話會被很多人看到、會被存下來,甚至可能被當成外部輸入餵回模型;token 一旦外流,等於把查 log 的鑰匙送出去。再配上「read-only」這層保險,就算真的出包,最壞情況也只是牠看了不該看的,而不是把 production 的資料改壞——這就是為什麼 ELK 這一關,我寧可權限給得小一點。

Jira 實戰|同理可做:scope 好專案,先讀再放寫

Jira 跟 ELK 是同一套做法:開一個 token、設定好牠能看哪些專案、把 token 收進 env/keychain、再把 path 交給 Lucy 串。差別在於 Jira 不只是拿來讀——我會讓牠看 issue、幫忙補需求脈絡、把一長串討論整理成比較完整的描述,所以權限會比純查 log 多一點。

但「多一點」也要照順序放。第一階段先給讀:能看 issue、看 backlog、回答「這張單到底卡在哪」。確定牠引用得準、不會亂編之後,再開放在指定專案底下留言、補欄位這種輕量寫入。至於建立新單、改狀態、指派負責人這種會動到流程的動作,留到最後,而且最好設成要人按一下確認。

token 一樣絕對不要出現在 Slack 或對話裡,scope 也只給你真的要牠碰的那幾個專案。Jira 裡常常混著跨部門的東西,HR、財務、或還沒公開的專案就別放進 scope。原則跟前面完全一樣:能少給就少給,先讀再寫,重要操作人工確認。

GitHub 實戰|同理可做:能開 PR 就不要給 push main

GitHub 也是套同一個流程:開 token、設定能看哪些 repo、token 收進 env/keychain、把 path 給 Lucy。牠能做的事很有感——看 code、定位 bug、甚至直接開一個 PR 把修法提出來。對工程團隊來說,這大概是最快會喊出「省事」的一關。

但越能動手的工具,邊界越要先畫好。回到安全那章那句話:能開 MR 就不要直接 push main。我會讓 Lucy 只能在分支上開 PR、把改動攤出來給人 review,不給牠直接推主幹、也不給牠合併自己的 PR。CI 跟測試照跑,人看過再 merge。這樣牠是幫你寫初稿的工程師,不是一個能直接動到 production 的黑箱。

其餘規矩照舊:token 放 env/keychain、不落在對話裡,repo scope 只開你要牠參與的那幾個,私有的、敏感的、牽涉金鑰的 repo 先別放進來。串好之後,你在 Slack 丟一句「這個 bug 幫我看一下」,牠就能從讀 code、查 log(接上前面的 ELK)一路到開出一個帶說明的 PR——但最後那一步「要不要 merge」,永遠留在人手上。

三個接完之後:一個人在 Slack 就能把 issue → log → code 走完

分開看,Slack、Jira、ELK、GitHub 各自只省一點力;四個串在一起,才是真的換了一種工作方式。同仁不用再開三四個分頁、登入三四個系統,只要在 Slack 丟一句話:「Lucy,我手上這張單到底卡在哪?」牠就會自己把 Jira 的 issue、ELK 的 log、GitHub 的 code 一路接起來看,幾分鐘後回你一句「問題在這、這樣改」。

最有感的,是那種「到底是誰的問題」的場面。前端可以直接問牠:這個錯是我 API 用錯,還是後端本來就有 bug?App 同仁要接一支新 API,不用癡癡等文件,直接問參數、格式、怎麼串。以前光是釐清這些,就得先生出一份夠完整的文件、再來回測個好幾輪——現在牠把證據攤在同一個對話裡,當場就分得出來。

對 PM 更是一種解脫。線上一出狀況,過去最先卡住的往往不是「修不修得好」,而是「這到底是 App、前端、還是後端的事?」三邊互推、各說各話,PM 夾在中間追到天荒地老。現在 Lucy 先把 log、issue、code 對過一遍,至少能很快把箭頭指向對的那一邊——該找誰、從哪查,方向先收斂,這比什麼都值錢。

說到底,Lucy 不是來取代誰,而是把「定位問題」這段最耗神、最容易互踢皮球的過程狠狠縮短。文件還是要寫,但它不再是合作的前置門檻;很多原本卡在「我等你文件、你等我重現」的來回,直接被牠收掉。這,才是把工具一個一個接上、又守好邊界之後,真正換來的東西。

Email 實戰|只收不回:讓 Lucy 自動分流 support 信、開 ticket

Email 我們的接法是「只收不回」——讓 Lucy 讀,但不讓牠自動回客戶。為什麼不回?因為自動回信給客戶風險太高,語氣、承諾、講錯一句都可能直接變客訴;讀跟整理交給牠,回覆這一步留給人。最有價值的場景是 support 信箱:客戶回報問題時,信裡常常就附了 App 的 log。

與其讓 support 同仁一封一封讀、再轉給工程,不如讓牠先讀、先分析。Lucy 會把每封 support 信看過,分析裡面的 log 跟描述,初步評估可能是什麼問題、有多嚴重,然後直接在 Jira 開一張 ticket、assign 給對應的負責人。等於把「分類、初判、派工」這段最瑣碎的前處理自動做掉,RD 一打開 ticket,脈絡已經整理好了。

但有一條我特別在意:ticket 上一定會標註「這是 AI 的初步分析」。一來提醒接手的 RD 再用自己的專業判斷一次,不要照單全收;二來避免團隊太相信 AI——牠是來幫你省掉前面那段累人的整理,不是來下最終結論的。標清楚是誰分析的,大家才會用得安心,也用得對。

LINE 實戰|只聽不回:台灣客戶都在 LINE,讓 Lucy 幫你整理需求

台灣的生態就是這樣——客戶超愛用 LINE。與其逼客戶改用別的管道,不如把一隻小 bot 串進 LINE。一樣是「只聽不回」:牠負責收、負責整理,但不直接回客戶。串好之後,同仁不用再爬一長串 LINE 對話,直接在 Slack 請 Lucy「把某某客戶最近的需求整理一下」,牠就能把零散的訊息收斂成「客戶要什麼、提到哪些問題、有哪些待辦」。客戶在 LINE 隨口丟的需求,不會再散在對話裡蒸發掉。

LINE 這一關的安全設定要特別小心,因為對面是客戶、是外人。一定要先設計好牠能回什麼、不能回什麼——絕對不要讓客戶隨口一問,就把公司內部資訊、報價邏輯、或其他客戶的事給套出去。「只聽不回」其實本身就是一道防線:牠預設不對外發言,所有對外回覆都先經過人,就不會被一句話釣出不該講的東西。

我的建議:先讓一個小團隊用起來,再擴散

如果你想在公司導入 OpenClaw,我不建議一開始就發全公司公告。先找一個願意嘗試、工作痛點明確、資料權限相對可控的小團隊。幫他們挑三件最常重複的事,設計好 agent 能看的資料、能用的工具、不能碰的邊界,然後每天真的用。

第一週不要追求神奇,追求穩。牠能不能正確找到資料?會不會亂引用?遇到不確定的事會不會停下來問?操作記錄能不能查?同事敢不敢把小任務交給牠?這些答案,比任何 AI 策略簡報都誠實。

等大家開始自然叫 Lucy 工作,你就知道這東西活了。公司導入 AI 最難的不是買工具,是讓工具進入日常。先養一隻有身份、有邊界、會留下紀錄的小龍蝦,讓牠在真實工作裡證明自己。爆紅不一定是因為你講了多大的願景,有時候只是因為你真的讓大家少加了很多班。

這條路你完全可以自己走,這篇也盡量寫得能照著做。但如果你想少踩幾個坑、快一點讓第一隻 agent 在公司裡上工,從邊界怎麼設、工具怎麼接,到陪你把流程跑順——這正是我們在幫團隊做的事。想聊聊,隨時找我們;不聊,照著上面做,你也能自己養出一隻會工作的龍蝦。

參考資訊

這篇講的安全原則跟做法,不是我自己拍腦袋想的。下面這些是我整理時參考、也建議你一起讀的來源——從產業領袖的態度、coding agent 的安全實務,到 agent 威脅模型與企業級防禦框架都有: