2026-06-27
【AI工具】算力自由:為什麼你該用 Ollama 幫 Claude Code 換上「地雲雙軌」的大腦?

說真的,每次看到 Claude Code 的教學文,開頭永遠都是「先去 Anthropic 官網申請 API Key」。
我懂,這沒什麼問題。但你有沒有想過:我們是不是從一開始就把自己鎖進了一個框框裡?
我最近發現了一件有趣的事——其實你可以把 Claude Code 的「Agent 工具外殼」留著,然後把底層的大腦,換成 Ollama 生態裡的模型。本地的、雲端的都行,而且命令列和工作流完全不用改。
換句話說:你可以在需要隱私的時候,讓它在你的機器上悄悄跑;在筆電沒力的時候,一個指令切換到雲端模型,一樣爽快。
這就是我今天想跟大家聊的:地雲雙軌的 Claude Code 環境,一種讓你真正拿回主導權的配置方式。
為什麼要「換大腦」?
講白一點,我們在做的事情叫做「解耦」。
Claude Code 本來預設會把所有請求都打到 Anthropic 原廠的雲端 API。但其實它底層用的是標準的 Anthropic Messages API 格式——而 Ollama,恰好完整支援這個格式。
所以我們要做的事情很簡單:設定兩個環境變數,告訴 Claude Code「嘿,以後請求不要打去原廠,打到我本機的 Ollama 就好」。就這樣。外殼不動,大腦換掉。
接下來你就獲得了一顆「地雲一體」的自訂大腦:
- 需要隱私、簡單任務?讓它在本地跑開源模型,code 一行都不出門。
- 大型專案、需要強力推理?切換到 Ollama 的雲端模型(如
glm-4.7:cloud),算力拉滿,筆電不發燙。
而且,不管你背後跑的是哪個模型,你在終端機面對的,都是同一套 Claude Code 工作流。超乾淨的。
兩個真實場景,應該不少人有共鳴
來,我們想像一個場景——
場景 A:週一早上,你在辦公室,桌機接著 24G 的 GPU
這時候你大可讓 Claude Code 透過 Ollama 在本地跑 qwen3-coder,一個 30B 參數的代碼專用模型,幫你重構整包 legacy code。完全離線、零 Token 費用、code 不離開你的機器。
(這種爽感真的很難形容。)
場景 B:週五下午,你帶著輕薄筆電在咖啡廳趕 deadline
散熱不好、沒插電、風扇嗡嗡叫——這種機器根本帶不動大模型。換作以前,你可能只能開網頁版 ChatGPT 手動貼 code,或者手忙腳亂地去申請另一家雲端廠商的 API 金鑰。
但因為你用的是 Ollama 生態,這時你只需要改一個參數:
# 辦公室本地版
claude --model qwen3-coder
# 咖啡廳雲端版(筆電完全不出力)
claude --model glm-4.7:cloud
工作流一模一樣,筆電涼涼的,咖啡還沒涼。完美。
AI 開發的三角難題:隱私、成本、效能
說到底,為什麼我覺得這套架構值得推廣?
因為在 AI 開發環境這件事上,我們長期面對一個三角難題:隱私、成本、效能,三個你只能選兩個。
- 純走本地端,早晚會撞上硬體的天花板。Context Window 塞不下大型專案,模型也未必夠力。
- 純走原廠雲端(Anthropic API),Token 帳單嚇死人,而且你的 code 是真的在往外送的。
Ollama 提供的地雲一體生態,剛好在這個三角難題裡打開了一條縫。它讓你用同一套 API 介面,按照任務的規模和場景,動態調度本地算力或雲端模型。不用重新設定,不用學新工具,不用換工作流。
講白一點:它讓「最適合這個任務的算力」變成了一個隨時可切換的選項,而不是一個需要提前規劃的架構決策。
這對高頻率使用 Claude Code 的工程師來說,是真實的效益,不是噱頭。
🛠️ 四步驟實作:完成地雲雙軌環境
好,觀念講完了。言歸正傳,我們直接來動手做吧!其實設定真的沒有很複雜,跟著做就對了。
Step 1:安裝並啟動 Ollama
還沒裝的話,先去 ollama.com 下載安裝包,完成安裝後確認服務有在背景跑著(預設端口是 http://localhost:11434)。
接著把你要用的本地模型拉下來。以代碼任務來說,官方推薦 qwen3-coder:
ollama pull qwen3-coder
⚠️ 注意一下:
qwen3-coder是 30B 的模型,跑得順暢至少要 24GB 的 VRAM。機器規格不夠的話,可以先試試看參數比較小的替代模型,或者直接跳到雲端模型就好。
至於雲端模型(例如 glm-4.7:cloud)不需要 pull,確保 Ollama 帳戶登入完成後,直接呼叫就行了。
Step 2:安裝 Claude Code
用 npm 全域安裝就好,一行搞定:
npm install -g @anthropic-ai/claude-code
Step 3:設定環境變數(這是整件事的靈魂)
這兩個環境變數,就是讓 Claude Code「改道」的關鍵。仔細看一下:
Mac / Linux:
export ANTHROPIC_BASE_URL="http://localhost:11434"
export ANTHROPIC_AUTH_TOKEN="ollama" # 填什麼都行,Ollama 本地端不驗證金鑰
Windows(PowerShell):
$env:ANTHROPIC_BASE_URL="http://localhost:11434"
$env:ANTHROPIC_AUTH_TOKEN="ollama"
建議把這兩行寫進你的 .bashrc 或 .zshrc,這樣每次開終端機都會自動套用,不用重複設定。(這個動作真的很值得,不然你一定會忘記。)
Step 4:啟動!自由切換你的算力大腦
進入你的專案目錄,接下來只需要用 --model 參數決定今天要用哪顆大腦就好:
場景 A:辦公室桌機,追求隱私與零費用
claude --model qwen3-coder
場景 B:出門在外,筆電沒力,切換雲端模型
claude --model glm-4.7:cloud
或者,你也可以用 Ollama 提供的快速啟動指令,讓它幫你互動式選模型、自動配置然後直接開 Claude Code:
ollama launch claude
啟動之後,不管背後跑的是哪個模型,你在終端機裡面對的都是同一個 Claude Code——讀 code、跑測試、自動重構,全部照常。
結語:把主導權拿回來
綜觀下來,這套架構的核心意義只有一句話:主導權回到你手上。
你不再被單一雲端廠商的定價綁架,也不必因為硬體不夠強就向專案妥協。把 Claude Code 的頂級 Agent 執行力,搭上 Ollama 地雲雙軌的算力池,你才算是真正把 AI 工具「據為己有」了。
好啦,設定到這邊就完成了!其實比想像中簡單很多對吧?
如果你喜歡這篇文章,還請給我一點支持,你的回饋是我繼續寫下去的動力!祝大家天天有 coding,天天有成長。
我是一個半路出家卻把 coding 當作興趣,且不斷鑽研技巧的開發者,希望有朝一日能成為全然獨當一面的技術大神。我們下次見!