2026-06-27

【AI工具】算力自由：為什麼你該用 Ollama 幫 Claude Code 換上「地雲雙軌」的大腦？

說真的，每次看到 Claude Code 的教學文，開頭永遠都是「先去 Anthropic 官網申請 API Key」。

我懂，這沒什麼問題。但你有沒有想過：我們是不是從一開始就把自己鎖進了一個框框裡？

我最近發現了一件有趣的事——其實你可以把 Claude Code 的「Agent 工具外殼」留著，然後把底層的大腦，換成 Ollama 生態裡的模型。本地的、雲端的都行，而且命令列和工作流完全不用改。

換句話說：你可以在需要隱私的時候，讓它在你的機器上悄悄跑；在筆電沒力的時候，一個指令切換到雲端模型，一樣爽快。

這就是我今天想跟大家聊的：地雲雙軌的 Claude Code 環境，一種讓你真正拿回主導權的配置方式。

為什麼要「換大腦」？

講白一點，我們在做的事情叫做「解耦」。

Claude Code 本來預設會把所有請求都打到 Anthropic 原廠的雲端 API。但其實它底層用的是標準的 Anthropic Messages API 格式——而 Ollama，恰好完整支援這個格式。

所以我們要做的事情很簡單：設定兩個環境變數，告訴 Claude Code「嘿，以後請求不要打去原廠，打到我本機的 Ollama 就好」。就這樣。外殼不動，大腦換掉。

接下來你就獲得了一顆「地雲一體」的自訂大腦：

需要隱私、簡單任務？讓它在本地跑開源模型，code 一行都不出門。
大型專案、需要強力推理？切換到 Ollama 的雲端模型（如 glm-4.7:cloud），算力拉滿，筆電不發燙。

而且，不管你背後跑的是哪個模型，你在終端機面對的，都是同一套 Claude Code 工作流。超乾淨的。

兩個真實場景，應該不少人有共鳴

來，我們想像一個場景——

場景 A：週一早上，你在辦公室，桌機接著 24G 的 GPU

這時候你大可讓 Claude Code 透過 Ollama 在本地跑 qwen3-coder，一個 30B 參數的代碼專用模型，幫你重構整包 legacy code。完全離線、零 Token 費用、code 不離開你的機器。

（這種爽感真的很難形容。）

場景 B：週五下午，你帶著輕薄筆電在咖啡廳趕 deadline

散熱不好、沒插電、風扇嗡嗡叫——這種機器根本帶不動大模型。換作以前，你可能只能開網頁版 ChatGPT 手動貼 code，或者手忙腳亂地去申請另一家雲端廠商的 API 金鑰。

但因為你用的是 Ollama 生態，這時你只需要改一個參數：

# 辦公室本地版
claude --model qwen3-coder

# 咖啡廳雲端版（筆電完全不出力）
claude --model glm-4.7:cloud

工作流一模一樣，筆電涼涼的，咖啡還沒涼。完美。

AI 開發的三角難題：隱私、成本、效能

說到底，為什麼我覺得這套架構值得推廣？

因為在 AI 開發環境這件事上，我們長期面對一個三角難題：隱私、成本、效能，三個你只能選兩個。

純走本地端，早晚會撞上硬體的天花板。Context Window 塞不下大型專案，模型也未必夠力。
純走原廠雲端（Anthropic API），Token 帳單嚇死人，而且你的 code 是真的在往外送的。

Ollama 提供的地雲一體生態，剛好在這個三角難題裡打開了一條縫。它讓你用同一套 API 介面，按照任務的規模和場景，動態調度本地算力或雲端模型。不用重新設定，不用學新工具，不用換工作流。

講白一點：它讓「最適合這個任務的算力」變成了一個隨時可切換的選項，而不是一個需要提前規劃的架構決策。

這對高頻率使用 Claude Code 的工程師來說，是真實的效益，不是噱頭。

🛠️ 四步驟實作：完成地雲雙軌環境

好，觀念講完了。言歸正傳，我們直接來動手做吧！其實設定真的沒有很複雜，跟著做就對了。

Step 1：安裝並啟動 Ollama

還沒裝的話，先去 ollama.com 下載安裝包，完成安裝後確認服務有在背景跑著（預設端口是 http://localhost:11434）。

接著把你要用的本地模型拉下來。以代碼任務來說，官方推薦 qwen3-coder：

ollama pull qwen3-coder

⚠️ 注意一下：qwen3-coder 是 30B 的模型，跑得順暢至少要 24GB 的 VRAM。機器規格不夠的話，可以先試試看參數比較小的替代模型，或者直接跳到雲端模型就好。

至於雲端模型（例如 glm-4.7:cloud）不需要 pull，確保 Ollama 帳戶登入完成後，直接呼叫就行了。

Step 2：安裝 Claude Code

用 npm 全域安裝就好，一行搞定：

npm install -g @anthropic-ai/claude-code

Step 3：設定環境變數（這是整件事的靈魂）

這兩個環境變數，就是讓 Claude Code「改道」的關鍵。仔細看一下：

Mac / Linux：

export ANTHROPIC_BASE_URL="http://localhost:11434"
export ANTHROPIC_AUTH_TOKEN="ollama"  # 填什麼都行，Ollama 本地端不驗證金鑰

Windows（PowerShell）：

$env:ANTHROPIC_BASE_URL="http://localhost:11434"
$env:ANTHROPIC_AUTH_TOKEN="ollama"

建議把這兩行寫進你的 .bashrc 或 .zshrc，這樣每次開終端機都會自動套用，不用重複設定。（這個動作真的很值得，不然你一定會忘記。）

Step 4：啟動！自由切換你的算力大腦

進入你的專案目錄，接下來只需要用 --model 參數決定今天要用哪顆大腦就好：

場景 A：辦公室桌機，追求隱私與零費用

claude --model qwen3-coder

場景 B：出門在外，筆電沒力，切換雲端模型

claude --model glm-4.7:cloud

或者，你也可以用 Ollama 提供的快速啟動指令，讓它幫你互動式選模型、自動配置然後直接開 Claude Code：

ollama launch claude

啟動之後，不管背後跑的是哪個模型，你在終端機裡面對的都是同一個 Claude Code——讀 code、跑測試、自動重構，全部照常。

結語：把主導權拿回來

綜觀下來，這套架構的核心意義只有一句話：主導權回到你手上。

你不再被單一雲端廠商的定價綁架，也不必因為硬體不夠強就向專案妥協。把 Claude Code 的頂級 Agent 執行力，搭上 Ollama 地雲雙軌的算力池，你才算是真正把 AI 工具「據為己有」了。

好啦，設定到這邊就完成了！其實比想像中簡單很多對吧？

如果你喜歡這篇文章，還請給我一點支持，你的回饋是我繼續寫下去的動力！祝大家天天有 coding，天天有成長。

我是一個半路出家卻把 coding 當作興趣，且不斷鑽研技巧的開發者，希望有朝一日能成為全然獨當一面的技術大神。我們下次見！