工程師群組裡,有人剛把日常 API 從 GPT-5.4 切到 DeepSeek V4-Pro,帳單直接砍七成;Tech Lead 在算 Copilot Business 夏季多出的 $11 積分值不值得現在升級;而 Cursor 新同事透過推薦連結首月只付 $10。2026 年 6 月可能是近兩年綜合性價比最高的進場窗口——但優惠有永久、有限期與「還沒官宣」之分。本文面向個人開發者、技術主管與 AI 產品創業者:① 說明為何 6 月是抄底時機;② 盤點 DeepSeek / OpenAI / Gemini / Claude API 與 Cursor / Copilot / Windsurf 編輯器優惠;③ 給出模型路由、Prompt Caching、Batch API 三大省錢手段;④ 提供優惠速查總表、六則 FAQ、三項行動建議,以及在 NUKCLOUD 雲端 Mac 上跑多模型 Agent 的六步 Runbook。可與 AI 程式設計助手全面對比、免費 AI 工具攻略、OpenRouter 模型趨勢對照閱讀。
00為什麼 2026 年 6 月是 AI 抄底窗口?
2026 年上半年,競爭邏輯已從模型標榜轉向以價換量。三股力量同時作用:
- 中國開源模型的鯰魚效應:DeepSeek V4-Pro 以接近頂級閉源模型的能力,定價僅約 GPT-5.5 Pro 快取輸入價的 1/700,迫使國際廠商跟進。
- IPO 前的用戶爭奪:OpenAI 與 Anthropic 均傳向 SEC 秘密提交 IPO 申請,上市前需維持開發者基數,有動機維持低價或暫緩漲價。
- 企業 AI 預算收緊:WSJ 報導 Uber 等企業 2026 年 4 月前已用完全年 AI 預算,部分使用量下滑 20–30%,廠商以促銷留住客戶。
對台港開發者而言,DeepSeek 支援人民幣充值且 API 與 OpenAI 相容;Cursor、Copilot 等編輯器優惠則與雲端 Mac 上的 Agent 工作流直接相關——省 API 錢之外,還需穩定主機跑 Batch 與長連線任務。
痛點優惠季最容易踩的四個坑
- 把限時當永久:Copilot 夏季加碼積分只到 2026-08-31;Windsurf SWE-1.5 免費約三個月,結束後走正常點數。
- 忽略 Claude SDK 只是暫停:6 月 15 日 Anthropic 叫停 Agent SDK 計費變更,Pro/Max 訂閱額度仍含 SDK,但最終方案仍可能調整。
- 只用旗艦模型不做路由:70% 日常請求可切小模型,成本降 60–75%,品質損失通常低於 3%。
- 本地筆電跑 Batch / 長 Agent:Batch API 與 Cloud Agent 適合 7×24 雲端節點,合蓋休眠會中斷任務並浪費已購優惠額度。
01大模型 API 降價盤點
DeepSeek V4-Pro(永久 75 折,2026-05-31 起):原定 6 月恢復原價的 2.5 折限時優惠改為永久保留,API 長期維持原價四分之一。
| 計費項目 | 價格 |
|---|---|
| 輸入(快取命中) | ¥0.025 / 百萬 tokens |
| 輸入(快取未命中) | ¥3 / 百萬 tokens |
| 輸出 | ¥6 / 百萬 tokens |
對照:GPT-5.5 Pro 快取輸入約 $30/百萬 tokens(約 ¥218),DeepSeek 快取命中僅其約 1/700。V4-Pro 在數學、STEM、競賽級程式碼測評超越已公開測試的開源模型;5 月 23 日完成輸出提速,預設支援 500 並發。高頻輕量任務可搭配 V4-Flash(快取命中 ¥0.02/百萬 tokens)。本地 Metal 推理門檻見 ds4 與高記憶體 Mac 租賃 Runbook。
OpenAI(預期降價,2026-06-10 WSJ):內部討論對 API token 價格「大幅削減」;Sam Altman 表示將協助用戶「用更少錢獲得更多價值」。GPT-5.6 預計 6 月底發布,市場預測定價約 $5–8 輸入 / $25–40 輸出。現行主要模型定價如下(Batch API 全線 5 折):
| 模型 | 輸入 | 輸出 | 上下文 |
|---|---|---|---|
| GPT-5.5 | $5.00 | $30.00 | 128K |
| GPT-5.4 | $2.50 | $15.00 | 1M |
| GPT-5 | $1.25 | $10.00 | 128K |
| GPT-4.1 | $2.00 | $8.00 | 1M |
| GPT-4.1 Nano | $0.10 | $0.40 | 1M |
建議:用量不大可等 GPT-5.6 / 降價官宣;重度使用日常切 DeepSeek V4-Pro,OpenAI 留給關鍵場景。立即可用:Prompt Caching(重複 system prompt 自動 50–75% 折扣)、Batch API(非即時任務 5 折)、簡單任務路由至 GPT-4.1 Nano。
Google Gemini 2.5(常規低價,1M 上下文):
| 模型 | 輸入 | 輸出 | 上下文 |
|---|---|---|---|
| Gemini 2.5 Pro | $1.25(≤200K)/ $2.50(>200K) | $10.00 | 1M |
| Gemini 2.5 Flash | $0.30 | $2.50 | 1M |
| Gemini 2.5 Flash-Lite | $0.10 | $0.40 | 1M |
Flash-Lite 以 $0.10/百萬 tokens 輸入成為最便宜的 1M 上下文選項之一,適合文件處理、分類摘要與 Google Cloud 整合場景。
Anthropic Claude(SDK 計費暫停,2026-06-15):原計畫當日將 Agent SDK、claude -p、第三方工具從訂閱額度剝離改 API 計費(實質漲價),生效當天宣布暫停,「目前一切不變,正在重新規劃」。Pro($20/月)、Max 5x($100/月)、Max 20x($200/月)訂閱額度暫仍含 SDK。Claude Code 重度用戶宜在新方案公布前充分利用額度,並對照 四款助手選型表。
02AI 編輯器與工具優惠
Cursor 推薦碼(首月 5 折):2026 年 5 月確認上線的 Referral Program(limited rollout),新用戶經推薦連結註冊首月 Pro / Pro+ / Ultra 享 50% off;推薦者每成功一人獲 $25 使用積分(最多 10 人/月)。
| 方案 | 原價 | 首月推薦價 |
|---|---|---|
| Pro | $20/月 | $10/月(首月) |
| Pro+ | $40/月 | $20/月(首月) |
| Ultra | $200/月 | $100/月(首月) |
可在開發者社群搜尋推薦連結(格式如 cursor.com/signup?ref=XXXXXXXX),結帳自動套用。官方支援,非破解激活碼。重度使用可能超信用額度,實際月費或達 $60+。進階配置見 Cursor Agent Skills 指南。
GitHub Copilot 夏季促銷積分(至 2026-08-31):6 月 1 日全面遷移至用量計費(1 AI Credit = $0.01)。Business / Enterprise 用戶 6–8 月自動獲更高月度積分,無需額外操作;9 月起恢復標準配額。
| 方案 | 月費 | 標準積分 | 夏季促銷積分(6–8 月) | 相當於白送 |
|---|---|---|---|---|
| Copilot Business | $19/用戶/月 | $19 AI 積分 | $30 AI 積分 | 多出約 58% |
| Copilot Enterprise | $39/用戶/月 | $39 AI 積分 | $70 AI 積分 | 多出約 79% |
個人版:Pro $10/月、Pro+ $39/月;「自動模型選擇」額外 10% 積分折扣;程式碼補全不消耗積分。年訂閱用戶到期時才遷移新計費,建議到期前評估是否改月付。Agent 工作流可對照 Copilot Coding Agent Runbook。
Windsurf SWE-1.5 免費三個月:近前沿級程式碼專用模型對所有用戶(含 Free)開放試用。定價概覽:
| 方案 | 月費 | 核心內容 |
|---|---|---|
| Free | $0 | 無限程式碼補全 + 25 Cascade 積分/月 |
| Pro | $15–20/月 | 500 提示額度 + 所有進階模型 |
| Max | $200/月 | 重度 Agent 使用者 |
| 維度 | Windsurf Pro | Cursor Pro |
|---|---|---|
| 價格 | $15–20/月 | $20/月 |
| 免費層 | 永久(25 積分/月) | 2 週試用 |
| 代理能力 | Cascade(更自主) | Composer(更精細) |
| 最適合 | 預算敏感 + 試自主 Agent | 多檔案重構 + 大型專案 |
03省錢組合拳:路由、快取與 Batch
手段一:模型分級路由(省 40–80%)
- 複雜推理 / 架構 → GPT-5.4 / Claude Sonnet 4.x / DeepSeek V4-Pro
- 日常問答 / 摘要 → GPT-4.1 mini / Gemini 2.5 Flash
- 分類 / 打標 → GPT-4.1 Nano($0.10)/ Gemini Flash-Lite($0.10)/ DeepSeek Flash(¥0.02 快取)
實測:70% 請求路由小模型,成本降 60–75%,品質下降通常 <3%。OpenRouter 週榜可對照 帳單真實性分析。
手段二:Prompt Caching(省 50–90%)
| 平台 | 快取折扣 | 適用場景 |
|---|---|---|
| Anthropic | 90% off(0.1x 價格) | RAG、客服機器人、長文件 |
| OpenAI | 50% off(自動觸發) | 含重複前綴的應用 |
| 75% off | 長上下文任務 | |
| DeepSeek | 快取命中 ¥0.025/百萬 | 幾乎等同免費 |
實務:system prompt 放最前且保持穩定,快取命中率可超 80%。
手段三:Batch API(非即時任務 5 折起)——適合批量文件分析、資料清洗、定期報告;24 小時內非同步返回。以中型應用(月均 100M tokens)估算:60% 切小模型 -45%、快取 -20%、Batch -10%、限制輸出上限 -5%,合計約 -80%。
046 月 AI 優惠速查總表
| 產品/服務 | 優惠內容 | 折扣力度 | 截止日期 | 緊迫程度 |
|---|---|---|---|---|
| DeepSeek V4-Pro API | 永久降為原價 25%(快取輸入 ¥0.025/百萬) | 75% off 永久 | 無截止 | 隨時可用 |
| Cursor(新用戶) | 推薦碼首月半價 | 50% off 首月 | 不定期 | 推薦碼流通中 |
| GitHub Copilot Business | 6–8 月額外積分($30 vs $19/月) | +58% 積分 3 個月 | 2026-08-31 | 有截止日期 |
| GitHub Copilot Enterprise | 6–8 月額外積分($70 vs $39/月) | +79% 積分 3 個月 | 2026-08-31 | 有截止日期 |
| Windsurf SWE-1.5 | 三個月免費使用近前沿模型 | 免費 | 約 3 個月內 | 促銷進行中 |
| Claude 訂閱(暫停漲價) | 訂閱額度繼續覆蓋 SDK 用法 | 實質利好 | 待下一次通知 | 利好存續中 |
| OpenAI API(預期) | 預計「大幅降價」,GPT-5.6 即將發布 | TBD | 預計 6 月底–7 月 | 等待官宣 |
| Gemini 2.5 Flash-Lite | 市場最低價 1M 上下文($0.10 輸入) | 競爭性定價 | 無截止 | 隨時可用 |
05三項行動建議
-
01
現在:若為 AI 編輯器新用戶,取得 Cursor 推薦連結,首月 5 折試用 Pro;同時在 DeepSeek 平台開通 API,把日常程式任務從 GPT-5.4 切到 V4-Pro 或 V4-Flash,驗證品質與帳單降幅。
-
02
本月內:團隊若使用或考慮 Copilot Business / Enterprise,在 8 月 31 日前確認夏季促銷積分已入帳;評估 Windsurf SWE-1.5 三個月免費期是否適合作為 Cascade Agent 試點。
-
03
持續關注:OpenAI 降價與 GPT-5.6 發布節點;Anthropic SDK 計費新方案。在官宣前充分利用 Claude Pro/Max 訂閱額度,並以模型路由 + 快取 + Batch 把 API 帳單壓到原來的約 1/10。
06六步 Runbook:雲端 Mac 落地多模型省錢工作流
優惠解決「買什麼更便宜」;NUKCLOUD 雲端 Mac解決「Batch 與 Agent 放哪跑才不打折」。以下 Runbook 在獨占 Apple Silicon 上同時跑 Cursor、Copilot CLI 與 DeepSeek / OpenAI 路由閘道,避免筆電合蓋中斷長任務。
-
01
盤點工具棧與優惠窗口:列出 IDE(Cursor / Windsurf / VS Code)、API 供應商(DeepSeek、OpenAI、Gemini)與編輯器訂閱狀態。估算 Cursor Pro($20)+ Copilot Business($19)或 Claude Max($100)月費,並標記 8/31 前 Copilot 加碼積分、Cursor 首月 5 折等截止日。
-
02
控制台撥備雲端 Mac:登入 NUKCLOUD 控制台,選擇 32 GB+ 統一記憶體(同時跑 Cursor + Batch 閘道 + Docker 較穩);見 定價頁 按小時試跑。
-
03
配置多源 API 與路由規則:在
~/.zshrc寫入 DeepSeek、OpenAI、Anthropic Key;部署 OpenRouter 或自研路由:簡單任務 → V4-Flash / GPT-4.1 Nano,複雜任務 → V4-Pro / GPT-5.4。固定 system prompt 以提升快取命中率。 -
04
安裝編輯器與 CLI 工具鏈:SSH 登入後安裝 Cursor(或 Remote SSH);
npm install -g @anthropic-ai/claude-code;配置gh copilot與 GitHub Token。建立CLAUDE.md、AGENTS.md統一規範。 -
05
跑通 Batch 與 Agent 試點:將報表生成、文件摘要等任務改走 Batch API(5 折);用 Claude Code Plan Mode 或 Cursor Composer 對一個模組試跑,記錄 token / 積分消耗基線。對照 CLI 工具排行 選閘道。
-
06
固定月租與用量監控:試點通過後於 下單頁 鎖定規格;用
launchd保持 Batch 排程與 Agent 常駐;每週對照各平台帳單,確保路由策略把 70% 流量導向低價模型。進階見 Agent Skills 指南。
共享 VPS 或本地 Mac mini 跑 Cloud Agent 常見頻寬抖動、合蓋休眠、記憶體不足導致上下文截斷。需要 7×24 Batch 排程或多子代理並行時,NUKCLOUD 多區域裸機 Mac / 雲端 Mac 節點在獨占租戶邊界與規格彈性上更易對齊團隊工具棧;可先按小時試跑省錢路由,再固定月租。