目錄摘要
Google Gemini 3:以TPU訓練的全新里程碑
11月18日,Google 公布 Gemini 3,核心亮點是全部以自家晶片 TPU 完整訓練,並在多數基準上超越 OpenAI 等對手。這不僅是技術突破,更是一場生態與商業模式的再設計:當訓練成本顯著下降、供應鏈更易控管,雲端與晶片的整合優勢就會轉化為長期契約的黏性。分析機構指出,TPU 的單位成本可能只有 GPU 的二分之一至十分之一,這讓雲端客戶在選擇上有更高的談判空間與風險分散的動機。對 Google 來說,Gemini 3 的成功也在於證明自研晶片與雲端服務的閉環能帶來實際商業回報。
成本競賽的經濟學:TPU 如何挑動 GPU 的價值觀
市場觀察顯示,GPU 在典型 AI 伺服器成本中的佔比高,接近三分之二以上,而 TPU 的成本據稱僅相當於同等 GPU 的二分之一至十分之一。這使得以往以 GPU 為主的定價與合約談判出現新變數,OpenAI 等巨頭甚至可能借由轉向 TPU 來壓低 TCO,促使供應商重新調整價值主張。Gemini 3 的商業化公開也推動雲端生態的擴張,企業可在成本、效能與穩定性三者間尋求新的平衡點。
CUDA 生態與專用晶片的護城河:雙棋局的現實與挑戰
《經濟學人》指出,NVIDIA 的核心優勢在於成熟的 CUDA 生態,讓開發者高度黏著,許多用戶不容易切換至 TPU。然而 Google 透過 Gemini 3 展現的開放策略與能在 NVIDIA 平台上執行的能力,顯示兩者並非單純對立,而是形成互補與共存的格局。Meta、Anthropic 等機構亦被傳出考慮廣泛採用 TPU。未來市場或許出現雙供應鏈的現實,企業可在成本、效能、供應穩定性與法規風險等因素,靈活調整技術棧。
雲端與本端部署的取捨:TPU 的邊界與企業的策略
TPU 以雲端訓練與大規模推論為主,雖有 Edge TPU 等衍生形態,訓練級晶片仍多被部署在雲端租賃模式。對於需要嚴格本端數據控制與高度定制化的企業,GPU 或多雲混合策略往往更符合需求。Google 的新策略在於向外部市場商業化 TPU,提供完整系統與服務,使 TPU 成為可行的商業資產,而非僅限於自家雲端。此舉同時牽動了供應商與客戶的關係,促使雲端基礎設施策略出現新穩定性與風險管理的考量。
投資觀察與行動指引:把握技術變革、安排未來旅程
投資層面,建議採取「雙供應、成本敏感、可轉換軟體生態」的原則;既注意 GPU 生態的穩定性與長期升級,也警覺 TPU 供應與雲端定價的動態。企業層面可設計可切換的算力架構與標準化介面,降低沉沒成本與鎖定風險。個人投資人可關注晶片產能、雲端商機與相關股價的波動,並以長期模型規劃為主。最後,若要把握科技前沿,何不把投資視角與實地觀察結合:規劃一次以矽谷為核心的科技旅程,走訪晶片設計、雲端巨頭與研究機構,切身感受AI 計算的動力與風險。



