什麼是 Gemini 3？Google 最新 AI 模型的五大超能力實測解析

INFINITIX

2025-11-21

gemini3

諮詢專業顧問

什麼是 Gemini 3：不僅是更新，更是思維的躍進

在人工智慧（AI）以驚人速度發展的今天，我們似乎已經對新模型的發布感到有些麻木。每隔幾個月就有新的突破，但真正能讓人從椅子上跳起來、大喊「這太不可思議了」的時刻，卻越來越少。然而，Google 於 2025 年 11 月 18 日正式發布的 Gemini 3，正是那種久違的震撼。

Gemini 3 是什麼？簡單來說，它是 Google DeepMind 開發的最新一代多模態 AI 模型，也是目前 Google 最智慧的 AI 模型。這次的更新感覺不像是一次常規的迭代，更像是一次根本性的思維躍進。Gemini 3 所展現出的能力，已經超越了簡單的問答或文本生成，進入了創造、推理甚至自主行動的全新領域。

根據 Google 官方公告，Gemini 3 在多個基準測試中創下新紀錄，包括在 Humanity’s Last Exam 測驗中獲得 37.4 分的最高分，超越了先前 GPT-5 Pro 保持的 31.64 分紀錄。更令人印象深刻的是，Gemini 3 Deep Think 模式在該測驗中達到 41.0% 的準確率，展現了前所未有的推理能力。

在這篇文章中，我們將根據實際測試，分享五個 Gemini 3 最令人瞠目結舌、也最具影響力的超能力。準備好，你對 AI 的認知可能即將被顛覆。

五個 Gemini 3 顛覆想像的實測亮點

第一點：不只能寫程式，還能「一鍵生成」完整遊戲

在第一個測試中，測試者給了 Gemini 3 一個指令，要求它只用 HTML、CSS 和 JavaScript 打造一個類似《Minecraft》的 voxel 方塊世界。令人難以置信的是，它在一個指令下就完成了這項任務，而且完全沒有使用任何外部函式庫，從零開始生成了所有必要的程式碼。

遊戲不僅可以運行,玩家還能移動、放置和移除方塊。接著，測試者又讓它挑戰製作一個《Vampire Survivors》的複製版遊戲，它同樣一次成功。當回饋說遊戲速度太快時，它還能根據意見進行調整，重新平衡遊戲。

這標誌著 AI 從單純的「語法翻譯員」，進化為理解「設計意圖」的開發夥伴。這種能力被稱為「Vibe Coding」——透過自然語言指令讓 AI 執行編程任務，Gemini 3 在這方面的表現遠超預期。

「這完全是一次到位。它沒有使用任何外部函式庫，這太瘋狂了。測試者對此成果感到無比震撼。」

根據 TechCrunch 的報導，Google 同時推出了 Google Antigravity，一個專為代理式編程設計的開發平台，讓開發者能以更高層次、任務導向的方式進行開發。

第二點：從複雜論文到互動式動畫，化繁為簡的視覺化超能力

為了測試它對複雜資訊的理解與轉化能力，我們給了它一篇 AI 領域的經典論文《Attention is All You Need》，並要求它完成三項任務：

首先，為非技術背景的讀者總結核心概念
接著，將摘要寫成兩分鐘的 YouTube 影片腳本
最後，也是最驚豔的一步，設計並編寫一段獨立的 HTML/CSS/SVG 動畫，用視覺化的方式向初學者解釋論文中複雜的「注意力機制」

AI 不僅完美地完成了摘要和腳本，更創造出一個簡潔而深刻的互動式動畫，清晰地展示了語言模型如何透過「注意力」來理解詞語關聯。這項能力真正的突破在於「模態轉譯」（modality translation）——AI 將高度抽象的學術文字，流暢地轉譯成互動式的視覺語言。這種跨越不同溝通模式的轉化能力，正是高等智慧的標誌。

「這成果令我印象深刻。動畫本身看似簡單，但背後代表的意義非凡：AI 能夠消化一篇解釋複雜概念的 PDF，並將其轉化為一個徹底簡化概念的視覺化作品，這點實在太酷了。」

MIT Technology Review 指出，Gemini 3 引入了「生成式介面」（generative interfaces）功能，讓模型能夠自主選擇最適合提示的輸出格式，組裝視覺佈局和動態視圖，而不是僅僅回傳文字區塊。

第三點：超越指令的「創意推斷」，主動打造完整音樂體驗

接著，我們嘗試了一個更具創造性的指令：「創作一首完全原創的歌曲，並讓它能在瀏覽器中播放。」原本預期可能只會得到一段旋律或一些音符代碼，但 Gemini 3 的成果遠超想像。

它不僅創作了一首原創歌曲，還使用 tone.js 函式庫打造了一個完整的網頁播放器。這個播放器包含了：

客製化的音樂視覺化效果
精心設計的配色方案
播放/停止按鈕
完整的歌詞顯示

而這些，測試者從未在指令中要求過。這展現了 AI 預測「潛在使用者需求」的能力。它沒有停留在字面指令，而是洞察到使用者未明說的渴望——一個完整、豐富的體驗，從而邁出了從「指令執行者」到「創意協作者」的關鍵一步。

「測試者沒有要求它打造視覺化工具，也沒指定配色、按鈕，甚至沒提供歌詞。只給了一個指令：『創作一首原創歌曲，並讓它能在瀏覽器播放』。它卻交付了完整的體驗。」

這種超越指令的創意推斷能力，讓 Gemini 3 在與 Claude 3.7 Sonnet 和 ChatGPT-4.5 的競爭中脫穎而出。

第四點：不僅是回答，而是真正的多步驟「思考」與規劃

Gemini 3 在處理複雜邏輯時，展現了驚人的深度。在一個測試中，測試者要求它扮演營運規劃師，為四支 YouTube 影片安排未來十天的發布時程，過程中需要滿足多個模糊且互相牽制的真實世界限制。

它不僅成功規劃出完美的日程表，還清楚解釋了背後的權衡取捨，並提出替代方案——這已近似高階主管的策略思維，而非單純的計算。

在另一個困難的多門機率謎題中，它不僅算出了正確答案，更以視覺化的方式「展示其計算過程」，一步步呈現推理邏輯。這項能力至關重要，它代表 AI 的思考過程正從一個不透明的「黑盒子」轉變為一個可被審核、可被信任的透明夥伴，這是建立人機信任的基石。

根據 9to5Google 報導，Gemini 3 在推理方面達到了最先進的水準，具有「掌握深度和細微差別」的能力，可以「感知創意想法中的細微線索，或剝開困難問題的重疊層次」。

Google 也即將推出 Gemini 3 Deep Think 模式，這是一個增強推理模式，能進一步提升 Gemini 3 的效能。在 Humanity’s Last Exam 測驗中，Deep Think 達到 41.0% 的準確率（無工具輔助），在 GPQA Diamond 測驗中達到 93.8%，在 ARC-AGI 測驗中更達到前所未有的 45.1%（使用程式碼執行），展現了解決新穎挑戰的能力。

第五點：AI 助理的雛形，能為你動手辦事的「代理模式」

最令人興奮的功能之一，是全新的「代理模式」（Agent Mode）。在測試中給它的任務是：「預訂今晚在舊金山一家評價良好、有戶外座位的義大利餐廳。」

啟動後，Gemini 3 自主地在雲端開啟瀏覽器，導航到訂位網站 OpenTable，根據條件進行搜尋，並逐步完成訂位流程，全程透明可追溯。

這標誌著一個根本性的範式轉移：AI 正從一個「知識引擎」進化為一個「行動引擎」。它不再被侷限於對話的沙盒中，而是成為一個能使用我們所用的工具（瀏覽器、網站），在真實數位世界中為我們辦事的代理人。

CNBC 的報導指出，Google 同時發布了 Google Antigravity 平台，讓開發者能以「更高層次、任務導向」的方式進行編程。根據 Google Labs 和 Gemini 副總裁 Josh Woodward 的說法，Gemini 3 是 Google「有史以來最好的 vibe coding 模型」。

這種代理能力的突破，讓 Gemini 3 在 AI 發展史上佔據了重要地位，與 OpenAI 的 GPT-5 和 Anthropic 的 Claude 系列形成激烈競爭。

結論：我們正處於 AI 能力爆發的奇點

綜合以上測試，Gemini 3 帶來的感受已非「微幅進步」可以形容。從將學術理論轉譯為互動藝術，到自主導航網路完成現實任務，Gemini 3 展現了 AI 作為一個多模態、具備代理能力的合作夥伴的崛起。

Gemini 3 是什麼？它不僅僅是一個更強大的語言模型，而是代表了 AI 發展的新範式：

從回應指令到主動創造
從提供答案到執行任務
從文字輸出到多模態體驗
從工具到協作夥伴

我們正在見證一個 AI 能力的根本性轉變。它不再僅僅是處理人類的語言，而是開始執行人類的意圖。這不禁讓人深思：如果今天一個指令就能創造出一個遊戲，一年後，我們又將用 AI 創造出什麼樣的未來？

隨著 Gemini 3 Deep Think 即將推出給 AI Ultra 訂閱用戶，以及 Google Antigravity 平台的持續發展，可以預期 AI 輔助開發和自主代理將成為主流。這不僅會改變軟體開發的方式，更可能重塑人類與技術互動的整個模式。

對於想要深入了解 AI 技術發展的讀者，建議進一步閱讀 AI-Stack 關於 AI 發展趨勢、Vibe Coding 和 AI 代理的文章，以全面了解這個快速發展的領域。

參考資料：

延伸閱讀：