生成式AI的快速發展引發了對高效及可擴展AI資料中心的大量需求,同時也伴隨著一系列挑戰。

AI 資料中心業務挑戰

  • AI開發技術需求激增:生成式AI技術的普及,對於高性能計算資源和模型訓練的需求呈指數級增長,企業急需有效解決方案。
  • 缺乏統一的管理平台:許多算力中心採用多種不同的工具來管理不同的資源,缺乏統一的平台來協調和管理所有資源。這不僅增加了管理的複雜性,也降低了管理效率。
  • 多用戶環境下的資源衝突:在多用戶共用的算力中心環境下,不同用戶對資源需求往往不同,但資源需求期間經常重疊,若沒有完善的資源分配機制,容易產生資源衝突,影響用戶體驗。
  • 成本控制困難: 資料中心的運營成本高昂,包括硬體設備、電力、維護等。如何有效控制成本,提高資源利用率,是資料中心運營者所面臨的重要挑戰。

AI-Stack 解決方案

  • 統一平台管理: AI-Stack支援異構運算(Heterogeneous Computing), 透過一個統一的平台可以管理不同品牌和不同規格的GPU(NVIDIA & AMD),以及其他運算資源。管理者可以對所有資源進行統一的監控、調度和配置。
  • 彈性分配資源: 根據不同的應用場景和用戶需求,對GPU資源進行彈性分配。平台會根據任務的優先級、資源需求等因素,自動分配最適合的資源,提高資源利用率。
  • 多用戶管理: 提供完善多用戶管理功能,管理者可為不同的用戶設定不同的訪問權限和配額,確保資源的公平分配。
  • 視覺化管理介面: 提供直觀的圖形化界面,讓管理者可以透過儀錶板輕鬆地監控系統的運行狀態,並對資源進行管理。
  • 成本優化: 可精確地追踪和分析資源的使用情況,幫助管理者了解成本花費,降低運營成本。
AI-Stack資料中心解決方案架構圖

AI-Stack不僅能幫助AI資料中心克服運營與管理挑戰,更能通過集中化管理與高效資源配置,讓資料中心在運行效率、成本管理及穩定性上全面提升,為企業的AI應用提供強有力的支持。

台灣數發部成功案例分享

數位無限INFINITIX與台灣數位發展部合作「數位產業跨域軟體基盤計數位服務躍升計畫」,此專案計畫是數位發展部的重要里程碑,旨在為台灣新創企業提供高效穩定的AI運算資源支持。

透過AI-Stack GPU管理平台,打造全台首個支持跨品牌GPU整合(NVIDIA & AMD)的算力管理平台,為新創企業提供靈活高效的AI算力支持。該平台以虛擬化技術、分散式訓練及自動化資源分配功能,實現算力資源的最佳化配置,有效縮短AI模型開發週期,並促進台灣數位產業升級與新創技術落地。

此專案成功展現公私協作模式對推動數位經濟的巨大潛力,為台灣奠定全球數位經濟布局的堅實基礎。了解詳細案例: https://ai-stack.ai/zh-hant/moda-infinitix-data-center