義守大學資訊工程學系教授兼系主任及所長陳啟彰

AIプラットフォームの選定において重視した3つの機能:ポータルサイト、リソース配分、料金計算

義守大學資訊工程學系教授兼系主任及所長陳啟彰說,去年上半年校方決定興建「AI 高效能運算實驗室」,除規劃購置 AI 超級電腦系統外,副校長沈季燕也主張務必建立統一入口網站暨管理系統,直言若缺乏此機制,恐難以實現資源的共享和計價,影響資源利用的有效性。

因此資工系在啟動專案時,便將超級電腦、AI 協作管理平台同時列入採購範圍。其中超級電腦部份,將目標鎖定於 DGX A100;至於 AI 平台,則歡迎各廠商擇優提案,但要求必須兼具入口網站、資源分配、計價等基本功能。

陳啟彰解釋,之所以鎖定 DGX A100,除看重它搭載最先進的 NVIDIA A100 GPU 外,亦看重其中的「MIG」(Multi-instance GPU)新功能,可將每張 GPU 分割成 7 個獨立執行個體、支援更多工作負載;如此一來,憑藉 DGX A100 單一基礎架構,即可同時滿足訓練、推論和分析需求,使義大無需額外斥資部署推論主機。

義大為驗證 DGX A100 的能耐,以「乳癌切片影像判斷」為測試題目,證實動用一顆 A100 GPU 之下,僅需 4 分鐘便完成模型訓練,相較過去透過 CPU 歷時逾 4 小時的訓練過程,速度提升 54 倍之多。此例一出,更強化資工系選購 DGX A100 的意向,也讓老師或醫生備感驚艷,體認到與其各自建置較低規格的資源、曠日費時完成研究案,不如善用校方 AI 實驗室的資源,以提升研究速度與品質。

在參與提案的廠商中,敦陽科技將 DGX A100、數位無限軟體 AI-Stack 平台同列為提案重點。經過資工系老師深入檢視,發現 AI-Stack 的入口網站、資源分配、計價三項功能皆堪稱齊全,反觀其他平台,普遍在計價功能上未盡到位,使得敦陽科技的提案雀屏中選,於去年底完成專案建置。

ウェブ操作による迅速なモデルトレーニング展開 

陳啟彰氏は、構築過程で大きな課題となったのはコンテナイメージであったと振り返ります。一部の学部で求められるイメージは複雑なパラメータを持ち、AI-Stackに設定する必要があり、容易ではありませんでした。しかし、INFINITIXの技術力と実行力により、義守大学はこの課題を克服することができました。 

たとえば、医療画像処理でよく使われるMATLABイメージには認証機能があり、AI-Stackで適切な設定を行わないと毎回のログイン時に認証が必要で使用体験が悪くなります。INFINITIXは認証コードをAI-Stackに書き込み、ログイン後に直接MATLAB環境へ入れるように改善しました。

AI-Stackは義守大学にさまざまな利点をもたらしました。まず、AIラボではAI-StackをUbuntu OSに構築しましたが、Linuxに不慣れな教師でもウェブインターフェースから数回クリックするだけで指定イメージを起動し、すぐに訓練作業に移行できました。これはAI-Stackの優れた隔離効果により、複雑なLinuxコマンドをユーザーから隠した結果です。 

次に、AIリソースが限られている中で多くの学術・産学研究を行うには公平なリソース分配が不可欠で、資源の無駄遣いを防ぐため、「金銭」と「時間」で利用効率を管理する必要があります。INFINITIXはこれに応えるため、AI-Stackを通じて時間単位の料金計算や、利用開始と終了時期を設定する申請制度を導入しました。これにより、リソースの独占や無駄が防止され、適切に管理できるようになりました。

また、AIラボは各ユーザーに100GBのストレージを提供しており、頻繁に使用するデータやモデルを保存できます。AI-Stackはストレージが限界に近づくと自動的に警告を出し、不要なデータをローカルに保存するよう促します。これによりリソースの無駄遣いが防止されます。

総じて、義守大学はAI-Stackを利用したリソースの調整・配分を通じて、AIリソースを最大限に有効活用し、教師や医師がより多くの学術・産学研究を行い、多くの論文を発表することを目指しています。また、学校や病院、企業でAIと深層学習の人材を育成するのにも貢献しています。