블로그 - Infinitix 인피니틱스 소프트웨어 주식회사

블로그

AI Stack 최신 글

Blog & News

초경 드릴 비트, 스터드 밀링 커터 및 금속 가공 장비 제조업체 -- Union Tool은 전자 회로 기판에 부품을 고정하고 배선을 위한 미세 구멍을 뚫는 데 사용되는 ‘PCB 드릴 비트’ 분야의 글로벌 선도 기업입니다. 전 세계 반도체 선도 기업들이 생산하는 고집적도 CPU, GPU 등의 부품이 정상 작동하기 전에, Union Tool이 제조한 드릴로 뚫은 이러한 '공'은 필수적인 핵심 요소입니다.

성공 사례

AI-Stack 도입으로 가오이는 단일 플랫폼에서 컴퓨팅 자원을 유연하게 할당할 수 있게 되었습니다. 응급실 AI, 병리 AI, 간호 AI 스마트 어시스턴트부터 병원 간 데이터베이스 분석(당뇨병, 신장병 등)에 이르기까지 실시간으로 안정적인 컴퓨팅 지원이 가능합니다. 또한 AI-Stack의 컴퓨팅 자원 스케줄링 능력은 가오이 AI 개발팀의 모델 개발 효율을 높였으며, AI-Stack이 제공하는 MLOps 기능은 가오이 AI 주치의 제도 운영을 지원하여 잠재력 있는 젊은 의사들이 AI 모델 연구 개발에 집중할 수 있게 하고, 이를 가오이 KMU Genie 플랫폼에 신속히 적용하여 스마트 병원의 임상적 회복탄력성을 강화했습니다.
초경 드릴 비트, 스터드 밀링 커터 및 금속 가공 장비 제조업체 -- Union Tool은 전자 회로 기판에 부품을 고정하고 배선을 위한 미세 구멍을 뚫는 데 사용되는 ‘PCB 드릴 비트’ 분야의 글로벌 선도 기업입니다. 전 세계 반도체 선도 기업들이 생산하는 고집적도 CPU, GPU 등의 부품이 정상 작동하기 전에, Union Tool이 제조한 드릴로 뚫은 이러한 '공'은 필수적인 핵심 요소입니다.
디지털 발전부는 인피니틱스와 협력하여 대만 AI 컴퓨팅 자원 공유 플랫폼 구축에 성공했습니다. ‘AI-Stack’ 플랫폼을 통해 스타트업은 유연하고 효율적인 GPU 컴퓨팅 자원을 활용하여 AI 애플리케이션의 상용화를 가속화할 수 있습니다. 이 플랫폼은 다양한 브랜드의 GPU 통합을 지원하며 다수의 오픈소스 도구를 갖추고 있어 대만 디지털 산업의 업그레이드를 위한 견고한 기반을 마련했습니다.

솔루션

AI와 딥러닝이 기업의 핵심 경쟁력이 된 시대에, AI 소프트웨어 성능의 발휘는 안정적이고 효율적인 컴퓨팅 리소스 지원에 달려 있습니다. 전통적인 서버 아키텍처와 배포 모델은 현재 AI 모델 훈련 및 추론에 필요한 막대한 컴퓨팅 파워와 유연한 리소스 조정 요구를 충족시키지 못하고 있습니다. INFINITIX가 구축한 AI-Stack 플랫폼은 바로 이러한 과제를 해결하기 위해 전방위적이고 모듈화되며 확장 가능한 AI
생성형 AI의 급속한 발전은 효율적이고 확장 가능한 AI 데이터 센터에 대한 막대한 수요를 촉발시켰으며, 동시에 일련의 도전 과제도 동반하고 있습니다. AI-Stack은 AI 데이터 센터가 운영 및 관리상의 어려움을 극복하도록 지원할 뿐만 아니라, 중앙 집중식 관리와 효율적인 자원 배분을 통해 데이터 센터의 운영 효율성, 비용 관리 및 안정성을 전반적으로 향상시켜 기업의 AI 애플리케이션에 강력한 지원을 제공합니다.
AI-Stack 스마트 제조 솔루션은 제조업의 디지털 전환을 위해 설계되었으며, 지연, 데이터 보안, 통합 유연성 등 핵심 과제를 해결합니다. 엣지 컴퓨팅과 디지털 트윈 기술을 결합하여 빠른 모델 훈련, 실시간 추론 및 데이터 처리를 실현함으로써 생산 효율성을 높이고 비용을 절감합니다. * 모델 배포 및 애플리케이션 적용 가속화로 AI 개발 주기 단축 * 에지 장비의 실시간 생산 파라미터 최적화로 불량률 감소 * 인프라 비용 절감으로 기업의 지속 가능한 발전 지원 * 데이터 보안성 및 시스템 신뢰성 향상 AI-Stack 모듈형 아키텍처는 멀티 클라우드 환경 운영을 지원하며 다양한 시나리오 요구에 대응하여 제조업의 스마트화 업그레이드 및 고효율 운영 목표 달성을 돕습니다.

주요 이야기

OpenClaw(구 Moltbot) 완전 분석: GitHub 역사상 가장 빠르게 14.5만 스타를 달성한 AI 에이전트가 1,600만 달러 (+규모의) 암호화폐 사기, CVE 취약점 노출, (+그리고) Cloudflare 주가 14~20% 급등을 일으킨 (초래한) 전말.
CES 2026이 막을 내렸고, 올해의 주제는 그 어느 때보다 명확했습니다: Physical AI(물리적 AI). 엔비디아 CEO 젠슨 황은 개막 연설에서 이를 '지난 50년간 가장 중요한 기술'이라고 선언했으며, 전시장에는 보행 로봇부터 빨래를 하는 로봇 팔까지 이 주장을 입증하는 듯했습니다.
NVIDIA CES 2026 발표가 화려하게 막을 올렸습니다.! Alpamayo 이중 AI 자율주행 기술, 지멘스와의 협업으로 탄생한 AI 공장 설계, 그리고 Vera Rubin 슈퍼컴퓨터의 혁신적인 냉각 아키텍처를 심층 분석합니다.

기술 지원

탄력적 분산 훈련(Elastic Distributed Training)은 AI 모델 훈련에서 효율성과 유연성을 높이기 위해 사용되는 기술입니다. 간단히 말해, 모델 훈련이 단일 머신이나 고정된 수의 컨테이너에 국한되지 않고 수요에 따라 가용한 컴퓨팅 자원을 동적으로 조정하고 활용할 수 있게 합니다. 인피니틱스는 탄력적 분산 훈련을 AI-Stack에 원활하게 통합하여 Horovod, DeepSpeed, Megatron-LM, Slurm 등 주요 프레임워크를 지원함으로써 기업의 자원 스케줄링 병목 현상을 효과적으로 해소하고 대규모 AI 모델 훈련을 가속합니다. 본 글에서는 AI-Stack에서 Horovod를 활용해 탄력적 분산 훈련을 수행하는 방법을 단계별로 시연해 드리겠습니다! Horovod와 DeepSpeed의 운영 단계가 유사하므로, 본 글에서는 Horovod를 예시로 사용합니다. 주의할 점은 사용 전 【공용 이미지 목록】에 DeepSpeed 및 Horovod 프레임워크 실행에 적합한 이미지가…

Kubeflow는 Kubernetes를 기반으로 구축된 오픈소스 플랫폼으로, 데이터 준비, 모델 훈련, 하이퍼파라미터 튜닝, 모델 배포 및 모니터링 등 각 단계를 포괄하는 표준화되고 통합된 도구 세트를 제공함으로써 AI 모델의 실제 적용 과정을 크게 간소화합니다. 현재 많은 데이터 과학자와 머신러닝 엔지니어가 자주 사용하는 플랫폼으로 자리 잡았습니다. 그러나 많은 개발자가 Kubeflow 사용 시 GPU 리소스 분할이 불가능한 문제를 겪습니다. 플랫폼 특성상 단일 컨테이너가 전체 GPU 리소스를 점유하기 때문에, 프로젝트에 필요한 리소스가 적을 경우 일부 GPU 컴퓨팅 자원이 유휴 상태로 방치되어 효율적으로 활용되지 못합니다. 본 글에서는 인피니틱스의 ixGPU 모듈을 활용해 Kubeflow에서 GPU 분할을 구현하는 방법을 단계별로 안내합니다. Kubeflow 플랫폼에서 ixGPU 모듈을 활용한 GPU 탄력적 분할…

Kubeflow의 보급과 과제: 단일 GPU 활용률 병목 현상 Kubeflow는 Kubernetes 기반의 오픈소스 머신러닝 플랫폼으로, 최근 머신러닝 분야에서 점차 보편화되고 있습니다. 개발자가 확장 가능한 머신러닝 워크로드를 쉽게 구축, 배포 및 관리할 수 있도록 지원하며, 완전한 머신러닝 파이프라인 관리, 분산 훈련 및 하이퍼파라미터 튜닝 등의 장점을 제공합니다. 그러나 Kubeflow가 널리 사용되고 있음에도 불구하고 실제 적용 시 한 가지 문제점이 존재합니다: GPU를 분할할 수 없다는 점입니다. 이로 인해 귀중한 컴퓨팅 자원이 효율적으로 활용되지 못해 많은 머신러닝 개발자들의 고민거리가 되고 있습니다. 하나의 GPU가 단일 작업에 독점적으로 할당될 경우, 실제 작업의 자원 요구량과 무관하게 자원이 유휴 상태로 남아 전체 개발 효율성과 비용 효율성에 부정적인 영향을…

AI-Stack 적용 사례에 대해 더 알아보고 싶다면