GMI Cloud, NVIDIA Vera Rubin과 함께 차세대 AI 팩토리 시대 지원

日本語

GMI Cloud

2026-06-19 10:00 322

타이베이, 2026년 6월 19일 /PRNewswire/ -- 프로덕션 AI를 위해 설계된 AI 네이티브 클라우드 인프라 기업 GMI Cloud는 오늘 NVIDIA GTC Taipei 2026에서 공개된 NVIDIA Vera Rubin 플랫폼의 비전에 발맞춰 차세대 에이전틱(Agentic) AI 팩토리를 지원한다고 발표했다.

AI 워크로드가 단일 모델 기반 프롬프트에서 멀티모달•장기 실행•자율형 시스템으로 진화함에 따라, 기업과 개발자는 실시간 추론, 안전한 오케스트레이션, 고처리량 추론, 그리고 대규모 AI 운영을 지원할 수 있는 새로운 인프라를 필요로 하고 있다.

GMI Cloud는 AI 개발자와 기업이 모델 개발부터 애플리케이션 운영에 이르는 전 과정에서 성능, 유연성, 보안을 확보하며 AI 워크로드를 배포•확장•운영할 수 있도록 지원하는 추론 중심(Inference-Native) 클라우드 플랫폼을 구축하고 있다. AI는 이제 단순한 대화형 인터페이스를 넘어 추론하고, 행동하며, 복잡한 워크플로를 조율하고, 멀티모달 컨텍스트로부터 지속적으로 학습하는 지능형 운영 계층으로 발전하고 있다.

이러한 차세대 AI 워크로드는 실시간으로 고성능 지능형 서비스를 대규모로 제공할 수 있는 새로운 수준의 인프라를 요구한다. 여기에는 인터랙티브 애플리케이션을 위한 고처리량•저지연 추론, 텍스트•이미지•비디오•오디오 및 에이전틱 워크플로 전반에 걸친 멀티모달 모델의 원활한 배포, 장문 컨텍스트 추론(Long-Context Reasoning), 메모리 관리 및 오케스트레이션 기능이 포함된다.

또한 기업 환경에서는 안전한 멀티테넌트 환경, 지속적으로 운영되는 AI 시스템을 위한 동적 확장성, 그리고 토큰 비용을 절감하면서 리소스 활용도와 운영 효율성을 극대화하는 최적화된 인프라 오케스트레이션이 필수적으로 요구된다.

이러한 이유로 GMI Cloud는 대규모 추론, 에이전틱 워크로드, 프로덕션 AI 배포를 위해 설계된 NVIDIA의 엔드투엔드 풀스택 AI 팩토리 플랫폼을 채택했다.

GMI Cloud 플랫폼 주요 구성

AI 학습, 추론 및 프로덕션 배포를 위한 고성능 AI 인프라
최적화된 저지연 모델 서빙을 위한 고성능 추론 플랫폼
상용 모델과 오픈소스 모델에 통합적으로 접근할 수 있는 MaaS(Model-as-a-Service) API
엔터프라이즈급 프로덕션 추론을 위한 전용 엔드포인트
대규모 AI 운영을 위한 AI 인프라 오케스트레이션 및 최적화 계층
샌드박스 환경에서 도구를 활용하는 자율형 AI 시스템을 위한 에이전틱 워크플로 인프라
차세대 AI 애플리케이션을 위한 멀티모달 네이티브 배포 환경

GMI Cloud의 창립자 겸 CEO인 Alex Yeh는 다음과 같이 말했다.
"GMI Cloud는 최적화된 컴퓨트 오케스트레이션, 프로덕션 추론 서비스, 그리고 개발자 친화적인 API를 결합함으로써 개발자들이 프로토타입에서 프로덕션 환경으로 더욱 빠르게 전환할 수 있도록 지원합니다. 동시에 실제 AI 시스템 운영에 필요한 성능과 안정성을 제공합니다."

그는 이어 다음과 같이 덧붙였다.
"AI 팩토리가 기업의 독점 데이터, 규제 대상 콘텐츠, 모델 컨텍스트, 그리고 AI 에이전트의 메모리를 처리하는 비중이 증가함에 따라 보안은 AI 인프라 스택의 핵심 계층으로 자리잡고 있습니다."

GMI Cloud는 안전하고 고성능인 AI 팩토리를 구현하려는 NVIDIA의 비전에 맞춰, 모델과 데이터 모두에 대한 보안 및 프라이버시 보호가 요구되는 차세대 AI 워크로드를 지원하기 위해 NVIDIA Confidential Computing을 도입하고 있다. 이를 통해 신뢰 실행 환경(Trusted Execution Environment, TEE)을 제공하며 기업 고객의 보안 요구사항을 충족한다.

기업의 AI 활용이 내부 파일럿 프로젝트를 넘어 프로덕션급 시스템으로 확대됨에 따라, 안전한 인프라는 AI의 광범위한 도입과 활용을 가능하게 하는 핵심 기반이 될 것으로 전망된다.

NVIDIA AI Factory 에코시스템과의 협력 강화

NVIDIA Vera Rubin은 차세대 컴퓨팅, 네트워킹, 보안, 랙 스케일 시스템 설계를 통합하여 에이전틱 AI의 요구사항을 지원하는 AI 팩토리 인프라 진화의 중요한 이정표다.

Alex Yeh는 다음과 같이 말했다.
"GMI Cloud는 NVIDIA 에코시스템과의 협력을 지속적으로 확대하고 있습니다. 이는 공급자와 고객 모두에게 뛰어난 경제성을 제공하기 때문입니다. 높은 전력 효율(Compute per Watt), 낮은 토큰 비용, 강력한 수요 기반, 그리고 긴 인프라 수명주기가 그 이유입니다."

그는 이어 다음과 같이 강조했다.
"GMI Cloud와 NVIDIA는 멀티모달 추론, 모델 API, 전용 엔드포인트, 그리고 에이전틱 AI 인프라에 이르기까지 개발자와 기업이 첨단 AI 워크로드를 전 세계에 배포할 수 있도록 지원할 것입니다."

GMI Cloud의 AI 네이티브 인프라 및 프로덕션 AI 플랫폼에 대한 자세한 내용은 GMI Cloud(https://www.gmicloud.ai)공식 웹사이트를 참조하면 된다.

GMI Cloud 소개

GMI Cloud는 차세대 AI 애플리케이션을 지원하는 AI 네이티브 클라우드 인프라 기업이다. 고성능 GPU 인프라, Model-as-a-Service(MaaS), 전용 엔드포인트, AI 워크로드 배포 솔루션을 제공하며, 프로덕션 AI 시스템을 구축하는 개발자와 기업을 지원하고 있다. 또한 확장 가능한 컴퓨팅 리소스, 유연한 인프라, 그리고 현대적인 AI 개발자를 위한 생태계를 기반으로 고객이 실험 단계에서 프로덕션 환경으로 원활하게 전환할 수 있도록 지원한다. 자세한 내용은 GMI Cloud 공식 웹사이트(gmicloud.ai/)에서 확인할 수 있다.

출처: GMI Cloud

키워드: 컴퓨터/전자제품 반도체 인공지능 클라우드컴퓨팅/사물인터넷