omniture

하바나랩스, 가우디 AI 학습 프로세서 발표

Habana Labs, Ltd.
2019-06-17 22:00 1,298

가우디는 기록적인 성능과 확장을 위한 이더넷의 태생적 통합을 구현  

텔아비브, 이스라엘과 새너제이, 캘리포니아주, 2019년 6월 17일 /PRNewswire/ -- 선도적인 AI 프로세서 개발사 하바나랩스[Habana Labs, Ltd. (www.habana.ai)]는 하바나 가우디(Gaudi™) AI 학습 프로세서를 오늘 발표했다. 가우디 프로세서 기반의 학습 시스템은 같은 수의 GPU가 탑재된 시스템에 비해 최대 네 배까지 늘어난 스루풋을 구현한다.

Habana GAUDI HLS-1 AI Training System with Heatsink
Habana GAUDI HLS-1 AI Training System with Heatsink

가우디의 혁신적인 아키텍처는 높은 스루풋이 더 작은 배치 사이즈에서도 유지되므로 학습 시스템 성능의 엄청난 확장이 가능하기 때문에 하나의 기기에서부터 가우디 프로세서 수백 개가 탑재된 대형 시스템에 이르기까지 가우디 기반 시스템의 성능 확장을 실현한다.

가우디는 기록적인 성능 외에도 AI 학습 분야에서 또 다른 업계 최초를 갖고 있다. 즉, AI 표준 이더넷을 사용하여 프로세서 내에서 모든 규모의 AI 시스템 확장이 가능한 RDMA오버컨버즈드이더넷 온칩 통합(RoCE v2) 기능이 그것이다. 이제 하바나랩스의 고객들은 가우디를 사용하여 AI 학습 시스템의 스케일링업과 스케일링아웃을 위해 표준 이더넷 스위치을 구동할 수 있다. 이더넷 스위치들은 멀티소스로서 속도와 포트 수에 있어서 사실상 무제한 확장이 가능하며 이미 데이터센터에서 컴퓨팅 및 스토리지 시스템 확장을 위해 사용되고 있다. GPU 기반 시스템들은 하바나의 표준 기반 시스템과는 대조적으로 시스템 설계자들의 선택과 확장성을 태생적으로 제한하는 전용 시스템 인터페이스를 사용한다.

린리그룹의 주임 애널리스트인 린리 그웨냅은 "하바나는 동사의 신제품을 통해 사업을 추론에서부터 학습으로 빠르게 확대함으로써 신경망의 전체 기능을 다루고 있다"면서 "가우디는 AI 학습 분야 액셀러레이터들 사이에서 업계 최고의 전력 효율과 강력한 성능을 구현한다. 가우디는 RoCE 지원 기능을 통해 100G 이더넷 링크들을 통합하는 최초의 AI 프로세서로서 업계 표준 컴퍼넌트를 사용하여 구축된 대규모의 액셀러레이터 클러스터를 구현한다"고 말했다.

가우디 프로세서에는 32GB 급 HBM-2 메모리가 포함되며 현재 두 개의 형태가 가능하다:

  • HL-200 – 100Gb 이더넷 8개 포트를 지원하는 PCIe 카드;
  • HL-205 – OCP-OAM 사양에 부합되는 메자닌 카드로서 100Gb 이더넷 10개 포트 혹은 50Gb 이더넷 20개 포트를 지원.

또한 하바나는 HLS-1라고 명명된 8-가우디 시스템을 출시할 예정인데 이 시스템 안에는 8개의 HL-205 메자닌 카드, 외부의 호스트를 연결해주는 PCIe 커넥터들과 규격품 이더넷 스위치를 연결할 수 있는 24개의 100Gbps 이더넷 포트가 내장되며, 복수의 HLS-1 시스템을 추가함으로써 표준 19" 랙에서 스케일링업이 가능하다.

가우디는 하바나랩스가 런칭할 두 번째의 목적 지향 AI 프로세서로서 작년도의 하바나 고야(Goya™) AI 추론 프로세서의 후속 제품이다. 고야는 2018년 4분기부터 출하되고 있으며 업계 최고의 스루풋, 최고의 전력 효율(1와트가 처리하는 초당 이미지수)과 실시간 레이턴시를 통해 업계 최고의 추론 성능을 보여왔다.

데이비드 다한 하바나랩스 CEO는 "학습 AI 모델들은 매년 엄청나게 높아지는 컴퓨팅 성능이 필요하기 때문에 데이터센터와 클라우드가 생산성 및 확장성을 신속하게 개선해야 할 긴급한 니즈에 대처하는 것이 필수적이다. 하바나는 가우디의 혁신적인 아키텍처를 통해 업계 최고의 성능을 구현하는 동시에 표준 기반의 이더넷 연결망을 통합하고 무제한의 확장을 실현한다"면서 "가우디는 AI 학습 프로세서 지형의 현상을 타파한다"고 말했다.

페이스북의 기술 및 전략 담당 디렉터 비제이 라오는 "페이스북은 우리 업계가 한 데 모일 수 있는 혁신을 위한 개방 플랫폼을 제공하기 위해 노력하고 있다"면서 "하바나 고야 AI 추론 프로세서가 글로우 머신러닝 컴파일러를 위해 백엔드를 실행하고 오픈소싱했으며 하나바 가우디 AI 학습 프로세서가 OCP 액셀러레이터 모듈(OAM) 사양을 지원하게 되어 기쁘다"라고 말했다.

가우디 프로세서는 완벽하게 프로그램 가능하고 커스터마이즈할 수 있으며 2세대 텐서 프로세싱 코어(TPC™) 클러스터와 개발 툴, 라이브러리 그리고 컴파일러를 갖추고 있는데 이 모든 것들이 합쳐져서 종합적이며 유연한 술루션을 제공한다. 하바나랩스 시냅스AI(SynapseAI™) 소프트웨어 스택은 풍부한 핵심 라이브러리와 고객들이 그들 전용의 핵심 라이브러리를 추가할 수 있는 개방 툴체인으로 구성되어 있다.

하바나는 2019년 하반기에 가우디 플랫폼 샘플을 일부 선정된 고객들에게 제공할 예정이다. 가우디 AI 학습 및 고야 AI 추론 프로세서에 대한 상세 정보가 필요할 경우 www.habana.ai를 방문하기 바란다.  

하바나랩스

하바나랩스는 학습 중추 신경망과 생산 현장에 설치되는 추론 장비에 최적화된 프로세서 플랫폼을 근본에서부터 개발하기 위해 2016년에 설립된 AI 프로세서 회사이다. 당사는 프로세싱 성능, 확장성, 비용과 전력 소모 면에서 엄청난 개선을 제공하는 플랫폼을 통해 AI의 진정한 가능성을 열고 있다. 하바나는 이스라엘 텔아비브, 캘리포니아주 새너제이, 중국 베이징과 폴란드 그단스크에 소재하며 전세계에 150 명의 직원이 있다.

상세 정보가 필요할 경우 www.habana.ai 를 방문하거나 pr@habana.ai으로 연락하기 바란다.

Habana GAUDI HL-205 OCP-OAM Compliant AI Processor
Habana GAUDI HL-205 OCP-OAM Compliant AI Processor

Habana GAUDI HLS-1 AI Training System
Habana GAUDI HLS-1 AI Training System

사진 - https://mma.prnewswire.com/media/903245/HLS_1_with_heatsink_small.jpg 
사진 - https://mma.prnewswire.com/media/903246/HL_205_small.jpg 
사진 - https://mma.prnewswire.com/media/903247/HLS_1_Open_Overhead_View_smaller.jpg 
로고 - https://mma.prnewswire.com/media/744578/Habana_Labs_Ltd___Logo.jpg

출처: Habana Labs, Ltd.
관련 링크: