HPE, AMD Helios 기반 72-GPU 랙 출시 예정: 2026년 AI 성능 혁신 예고
HPE(Hewlett Packard Enterprise)가 AMD의 차세대 인스팅트 MI455X 가속기를 탑재한 72-GPU 랙을 2026년부터 전 세계에 출시할 계획을 발표했습니다. 이는 AMD의 Helios 랙 스케일 AI 아키텍처가 HPE 제품 라인업에 통합되는 것을 의미하며, 엑사스케일 수준의 AI 성능을 제공하는 중요한 발걸음입니다.
AMD Helios와 HPE의 협력
이번 협력은 Helios에게 첫 번째 주요 OEM 파트너를 제공하며, HPE는 AMD의 차세대 인스팅트 MI455X 가속기를 기반으로 구축된 완전한 72-GPU AI 랙을 출시할 수 있게 되었습니다. 이 랙은 AMD EPYC Venice CPU와 함께 Broadcom이 개발한 이더넷 기반 스케일 업 패브릭을 사용합니다. Helios 아키텍처는 액체 냉각 및 더블 와이드 섀시를 활용하여 열 관리를 효율적으로 수행합니다.
Helios 랙 레이아웃 및 성능 목표
Helios 레퍼런스 디자인은 Meta의 Open Rack Wide 표준을 기반으로 합니다. 더블 와이드 액체 냉각 섀시를 사용하여 MI450 시리즈 GPU, Venice CPU 및 Pensando 네트워킹 하드웨어를 수용합니다. AMD는 MI455X 세대를 통해 랙당 최대 2.9 엑사플롭스의 FP4 컴퓨팅 성능과 31TB의 HBM4 메모리를 목표로 하고 있습니다.
단일 포드 구조와 고대역폭 GPU 상호 연결
이 시스템은 모든 GPU를 단일 포드의 일부로 제공하여 워크로드가 로컬 병목 현상 없이 모든 가속기에 걸쳐 확장될 수 있도록 합니다. 이더넷을 통한 울트라 가속기 링크를 지원하는 HPE Juniper 스위치는 고대역폭 GPU 상호 연결을 형성하며, 엔비디아의 NVLink 중심 접근 방식에 대한 대안을 제시합니다.
고성능 컴퓨팅 센터 슈투트가르트의 헤르더 시스템
고성능 컴퓨팅 센터 슈투트가르트는 차세대 플래그십 시스템인 헤르더(Herder)에 HPE의 Cray GX5000 플랫폼을 선택했습니다. 헤르더는 직접 액체 냉각 블레이드를 통해 MI430X GPU와 Venice CPU를 사용하며, 2027년에 현재의 헌터(Hunter) 시스템을 대체할 예정입니다. HPE는 GX5000 랙의 폐열이 캠퍼스 건물을 난방하는 데 사용될 것이라고 밝혔습니다.
글로벌 출시 및 접근성 확대
AMD와 HPE는 내년부터 Helios 기반 시스템을 전 세계적으로 출시하여 연구 기관과 기업의 랙 스케일 AI 하드웨어에 대한 접근성을 확대할 계획입니다. Helios는 엔비디아의 NVLink 접근 방식과 대조적으로 이더넷 패브릭을 사용하여 GPU와 CPU를 연결합니다. 이더넷을 통한 울트라 가속기 링크와 울트라 이더넷 컨소시엄에 맞춘 하드웨어의 사용은 개방형 표준 프레임워크 내에서 스케일 아웃 설계를 지원합니다.
잠재적인 성능 제약 및 고려 사항
이러한 접근 방식은 이론적으로 다른 하이엔드 AI 랙과 비슷한 GPU 수를 허용하지만, 지속적인 다중 노드 워크로드에서 성능은 아직 테스트되지 않았습니다. 단일 이더넷 레이어에 대한 의존은 실제 애플리케이션에서 대기 시간 또는 대역폭 제약을 초래할 수 있습니다. 이러한 사양은 실제 성능을 예측하지 않으며, 효과적인 냉각, 네트워크 트래픽 처리 및 소프트웨어 최적화에 따라 달라질 것입니다.
결론
HPE와 AMD의 협력은 엑사스케일 AI 시대의 도래를 알리는 중요한 전환점입니다. Helios 기반 시스템은 AI 연구 및 개발의 새로운 가능성을 열어줄 뿐만 아니라, 지속 가능한 컴퓨팅 환경을 조성하는 데에도 기여할 것으로 기대됩니다. 실제 성능은 추가적인 테스트와 최적화를 통해 입증될 것이며, 앞으로의 발전이 주목됩니다.