AI 추론 시대 개막: 레노버의 CES 2024와 AI 투자 패러다임 변화
AI, 학습에서 추론으로: 투자 패러다임의 전환
지난해까지 AI 투자는 거대 AI 모델 학습에 집중되었습니다. 하지만 2024년 CES에서는 AI 추론이 핵심 주제로 떠올랐습니다. 추론은 AI 모델이 학습된 정보를 바탕으로 새로운 데이터를 처리하는 단계입니다. 레노버 CEO 양위안칭은 AI 투자 비율이 학습 80%, 추론 20%에서, 앞으로는 추론 80%, 학습 20%로 역전될 것이라고 전망했습니다. 이는 레노버가 새로운 추론 서버 3종을 공개한 배경이기도 합니다. 딜로이트 역시 2025년 AI 컴퓨팅의 절반, 2026년에는 3분의 2가 추론 워크로드가 될 것이라고 예측했습니다.
추론 투자, 점진적인 확장
레노버 인프라 솔루션 그룹 수석 부사장 애슐리 고라크푸르왈라는 실제 인프라 지출은 다소 더디게 진행된다고 설명했습니다. AI 모델 학습에는 대규모 초기 투자가 필요하지만, 챗봇과 같은 AI 서비스 도입은 소규모로 시작해 점진적으로 확장되기 때문입니다. 하지만 퓨처럼 그룹은 2026년에는 추론 워크로드가 학습 관련 매출을 넘어설 것이라고 전망하며, 지출 측면에서도 추론으로의 전환점이 될 것이라고 분석했습니다.
레노버의 새로운 추론 서버 3종
레노버는 CES 2024에서 3종의 새로운 추론 서버를 공개하며 AI 추론 시장을 선도하겠다는 의지를 밝혔습니다. 레노버 씽크시스템 SR675i는 대형 언어 모델 구동에 최적화되었고, SR650i는 확장성과 배포 편의성을 강조했습니다. 씽크엣지 SE455i는 소매, 통신, 산업 환경을 위한 소형 서버입니다. 레노버는 2025년 3월 엣지 AI용 보급형 추론 서버를 출시한 바 있으며, AI 워크로드를 처리할 수 있는 다양한 서버를 제공해왔습니다.
기업이 자체 추론 서버를 도입하는 이유
레노버 솔루션 및 서비스 그룹 수석 부사장 아서 후는 기업이 자체 추론 서버를 도입하는 이유로 클라우드 컴퓨팅 활용 전략 변화, 데이터 생성 지점에서의 활용 필요성, 개인정보 보호 및 보안 우려를 꼽았습니다. 퍼블릭 클라우드는 초기 실험 단계에 유용하지만, 워크로드 규모가 명확해지면 자체 서버를 구축하는 것이 비용 효율적입니다. 또한 엣지 AI 서버는 데이터를 즉시 처리하고 폐기하여 저장 부담을 줄여줍니다. 데이터 통제 및 거버넌스를 중요하게 생각하는 기업에게는 자체 추론 환경이 필수적입니다.
경쟁 심화되는 AI 추론 서버 시장
CES 2024에서는 레노버 외에도 AMD가 기업용 온프레미스 추론을 위한 GPU를 공개했습니다. 델과 HPE 역시 지난해 새로운 추론 서버를 출시하며 시장 경쟁에 참여했습니다. 델은 공랭식/수랭식 파워엣지 XE9780 서버를, HPE는 최대 16개의 GPU를 지원하는 프로라이언트 컴퓨트 DL380a 12세대를 선보였습니다. 기업의 추론 수요가 빠르게 증가함에 따라, 앞으로도 주요 업체의 추가 발표가 이어질 것으로 예상됩니다.
결론
AI 투자의 중심축이 학습에서 추론으로 이동하고 있습니다. 레노버를 비롯한 주요 기업들은 고성능 추론 서버를 출시하며 시장 경쟁에 뛰어들었습니다. 기업들은 클라우드 비용 절감, 데이터 보안 강화, 엣지 컴퓨팅 활용 등의 이유로 자체 추론 인프라 구축에 적극적으로 나서고 있습니다. AI 추론 시장은 앞으로 더욱 뜨거워질 전망입니다.