화웨이 칩으로 AI 자립 성공, Zhipu AI

Share

중국 Zhipu AI, 화웨이 칩으로 이미지 생성 모델 학습 성공: 서구 기술 제재 속 자립 가능성 입증

미국의 제재 속에서 중국 기업 Zhipu AI가 화웨이 프로세서만을 사용하여 이미지 생성 모델을 훈련하는 데 성공했습니다. 이는 중국 기업들이 첨단 서구 칩에 대한 접근 없이도 경쟁력 있는 AI 시스템을 구축할 수 있음을 보여주는 중요한 사례입니다. 이번 성과는 단순한 기술적 진보를 넘어, 미국의 기술 제재에 맞서 자립적인 AI 생태계를 구축하려는 중국의 노력을 상징합니다.

Zhipu AI, 화웨이 칩 기반 GLM-Image 공개

Zhipu AI는 화웨이의 Ascend Atlas 800T A2 장치와 MindSpore AI 프레임워크를 사용하여 이미지 생성 모델 GLM-Image를 훈련했습니다. 데이터 전처리부터 대규모 훈련에 이르는 전체 과정을 서구 하드웨어에 의존하지 않고 완료했다는 점에서 의미가 큽니다. 이 모델은 0.1위안(약 14원)의 비용으로 API를 통해 사용할 수 있으며, 모델 가중치는 GitHub, Hugging Face, ModelScope Community에서 독립적으로 배포할 수 있도록 공개되었습니다.

미국의 제재와 화웨이 칩의 부상

미국 상무부는 작년 Zhipu AI를 중국 군과의 연관성을 이유로 제재 목록에 추가했습니다. 이로 인해 Zhipu AI는 Nvidia의 H100 및 A100 GPU 사용이 제한되었고, 이는 중국 기업들이 자국 칩 아키텍처를 기반으로 대안을 개발하도록 촉진했습니다. 화웨이의 Ascend 프로세서는 Nvidia 하드웨어 구매가 제한된 중국 AI 기업들에게 주요 대안으로 떠올랐습니다.

GLM-Image의 기술적 특징 및 성능

GLM-Image는 90억 개의 매개변수를 가진 자기 회귀 모델과 70억 개의 매개변수를 가진 디퓨전 디코더를 결합한 하이브리드 아키텍처를 사용합니다. 자기 회귀 구성 요소는 명령어 이해 및 전체 이미지 구성을 처리하고, 디퓨전 디코더는 미세한 디테일과 정확한 텍스트 렌더링에 집중합니다. CVTG-2K 벤치마크에서 텍스트 정확도 점수 0.9116을 기록하며 오픈 소스 모델 중 1위를 차지했으며, LongText-Bench 테스트에서도 우수한 성능을 보였습니다.

화웨이 칩 최적화를 위한 노력

Zhipu AI는 화웨이 칩에서 GLM-Image를 훈련하기 위해 맞춤형 최적화 기술을 개발했습니다. 동적 그래프 다단계 파이프라인 배포를 구현하여 훈련 프로세스의 여러 단계를 동시에 실행하고 병목 현상을 줄였습니다. 또한 Ascend 아키텍처와 호환되는 고성능 융합 연산자를 만들고, 분산 훈련 중 통신 및 계산 작업을 겹치도록 다중 스트림 병렬 처리를 사용했습니다.

글로벌 AI 개발에 미치는 영향

이번 성과는 중국 AI 인프라가 최첨단 모델 개발을 지원할 수 있다는 증거를 제공합니다. 중국에서 사업을 운영하는 기업들은 화웨이의 Ascend 및 MindSpore와 같은 플랫폼을 중심으로 전략을 개발해야 할 수도 있습니다. 수출 통제가 병렬 AI 생태계의 발전을 늦출지 가속화할지는 정책 논쟁의 주제로 남아있습니다.

결론

Zhipu AI의 이번 성과는 미국의 기술 제재 속에서도 중국이 자체적인 AI 기술력을 확보할 수 있다는 가능성을 보여줍니다. 앞으로 중국 기업들이 화웨이 칩을 기반으로 얼마나 더 혁신적인 AI 모델을 개발할 수 있을지 주목할 필요가 있습니다. 이는 단순히 중국의 기술 자립을 넘어, 글로벌 AI 산업의 지형을 변화시킬 수 있는 중요한 변곡점이 될 수 있습니다.

이것도 좋아하실 수 있습니다...