알리바바, 오픈소스 AI로 빅테크 도전

Share

알리바바, 오픈소스 AI 모델 Qwen3-Omni로 미국 빅테크에 도전장을 던지다

알리바바가 텍스트, 이미지, 오디오, 비디오를 처리하는 새로운 오픈소스 AI 모델 Qwen3-Omni를 공개하며 미국 기술 대기업에 직접적인 도전을 시작했습니다. 엔터프라이즈 친화적인 Apache 2.0 라이선스 하에 무료로 제공되는 이 모델은 알리바바를 OpenAI 및 Google의 잠재적인 대안으로 자리매김하며 기업이 멀티모달 AI를 대규모로 비용 없이 배포할 수 있도록 합니다.

Qwen3-Omni의 핵심 기능

알리바바는 블로그 게시물에서 "Qwen3-Omni는 Thinker-Talker 아키텍처를 채택했습니다."라고 밝혔습니다. Thinker는 텍스트 생성 작업을 담당하고 Talker는 Thinker로부터 직접 고수준 표현을 받아 스트리밍 음성 토큰을 생성하는 데 중점을 둡니다. 초저지연 스트리밍을 달성하기 위해 Talker는 다중 코드북 시퀀스를 자동 회귀적으로 예측합니다.

성능 비교 및 강점

알리바바에 따르면 Qwen3-Omni는 Qwen 시리즈의 단일 모달 모델과 동등한 성능을 보였으며 오디오 작업에서 더 강력한 결과를 보였습니다. 또한 이 모델은 Google의 Gemini 2.5 Pro, Seed-ASR 및 OpenAI의 GPT-4o-Transcribe와 같은 폐쇄 소스 모델보다 앞서 32개의 오픈소스 벤치마크와 22개의 전체 벤치마크에서 가장 높은 순위를 차지했습니다. 이러한 결과가 정확하다면 기업은 많은 폐쇄 소스 경쟁업체에 비해 음성 인식, 필기 인식 및 멀티모달 추론에서 더 강력한 성능을 기대할 수 있습니다.

오픈소스 전략의 이점

분석가들은 알리바바의 Qwen3-Omni 릴리스가 오픈소스 AI 시장에서 알리바바의 입지를 강화하고 글로벌 파트너 생태계를 확장하는 데 도움이 될 것이라고 말합니다. Kadence International의 수석 부사장인 Tulika Sheel은 "허가적인 Apache 2.0 라이선스하에 Qwen3-Omni를 사용할 수 있게 되면 기업이 선택할 수 있는 옵션이 크게 변경됩니다."라고 말했습니다.

벤더 종속성 제거 및 맞춤화 용이성

Sheel은 "벤더 종속성을 제거하고 실험 및 사용자 정의에 대한 장벽을 낮춥니다. 기업은 라이선스 충돌 없이 자체 환경 내에서 모델을 실행, 조정 및 통합할 수 있습니다."라고 덧붙였습니다. Omdia의 수석 분석가인 Lian Jye Su는 Alibaba Cloud의 모델 출시 실적을 지적합니다. "OpenAI와 Google도 일부 모델을 오픈 소스로 만들었지만 Alibaba Cloud에 뒤쳐져 있습니다."라고 그는 말했습니다.

Qwen 모델의 폭넓은 채택

Su는 "Alibaba Cloud는 Qwen 모델 제품군을 처음부터 오픈 소스로 만들어 300개 이상의 모델을 출시했습니다. Qwen 제품군은 전 세계적으로 4억 회 이상 다운로드되는 등 널리 채택되었습니다."라고 언급했습니다. 또한 개발자들이 Hugging Face에서 140,000개 이상의 Qwen 기반 파생 모델을 만들었으며, 성숙한 오픈소스 옵션을 찾는 기업들은 Alibaba Cloud를 선도적인 선택으로 점점 더 많이 보고 있다고 덧붙였습니다.

엔터프라이즈 AI 전략에 미치는 영향

Qwen3-Omni의 하이브리드 추론, 멀티모달 기능 및 강력한 벤치마크 결과가 실제 성능으로 이어진다면 엔터프라이즈 AI 전략에서 두 가지 주요 변화를 가속화할 수 있습니다. Sheel은 "첫째, 조직은 점점 더 멀티 모델 스택을 채택하여 오픈 및 독점 모델을 혼합하여 기능과 작업을 일치시킬 것입니다."라고 말했습니다.

내부 역량 강화

Sheel은 "둘째, 기업이 고성능 오픈 모델을 온프레미스 또는 신뢰할 수 있는 클라우드에서 운영할 수 있도록 내부 역량(MLOps, 미세 조정, 안전성 테스트 및 인프라)에 대한 투자가 더 많아질 것으로 예상합니다."라고 덧붙였습니다. Su는 하나의 모델 내에서 모든 데이터 모달리티를 처리하면 리소스 요구 사항을 줄이고 여러 도메인별 시스템을 훈련하고 관리하는 데 필요한 시간을 단축할 수 있다고 지적했습니다.

보안 및 규정 준수 중요성

그러나 분석가들은 기술 성숙도가 안전 장치와 일치해야 한다고 경고합니다. Forrester의 부사장 겸 수석 분석가인 Charlie Dai는 "기술적으로 중국 모델과 다른 국가의 모델 간에는 차이가 없습니다."라고 말했습니다. "GPT 시리즈, Llama, Mistral 또는 Alibaba의 Qwen이든 엔터프라이즈 리더는 보안, 개인 정보 보호 및 규정 준수에 대한 안전 장치를 확보해야 합니다."라고 강조했습니다.

멀티 모델 지원의 중요성

Dai는 멀티 모델에 대한 지원이 계속해서 핵심 초점이 될 것으로 예상합니다. "멀티 모델 지원은 데이터 인프라에서 에이전트 AI 애플리케이션에 이르기까지 모델 개발 및 관련 기술 도메인의 핵심 영역이며 향후 12개월 동안 전 세계 주요 벤더에서 더 많은 소식이 있을 것입니다."라고 덧붙였습니다.

맺음말

알리바바의 Qwen3-Omni 공개는 오픈소스 AI 경쟁을 심화시키고 있으며, 기업들은 더 다양한 선택지를 갖게 되었습니다. 성능, 비용 효율성, 맞춤화 가능성을 고려하여 기업들은 자사의 요구에 맞는 최적의 AI 모델을 선택할 수 있을 것입니다. 앞으로 알리바바와 미국 빅테크 기업 간의 AI 경쟁은 더욱 치열해질 것으로 예상됩니다.

이것도 좋아하실 수 있습니다...