알리바바의 동영상 생성 AI 모델 공개

알리바바의 동영상 생성 AI 모델 공개

- 알리바바는 자사의 동영상 생성 AI 모델 4가지 버전을 오픈소스로 공개하였다.

- 이 모델은 **완2.1(Wan2.1)**이라고 불리며, 텍스트-동영상 변환 기능을 갖추고 있다.

- 공개된 모델은 복잡한 움직임을 정확하게 처리하고, 픽셀 품질을 향상시키며, 물리적 원칙을 준수하는 특징이 있다.

- 이러한 기술은 현실적인 영상을 만드는 데 뛰어난 성능을 발휘한다고 알리바바는 강조하였다.


완2.1 모델의 특징과 성능

- 완2.1 모델은 명령 실행의 정밀도를 최적화하여 고품질의 영상을 생성할 수 있도록 설계되었다.

- 이 모델은 13억 개에서 140억 개에 이르는 매개변수를 사용하여 몇 초 길이의 동영상을 최대 720p 해상도로 생성할 수 있다.

- 1080p 해상도 동영상을 생성할 수 있는 모델에 대한 출시 계획은 아직 알려지지 않았다.

- 알리바바는 이 모델이 텍스트 및 이미지 입력을 기반으로 고품질 이미지와 동영상을 생성하도록 설계되었다고 밝혔다.


상업적 출시와 경쟁 모델

- 완2.1은 2024년 상업적으로 출시될 예정이다.

- 이 모델은 오픈AI의 소라(Sora) 동영상 생성 모델에 대한 무료 대안으로 제공된다.

- 소라는 챗GPT 플러스 요금제에 포함되어 있으며, 월 20달러에 480p 해상도 동영상을 최대 50개 생성할 수 있다.

- **구글의 비오 2(Veo 2)**는 일부 사용자에게만 공개되어 있어, 완2.1의 경쟁 모델로 언급된다.


동영상 생성 AI의 발전과 한계

- 동영상 생성 AI는 유용한 생산성 도구가 될 수 있지만, 기술이 성숙하는 데 시간이 걸린다.

- 잭 골드는 현재 많은 모델이 아직 기초적인 수준이라고 언급하며, 이 기술로 3시간짜리 영화를 만들 수 있는 단계는 아니다라고 말했다.

- 그는 현재의 동영상 생성 AI 모델을 1980년대 워드 프로세서에 비유하며, 시간이 지나면서 점점 개선될 것이라고 예측하였다.

- 워드 프로세서와 AI의 차이점은 사용자가 모델에 정보를 입력한다는 점이다.


기업 사용자와 데이터 활용

- 기업 사용자 관점에서 중요한 질문은 **“내가 무엇을 무료로 제공하고 있는가?”**이다.

- 많은 프로그램은 사용자가 제공하는 데이터를 학습하게 될 것이라고 골드는 설명하였다.

- 이러한 점에서 오픈소스 텍스트-동영상 변환 모델은 기업 사용자에게 새로운 가능성을 제공한다.

- 기업들은 이 기술을 활용하여 비용 절감과 효율성 향상을 기대할 수 있다.


시장 성장 전망과 크리에이티브 산업

- 캠브리안 AI 리서치의 칼 프로엔드는 이 시장이 엄청나게 성장할 것이라고 전망하였다.

- 특히 크리에이티브 업계, 미디어, 기업 사용자 사이에서 큰 관심을 받을 것이라고 덧붙였다.

- 기업들이 멀티미디어에 많은 비용을 지출하고 있으며, 이미 여러 텍스트-이미지 생성 모델이 클라우드에서 활용되고 있다.

- 동영상 생성 AI는 이러한 흐름의 다음 단계로 자리 잡을 가능성이 높다.


중국 AI 기업의 영향력

- 중국 AI 기업들은 이미 시장을 뒤흔들고 있다.

- 딥시크 챗봇 툴은 중국 기업의 AI 기술 발전을 보여주는 사례로 언급된다.

- 완2.1은 동영상 생성 모델에서의 성장을 증명하는 중요한 모델로 자리 잡고 있다.

- 마이크로소프트와 아마존도 자사 클라우드 서비스를 통해 딥시크 R1을 제공하고 있다.


클라우드 서비스와 수익 창출 가능성

- 프루엔드는 클라우드 서비스 업체들이 완2.1을 자사 서비스에 통합해 제공하며 수익을 창출할 가능성이 있다고 설명하였다.

- AWS CEO 맷 가먼은 다양한 새로운 옵션이 등장할 것으로 기대한다고 언급하였다.

- 이러한 통합은 기업들이 비용 효율성을 높이는 데 기여할 수 있다.

- 클라우드 서비스의 발전은 AI 기술의 확산에 중요한 역할을 할 것이다.


보안 문제와 딥페이크 우려

- 골드는 완2.1 모델이 악용돼 딥페이크 생성에 사용될 가능성이 있다고 지적하였다.

- 그는 모든 기술에는 장단점이 있다고 언급하며, 기술의 발전에 따른 보안 문제를 우려하였다.

- 완2.1 모델이 중국에서 개발되었다는 점도 우려의 요소로 지적되었다.

- 그러나 소스코드가 공개되어 있으므로, 오픈소스 지지자들이 철저히 검토할 것이라고 덧붙였다.


모델 다운로드와 오픈소스 지원

- 완2.1 모델은 알리바바 클라우드의 AI 모델 커뮤니티인 모델 스코프와 허깅 페이스에서 다운로드할 수 있다.

- 허깅 페이스는 메타의 라마, 마이크로소프트 파이, 구글의 젬마 등 여러 공개 AI 모델도 호스팅하고 있다.

- 이러한 오픈소스 지원은 AI 기술의 접근성을 높이고 다양한 사용자에게 기회를 제공할 것이다.

- 기업과 개인 개발자 모두가 이 모델을 활용하여 창의적인 프로젝트를 진행할 수 있는 기반이 마련되었다. 

이 블로그의 인기 게시물

작가 한강 노벨문학상 수상

한국경제 빨간불

숙박플랫폼과 숙박업 위기