라벨이 동영상인 게시물 표시

알리바바의 동영상 생성 AI 모델 공개

알리바바의 동영상 생성 AI 모델 공개 - 알리바바는 자사의 동영상 생성 AI 모델 4가지 버전을 오픈소스로 공개하였다. - 이 모델은 **완2.1(Wan2.1)**이라고 불리며, 텍스트-동영상 변환 기능을 갖추고 있다. - 공개된 모델은 복잡한 움직임을 정확하게 처리하고, 픽셀 품질을 향상시키며, 물리적 원칙을 준수하는 특징이 있다. - 이러한 기술은 현실적인 영상을 만드는 데 뛰어난 성능을 발휘한다고 알리바바는 강조하였다. 완2.1 모델의 특징과 성능 - 완2.1 모델은 명령 실행의 정밀도를 최적화하여 고품질의 영상을 생성할 수 있도록 설계되었다. - 이 모델은 13억 개에서 140억 개에 이르는 매개변수를 사용하여 몇 초 길이의 동영상을 최대 720p 해상도로 생성할 수 있다. - 1080p 해상도 동영상을 생성할 수 있는 모델에 대한 출시 계획은 아직 알려지지 않았다. - 알리바바는 이 모델이 텍스트 및 이미지 입력을 기반으로 고품질 이미지와 동영상을 생성하도록 설계되었다고 밝혔다. 상업적 출시와 경쟁 모델 - 완2.1은 2024년 상업적으로 출시될 예정이다. - 이 모델은 오픈AI의 소라(Sora) 동영상 생성 모델에 대한 무료 대안으로 제공된다. - 소라는 챗GPT 플러스 요금제에 포함되어 있으며, 월 20달러에 480p 해상도 동영상을 최대 50개 생성할 수 있다. - **구글의 비오 2(Veo 2)**는 일부 사용자에게만 공개되어 있어, 완2.1의 경쟁 모델로 언급된다. 동영상 생성 AI의 발전과 한계 - 동영상 생성 AI는 유용한 생산성 도구가 될 수 있지만, 기술이 성숙하는 데 시간이 걸린다. - 잭 골드는 현재 많은 모델이 아직 기초적인 수준이라고 언급하며, 이 기술로 3시간짜리 영화를 만들 수 있는 단계는 아니다라고 말했다. - 그는 현재의 동영상 생성 AI 모델을 1980년대 워드 프로세서에 비유하며, 시간이 지나면서 점점 개선될 것이라고 예측하였다. - 워드 프로세서와 AI의 차이점은 사용자가 모델에 정보를 입력한다는 점이다. 기업 사...