본문 바로가기
AI의 시대가 온다

AI 소라(Sora)의 기능. 소라(Sora) 활용 방법

by protocall 2024. 3. 3.

소라가 주목 받는 이유는?

텍스트를 영상으로 전환하는 인공지능은 기존에도 존재했지만 소라가 주목 받는 이유는 높은 수준의 영상 시연을 통해 상용화 가능성을 보여줬다는 데 있습니다. 챗GPT를 만든 오픈AI에 대한 기대감도 반영됐습니다.

 

2023년 9월 페이스북과 인스타그램 등을 운영하는 메타는 동영상 생성 AI 모델인 ‘메이크 어 비디오(Make-A-Video)’ 개발 성과를 공개했습니다. 구글은 2024년 12월 동영상 생성AI 모델 ‘비디오 포엣(Video Poet)’을 발표했습니다.

 

다만 이들 서비스는 대중에게 공개되지는 않았고 영상에 다소 어색한 면이 있었습니다. 반면 오픈AI는 우선 제한된 창작자들에게 사용을 허가하겠다고 밝혔고 실제 영화로 오인할 정도로 자연스럽습니다.

 

AI 소라(Sora)의 기능. 소라(Sora) 활용 방법

 

오픈AI는 소라의 기술적 성과에 관해 “범용인공지능(AGI) 달성을 위한 중요한 이정표가 될 것”이라고 했습니다. 범용인공지능은 스스로 추론하고 성장하는 자율적 인공지능을 뜻합니다. ‘궁국의 AI’를 만들기 위한 토대가 마련됐다는 것입니다.

 

 


AI 소라의 기능

유연한 샘플링

오픈AI 소라(Sora)는 가로 1920×1080부터 세로 1080×1920 영상까지, 그리고 그 사이 어떤 사이즈의 영상이라도 가능합니다. 이전 Ai 동영상을 생성하는 방법들은 정해진 종횡비에 한해서만 가능했지만, Sora는 다양한 기기와 상황에 맞춰 영상을 제작할 수 있게 됩니다.

 

언어 이해

소라의 언어 이해는 달리3의 기술을 적용했다고 하는데요. 달리와 마찬가지로, GPT를 활용해 사용자의 프롬프트를 해석하여 길어진 길이의 자세한 캡션으로 변환하고 그것을 비디오 모델에 보냅니다. 이를 통해 Sora는 사용자의 프롬프트를 정확하게 따르는 고품질의 비디오를 생성할 수 있다고 합니다.

 

 

 

 

3차원 일관성 유지

소라(Sora)는 마치 실제 카메라로 촬영하는 것처럼, 영상 안에서 카메라의 움직임을 만들 수 있습니다. 비디오 속의 모든 것들이 실제 3차원 공간에서 움직이는 것처럼 생생하게 표현됩니다. 카메라가 이동하고 회전함에 따라 사람과 장면 요소가 3차원 공간을 통해 일관되게 움직입니다.

 

디지털 세계 시뮬레이션

소라(Sora)는 실제 비디오를 만들어내는 것뿐만 아니라, 비디오 게임 같은 가상 환경에서 일어나는 일들을 모방하고 만들어낼 수도 있습니다. 예를 들어, 마인크래프트 게임 안에서 플레이어가 어떻게 움직이고, 게임 세계가 어떻게 반응하는지를 Sora가 재현할 수 있다는 의미입니다. 이것은 Sora가 단순히 영상을 만드는 것을 넘어서, 그 영상 속에서 일어나는 이야기나 환경을 실시간으로 생성하고 조정할 수 있음을 의미합니다.

 

예제는 단순히 “마인크래프트”를 거론했을 뿐인데 Sora가 알아서 영상을 생성해 준 것 같습니다. 여기서 ‘제로샷’ 이란 표현은 Sora가 사전에 구체적인 예시를 보지 않고도, 대규모 데이터로 인해 새로운 요구사항에 대응할 수 있었다는 표현 같습니다.

 

AI 소라(Sora)의 기능. 소라(Sora) 활용 방법
Sora가 생성한 마인크래프트 화면

 


소라(Sora) 사용법

소라(Sora)는 텍스트를 기반으로 이미지를 생성하는 기능 외에 이미지를 영상으로 변환하는 기능(image-to-video)과 영상을 기반으로 새로운 영상을 만드는 기능(video-to-video)도 제공합니다. 또한, 영상의 전후를 확장하거나 두 개의 영상을 통합하는 기능도 제공합니다.

 

image-to-video 사용법

우선, 이미지와 함께 명령어를 입력하면 명령어 내 요청 사항이 반영된 영상으로 재탄생합니다.

 

video-to-video 사용법

영상을 기반 새로운 영상을 만드는 기능일 경우 명령어를 입력하면 명령어 내 요청 사항이 반영된 새로운 영상이 생성됩니다. 챗GPT에서 명령하듯이 손쉽게 명령할 수 있는 것으로 보입니다.

 

영상 확장 기능

최초 영상 생성 이후 영상의 전후를 확장하는 기능도 제공됩니다. 특히 시간을 거슬러 영상의 앞 부분을 확장하는 기능은 정말 놀랍습니다. 영상의 시작 부분은 서로 다르지만, 모두 같은 결말로 끝나는 것을 알 수 있습니다.

또한 두 개의 영상을 통합하는 기능도 제공됩니다.

 

 


소라 등록 방법 , 사용 방법 

이전 OpenAI에서 출시한 애플리케이션에 따르면 미래에 소라(Sora)의 등록 및 사용 단계는 다음과 같습니다.

  1. 오픈AI 공식 웹사이트로 이동하여 계정에 로그인하고 Sora를 다운로드하세요.
  2. 원하는 비디오 콘텐츠, 캐릭터, 효과 등을 포함한 텍스를 입력하십시오.
  3. 확인을 클릭하면 OpenAI Sora가 1분 길이의 비디오를 생성하며, 마음에 들지 않을 경우 조정할 수 있습니다.

소라가 영상을 생성하는 데 걸리는 시간에 대해 일부 네티즌들은 “소라가 1분짜리 영상을 생성하는 데 1시간 이상 걸릴 수도 있다”고 밝혔으나, 개선 및 출시를 거쳐 이 시간이 단축될 수도 있습니다.

 

 


소라(Sora) 활용하는 방법

아직까지 소라(Sora)가 공개적으로 사용되지는 않았지만, 오픈AI에서 공개한 영상을 보면 앞으로 다음과 같은 목적으로 소라가 사용될 수 있음을 알 수 있습니다.

 

텍스트로 영화 예고편, 단편 영화, 애니메이션, 다큐멘터리 제작

소라는 영화 제작자와 스토리텔러가 자신의 아이디어와 개념을 시각화하고 설득력 있고 독창적인 영화를 만들 수 있도록 도와줍니다. 소라는 또한 시청자가 자신의 선호도와 관심분야에 따라 새롭고 흥미로운 콘텐츠를 발견하는 데에 도움이 됩니다.

 

새로운 요소로 기존 비디오 개선(강화)

소라(Sora)는 비디오 편집자와 제작자가 비디오를 개선 및 수정하고 더 많은 다양성과 창의성을 추가하도록 돕습니다. 또한 시청자가 피드백과 의견을 바탕으로 더욱 개인적이고 대화형 동영상을 즐길 수 있도록 도울 수 있습니다. 예를 들어 특수 효과를 추가하거나 배경을 변경하거나 새 캐릭터를 삽입할 수 있습니다.

 

 

 

 

텍스트 요약을 기반으로 교육용 비디오를 생성

소라는 교육자와 학습자가 정보가 풍부하고 흥미로운 영화를 만들고 접근할 수 있도록 도와줌으로써 그들의 이해와 기억을 증진시킬 수 있습니다. 또한 시청자가 호기심과 질문을 바탕으로 다양한 주제와 테마를 탐색하고 자세히 이해할 수 있도록 도와줍니다. 예를 들어 과학적 개념, 역사적 사건, 문화적 현상을 설명하는 것이 포함됩니다.

 

소셜 미디어를 위한 맞춤형 비디오 제작

소라는 소셜 미디어 사용자와 인플루언서가 자신의 개성과 감정을 표현할 수 있는 독특하고 재미있는 영상을 만들고 공유할 수 있도록 도울 수 있습니다. 소라는 또한 시청자가 좋아요와 댓글을 기반으로 친구 및 팔로어와 연결하고 상호 작용하도록 돕습니다.  예를 들면 생일축하, 여행일기나 밈 영상을 생성될 수도 가능합니다.

 

텍스트를 통해 아이디어·사나리오·꿈을 시각화

소라(Sora)는 디자이너와 혁신가가 프로토타입과 비전을 제작 및 테스트하고 피드백과 제안을 받을 수 있도록 도와줍니다. 또한 소라는 시청자가 상상력과 창의성을 바탕으로 다양한 현실과 가능성을 경험하고 즐길 수 있도록 돕습니다. 예를 들어 제품 디자인, 미래 상상, 판타지 세계 탐험 등이 있습니다.

 

 


지금 소라(Sora) 사용 가능할까?

소라 서비스와 결과물은 홈페이지에 공개됐지만 오픈에이아이는 누구나 접근해 사용할 수 있도록 제품으로 출시하지 않았습니다. 오픈AI는 소라를 AI 시스템의 결함과 취약점을 찾는 ‘위험기술(레드팀)’로 맡겨, 오용 가능성을 연구하고 있다며 소수의 학자와 외부 연구자그룹에만 기술을 공유하고 있다고 밝혔습니다. 소라와 같은 동영상 생성 서비스가 가짜뉴스나 딥페이크 등에 악용될 가능성이 있기 때문입니다.

 

또한 현재 오픈AI는 당분간 소라를 시각 예술가, 디자이너, 영화 제작자 등 제한된 수의 크리에이티브 전문가에게만 공개하고 피드백을 받고 있습니다.

 

그렇다면 소라는 언제 사용할 수 있나요?

현재 오픈AI는 소라가 대중에게 언제 어떻게 출시될지 발표하지 않았으며 가격이나 라이선스 모델도 발표하지 않았습니다. 따라서 레드팀에 속하거나 크리에이티브 테스터 중 한 명이 아닌 이상 기존 데모를 기다려야 합니다.

 

 


소라(Sora)의 한계

물론 대부분 동영상 AI가 그렇듯, 아직 소라도 완벽하지는 않다. 오픈AI는 복잡하고 물리적인 장면을 묘사하는 데 어려움을 겪을 수도 있고, 인과관계를 이해하지 못하는 경우도 발생한다고 밝혔습니다.

 

예를 들어 사람이 쿠키를 한입 베어 무는 장면에 이어 쿠키를 깨문 자국이 나타나지 않을 수 있다는 설명입니다. 또 왼쪽과 오른쪽을 혼동하거나, 특정 카메라 궤적을 따라가는 동안 발생하는 이벤트에 대해 시간 순서를 헷갈리기도 한다고 전했습니다.

 

딥페이크 우려 등에 대해 오픈AI는 “소라는 대중에게 공개되기 전 중요한 테스트를 거치며 안전 조치를 취할 것”이라고 했습니다. 오픈AI는 “예를 들어 극단적인 폭력이나 성적이고 혐오스러운 이미지 또는 유명인의 초상을 사용하라는 요청을 거부하게 할 것”이라며 “또한 생성된 모든 비디오를 검토해 표시되기 전 사용 정책을 준수하는지 확인하겠다”고 했습니다.

 

 


소라(Sora) 안전한가?

생성형 AI 기술이 발전하면서 사회적으로 우려도 커지고 있습니다. 특히 동영상 생성이 가능해지면 여러 측면에서 악용될 수 있습니다.

 

미국의 정보기술매체 ‘기즈모도’는 지난 15일 “소라는 현실감이란 개념을 엿먹이는 서비스(OpenAI’s Sora Is a Giant ‘F*ck You’ to Reality)”라고 보도했습니다. 이 매체는 “온라인 허위정보가 커뮤니티를 분열시키고, 선거를 조작하고, 수많은 사람의 이성을 잃게 만들어 큰 문제가 되고 있지만 실제 해결에 뛰어든 사람은 없다”며 “온라인 허위정보에 가장 큰 책임이 있는 기술기업들은 문제를 기하급수적으로 악화시키기 위해 가능한 모든 일을 하려는 의도를 지닌 것으로 보인다”고 비판했습니다.

 

오픈AI도 우려를 인지하고 있기에 서비스 발표와 동시에 ‘안전성’을 강조했습니다. 오픈AI는 영상 전문가들이 합류한 레드팀을 만들어 문제와 취약점을 찾아내는 방식으로 안전성 테스트를 하고 있습니다. 향후 제한된 이용자에게만 서비스하는 것도 오남용 소지를 줄이려는 조치로 보입니다.

 

사실 오픈AI는 또한 “광범위한 연구와 테스트에도 불구하고 사람들이 우리 기술을 사용하는 유익한 방법을 모두 예측할 수 없으며 사람들이 기술을 오용하는 모든 방법을 예측할 수도 없다” 며 “이것이 바로 사람들이 우리 기술을 사용함에 따라 여전히 모든 유익한 방식을 예측할 수는 없다. 실제 사용을 통해 학습하는 것은 시간이 지남에 따라 점점 더 안전한 AI 시스템을 만들고 출시하는 데 핵심 구성 요소다” 라고 했습니다.

 

 

 

 

AI 소라 연관 코인 : 싱귤래리티넷(AGIX) 코인이란?

싱귤래리티넷(AGIX)은 왜 핫한가? 오픈AI가 텍스트-비디오 생성 인공지능(AI) 모델인 ‘소라(Sora)’를 공개한 후 월드코인(WLD)을 비롯해 AI 토큰이 꾸준한 상승세를 보이고 있습니다. 싱귤래러티넷(A

web3.memebro.kr

 

게임코인 게임 P2E 종류를 알아보자.

게임 관련 코인과 한국 한국에서는 게임코인을 저주받은 코인이라고 부릅기도 합니다. 매우 명확한 유틸리티의 본질과 수익성을 가지고 있지만, 한국 사회에서 게임이라는 오락자체의 인식부

web3.memebro.kr

 

AI 반도체 시장이 10배 더 커진다

엔비디아가 시장 80% 장악 AI 시장, 10배 더 커진다 엔비디아는 2023년 4분기 매출이 전년 동기 대비 265% 늘어난 221억달러를 기록했다고 밝혔다. 영업이익은 136억1500만달러로 전년 동기(12억5700만 달

web3.memebro.kr

 

미쳤다. SORA 그 이상인 알리바바그룹의 'EMO' (Emote Portrait Alive)

SORA 보다 더 미친 생성AI 'EMO' EMO: Emote Portrait Alive 알리바바에서 만든 진짜 '미친' AI 영상 생성 모델이 나왔다. 이름은 EMO라고 하는데 인물의 이미지와 오디오를 함께 입력하면 오디오에 맞춰 말하

web3.memebro.kr