🤖 하루 100만원, AI 쇼츠 제작법: ChatGPT, Midjourney로 영상 공장 만들기 (40분 완성 워크플로우)

1. 💡 도입부: AI 영상, 이제는 '선택'이 아닌 '필수' 수익 전략

카메라, 마이크, 조명 같은 복잡한 장비 없이 하루에 100만 원 넘게 버는 채널들이 우후죽순으로 생겨나고 있다는 사실을 알고 계십니까?

이 채널들의 공통점은 바로 AI 툴을 활용하여 영상을 제작한다는 것입니다.

충격적인 수익 사례: 실제로 역사, 금융, 부동산 같은 고단가 분야의 AI 쇼츠 채널들은 조회수 6당 1원인 게임 쇼츠보다 3~4배 높은 단가를 자랑합니다. 총 조회수 1억 8천만 건을 기록한 AI 역사 채널의 예상 수익은 최소 6천만 원 이상으로 추정됩니다.

이처럼 'AI 영상'은 이제 일부 크리에이터들의 특기가 아니라, 적은 노동력으로 고수익을 창출하려는 모든 콘텐츠 제작자에게 필수적인 수익 전략이 되었습니다.

📢 AI 활용의 올바른 정의: AI 영상 제작은 'AI의 도움을 받아 수월하게 영상을 제작하는 것'이지, AI가 영혼 없이 콘텐츠를 찍어내는 '공장형 방식'이 아닙니다.

오늘 저는 여러분이 이 성공한 유튜버들처럼, 고가의 장비 없이 오직 ChatGPT, Midjourney, ElevenLabs 같은 AI 툴만을 활용하여 고퀄리티 쇼츠를 40분 만에 완성하는 구체적이고 체계적인 4단계 워크플로우를 상세히 알려드리겠습니다.

2. ✍️ 대본 자동화 (ChatGPT의 프롬프트 마법)

모든 영상 콘텐츠의 뼈대는 바로 '대본(스크립트)'입니다. 하지만 우리는 직접 대본을 쓰지 않고, 가장 강력한 AI 도구인 ChatGPT를 이용해 이 과정을 100배 단축시킬 것입니다.

2-1. 주제 선정, 당신의 관심 분야부터 시작하라

AI 영상의 가장 큰 장점은 '무엇이든' 주제로 삼을 수 있다는 것입니다.

관심 분야: 경제, 부동산, 역사, 스포츠 등 본인이 흥미를 느끼는 분야가 있다면 바로 시도해보세요.
고수익 키워드: 특히 영상에서 언급했듯이, 역사, 금융, 부동산 등 정보성 콘텐츠는 시청 단가가 높으니 전략적으로 고려할 수 있습니다.

2-2. 단순 질문은 금물! 프롬프트 구조가 퀄리티를 결정한다

ChatGPT를 사용하면서 가장 흔히 하는 실수는 '아무 구조 없이' 질문하는 것입니다.

예를 들어, "유튜브 쇼츠 제작을 위한 흥미로운 역사적 사실"이라고 입력하면, 흥미로운 주제는 나오지만 이걸 가지고 바로 영상으로 만들기는 힘듭니다.

문제점: 완성도가 낮고, 영상 길이에 맞지 않으며, 흐름이 타이트하지 않아 시청자의 이탈을 유발합니다.
핵심: "어떤 명령어를 쓰느냐"가 ChatGPT 사용의 가장 중요한 부분입니다.

2-3. 고수익 쇼츠를 위한 완벽한 대본 자동 생성 프롬프트

고수가 사용하는 스크립트는 수백 번의 테스트를 거쳐 가장 일관성 있고 좋은 결과를 보여주는 구조로 완성되어 있습니다.

[프롬프트의 주요 구성 요소]

역할 부여: ChatGPT에게 '전문 유튜브 쇼츠 대본 작가'의 역할을 부여합니다.
형식 지정: 1분 이내의 쇼츠에 맞도록 타이트하고 완성도 높은 구성(후크, 본론, 마무리)을 요구합니다.
내용 타겟팅: 주제를 입력하고 독자의 흥미를 유발할 수 있는 내용으로 채워 넣도록 요청합니다.

결과 확인: 이 명령어를 사용하면 아까와 달리 퀄리티가 훨씬 좋고, 구성이 바로 영상 투입이 가능할 만큼 완성도가 높은 대본을 얻을 수 있습니다.

2-4. 대본 검토 및 길이 조정 (발표 시간 계산기 활용)

생성된 대본은 바로 다음 단계로 넘기기 전에 두 가지만 확인합니다.

언어 교정: ChatGPT가 생성한 대본은 아직 한글이 어설프거나 번역이 매끄럽지 않은 부분이 있을 수 있습니다. 쭉 읽어보면서 어색한 부분은 직접 다듬어 주세요.
시간 확인: 검색 엔진에서 '발표 시간 계산기'를 찾아 대본을 넣고 1분 내외로 읽는 데 걸리는지 확인하세요. 너무 길면 내용을 줄여서 쇼츠 길이에 맞춥니다.

발표 시간 계산기-바로가기

3. 🎤 음성 녹음 대체 (ElevenLabs의 AI 성우)

대본이 완성되었다면, 이제 이를 영상에 사용할 '오디오 파일'로 변환해야 합니다. 우리는 전문 성우나 마이크 녹음 없이, 최고 퀄리티의 AI 성우를 활용할 것입니다.

3-1. ElevenLabs: 고품질 AI 성우의 압도적인 퀄리티

시중에 많은 무료 AI 성우 툴이 있지만, 저는 ElevenLabs를 강력하게 추천합니다.

비교 불가 퀄리티: 다른 무료 툴과 ElevenLabs의 퀄리티 차이는 생각보다 너무 많이 납니다. 시청자들이 거부감 없이 받아들일 수 있는 수준의 영상을 제작하려면, AI 성우의 퀄리티가 상당히 높아야 합니다.
수익화를 위한 투자: ElevenLabs는 무료 플랜도 제공하지만, 수익화를 목표로 한다면 최소한의 결제(첫 달 $1, 약 1,500원)를 통해 훨씬 더 좋은 음질과 다양한 기능을 활용할 수 있습니다. 이는 영상의 시청 지속 시간을 높이는 데 매우 중요한 투자입니다.

3-2. AI 성우 음원 생성 방법

ElevenLabs 사용법은 매우 직관적입니다.

ElevenLabs 접속: 제공된 링크를 통해 ElevenLabs 사이트에 접속합니다. (수익화를 위해서는 결제를 진행해야 합니다.)
대본 붙여넣기: ChatGPT로 완성한 대본을 텍스트 입력 칸에 붙여 넣습니다.
목소리 선택: 상단에서 다양한 AI 목소리 샘플을 하나씩 들어보면서 영상의 분위기나 채널 컨셉에 가장 잘 맞는 목소리를 선택합니다.
음원 생성: '생성(Generate)' 버튼을 누르면 AI 성우 음원이 즉시 생성됩니다.
다운로드: 생성된 음원은 우측 하단의 다운로드 버튼을 눌러 소리 파일(.mp3 등) 형태로 저장하여 사용할 수 있습니다.

예시: "1927년 5월 20일, 흥미로운 역사적 사건이 일어났습니다. 신문 헤드라인에..." 와 같은 고품질의 AI 성우 목소리를 얻게 됩니다.

🎤 첨부:: 음성 녹음 대체 (ElevenLabs 최신 버전 사용 절차)

ElevenLabs는 단순히 텍스트를 음성으로 변환하는 것을 넘어, 감정과 톤을 제어하여 실제 사람 목소리처럼 들리게 만드는 것이 핵심입니다.

1. 💲 계정 준비 및 요금제 선택 (수익화 필수)

수익화 조건 확인: ElevenLabs는 무료 플랜도 제공하지만, 상업적 사용(수익화)을 위해서는 최소한의 유료 플랜(Starter Plan) 결제가 필수입니다. (첫 달 $1 프로모션 등을 활용하여 시작하는 것을 권장합니다.)
로그인: ElevenLabs 웹사이트에 접속하여 로그인합니다.

2. ⚙️ 음성 합성 인터페이스 설정 (Speech Synthesis)

가장 기본이 되는 'Speech Synthesis' 탭에서 설정을 진행합니다.

단계 A: 모델 및 목소리 선택

설정 항목	선택 및 조언	비고
1. 모델(Model)	Eleven Multilingual v2 또는 ElevenLabs Professional	한국어(Multilingual)를 지원하는 최신 모델을 선택해야 자연스러운 한국어 음성을 얻을 수 있습니다.
2. 목소리(Voice)	원하는 한국어(Korean) 목소리를 선택	성별, 톤, 스타일을 하나씩 들어보며 영상 컨셉에 가장 잘 맞는 목소리를 고릅니다.

단계 B: 음성 설정 조정 (Voice Settings)

이 부분이 음성 퀄리티를 높이는 핵심입니다.

안정성(Stability): 0%~100%
- 조언: 내레이션의 일관성을 위해 50% 이상으로 설정합니다. 너무 낮으면 감정이 불안정해질 수 있습니다.
명확성 및 스타일(Clarity + Style): 0%~100%
- 조언: 50%~75% 사이로 설정하여 감정을 적절히 부여합니다. 너무 높으면 AI 특유의 과장된 연기 톤이 발생할 수 있습니다.
강조(Enhancement): (선택 사항) 최신 모델에서 제공되는 기능으로, 필요에 따라 음성 품질을 추가로 개선할 수 있습니다.

3. ⌨️ 텍스트 입력 및 SSML 활용 (나레이션 제작)

텍스트 입력: ChatGPT로 완성한 대본 전체를 텍스트 입력 칸에 붙여 넣습니다.
SSML (선택 사항): 대본 내에서 쉼표(,)나 마침표(.) 외에 긴 쉼이 필요하거나, 단어를 강조하고 싶을 때 SSML(Speech Synthesis Markup Language) 태그를 사용합니다.
- 예시: 1분 내외로 끊어서 읽게 하거나, 특정 단어의 속도를 조절할 수 있습니다.

4. ▶️ 생성 및 다운로드

생성(Generate) 버튼 클릭: 설정을 마치고 버튼을 누르면 AI 음원이 생성됩니다.
검토: 생성된 음원을 들어보며 발음이 어색하거나 감정선이 끊기는 부분을 확인합니다. (필요 시 텍스트를 수정하거나 SSML 태그를 추가하여 재조정합니다.)
다운로드: 우측 하단의 다운로드 버튼을 눌러 **최종 오디오 파일(MP3 또는 WAV)**을 저장합니다.

4. 시각 자료 생성 (Midjourney의 이미지 제작)

고퀄리티의 AI 음성이 준비되었다면, 이제 시청자의 눈을 사로잡을 시각 자료를 만들어야 합니다. 현재 나와 있는 AI 이미지 생성 프로그램 중 Midjourney는 ChatGPT가 생성하는 프롬프트와 가장 궁합이 잘 맞아 최종 퀄리티가 가장 높습니다.

4-1. 프롬프트 설계의 핵심: ChatGPT에 '장면 분할' 명령

Midjourney에 이미지를 요청하기 전에, 긴 대본을 장면별로 잘게 쪼개는 작업이 필수입니다.

추가 명령어 입력: ChatGPT에게 돌아가 아까 작성한 대본을 장면 단위로 나눠 달라고 요청합니다.
구성: 명령어를 통해 대본을 자르고, 장면마다 사용할 사진에 대한 설명과 해당 장면에 들어갈 나레이션이 명확하게 분리되도록 만듭니다.,

4-2. 언어 장벽 극복: 한글 프롬프트의 영어 변환

문제: Midjourney는 아직 한글을 완벽하게 이해하지 못합니다.
해결: ChatGPT에게 장면별로 나눈 내용을 다시 '영어로 번역'해 달라고 요청합니다. 이렇게 변환된 영문 텍스트가 Midjourney에 입력할 프롬프트가 됩니다.

4-3. Midjourney 이미지 생성 (숏폼 최적화 설정)

Midjourney는 Discord 플랫폼 내에서 작동합니다.

Discord 접속: Midjourney 서버에 접속하고 이미지 생성을 위한 봇 채널로 이동합니다.
프롬프트 입력: /imagine을 입력한 후, 변환된 영문 설명을 붙여 넣습니다.
숏폼 필수 명령어 추가 (핵심!): 일반적인 이미지는 정사각형으로 생성됩니다. 세로가 긴 쇼츠 영상에 최적화된 이미지를 얻기 위해 프롬프트 끝에 쉼표를 찍고 , --ar 9:16 이라는 명령어를 추가해야 합니다.
이미지 생성: 엔터를 치면 몇 초 뒤 4장의 후보 이미지가 생성됩니다. 이 중 원하는 이미지를 선택하여 고화질로 저장합니다.

팁: 이 과정을 대본의 모든 장면마다 반복하여 필요한 모든 시각 자료를 확보합니다. (이 과정에 총 제작 시간 40분 중 약 10분 정도가 소요됩니다.)

5. ✂️최종 편집 및 완성 (CapCut + 배경음악으로 집중도 높이기)

ChatGPT 대본, ElevenLabs 음성, Midjourney 이미지가 준비되었다면, 이제 이 모든 것을 합쳐 영상의 집중도를 높일 차례입니다. 이 과정은 무료 툴인 CapCut(캡컷)을 이용해 약 30분 만에 끝낼 수 있습니다.,

5-1. 편집 툴 세팅 및 기본 편집 (CapCut)

에셋 불러오기: CapCut 새 프로젝트를 열고, 준비된 이미지 파일과 AI 성우 음원 파일을 모두 불러옵니다.
타임라인 배치: 음원을 타임라인에 올린 후, 성우 음성을 들으면서 대사에 맞게 이미지들의 길이를 정밀하게 조정하고 어색한 부분을 정리합니다.

5-2. 자막 자동 생성 및 디자인

숏폼 영상에서 자막은 시청자가 소리를 끄고 볼 때도 정보를 전달하는 핵심 수단입니다.

자동 캡션 기능: CapCut의 [텍스트] → [자동 캡션] 기능을 눌러주면 자동으로 자막이 생성됩니다.
수정 및 디자인: 생성된 자막을 클릭하여 자막 크기와 위치를 조절하고, 대사 오류가 있다면 바로 수정합니다. (자막의 가독성은 시청자의 이탈을 막는 중요한 요소입니다.)

5-3. 🎶 배경 음악 (BGM) 추가: CTR 및 집중도 극대화

많은 초보자가 놓치지만, 배경 음악은 영상의 집중도와 퀄리티를 높여 시청 지속 시간을 늘리고 클릭 후 이탈률(CTR)을 낮추는 정말 중요한 역할을 합니다.

BGM의 역할: 배경 음악은 시청자가 의식하지 못하는 사이에 영상을 뒤에서 받쳐주며 영상의 분위기와 몰입감을 형성합니다.
추천 소스: 유튜브에서 제공하는 무료 음원도 있지만, 마음에 드는 고퀄리티 음원을 찾기 어렵습니다. Epidemic Sound처럼 음원 종류가 많고 퀄리티가 좋은 유료 라이브러리를 활용하는 것이 시간과 노력을 절약하는 방법입니다.
적용: 영상의 주제(역사, 금융)에 맞는 BGM을 검색하여 다운로드한 뒤, 영상의 분위기를 해치지 않도록 적절한 볼륨으로 조절하여 삽입합니다.

6. 🎯 결론: AI 제작의 올바른 이해와 다음 단계

총 제작 시간 40분 만에 카메라 없이 고수익 영상을 제작하는 워크플로우를 완성했습니다.

AI의 정의: AI 영상 제작은 'AI의 도움을 받아 수월하게 제작'하는 것이지, AI가 영혼 없이 콘텐츠를 찍어내는 '공장형 방식'이 아님'을 명심해야 합니다.
수익화 주의: 유튜브는 AI를 이용해 대량 복제된 공장형 콘텐츠를 싫어하며, 이들은 수익화가 막힐 가능성이 높습니다. (AI 관련 가이드라인 강화 중)
핵심 조언: 편집 실력은 여전히 중요합니다. AI가 줄 수 없는 당신의 디테일을 추가하는 것이 시청자의 집중도를 높이고 채널의 생존력을 높이는 유일한 길입니다. 단순히 찍어내는 것이 아니라, 더 적은 노력으로 더 높은 퀄리티를 만들어내는 데 집중해야 합니다.

▶ 다음 액션: 지식은 충분합니다. 이제 '생산'할 시간입니다.

오늘 알려드린 4가지 툴(ChatGPT, ElevenLabs, Midjourney, CapCut)의 조합을 활용하여 카메라 없이 당신의 첫 번째 고수익 AI 쇼츠를 바로 제작해 보세요! 당신의 관심 분야를 주제로 단 하나의 쇼츠만이라도 완성한다면, AI 콘텐츠 제작에 대한 두려움은 완전히 사라질 것입니다.

궁금한 점이 있다면 언제든지 댓글로 질문해 주세요. 감사합니다!

참고영상:https://youtu.be/vH15rSVO1H0?si=J5xit3WUtOGlW9mg

#가나 투데이 #ganatoday

그린아프로

Share: Facebook Twitter Google+

가나투데이, gana today, 오늘의 투데이 뉴스

Ad Billboard

쿠팡파트너스-빅세일

전체 페이지뷰

Most Popular

미국 주식 투자 필수! 배당금과 양도세 절세 완벽 가이드

갤럭시Z폴드7, S펜 미지원 사태! 그럼 어떤 펜을 써야 할까? 호환 스타일러스펜 완전 가이드

서해안 바다낚시 황금 포인트:: (2025-8월 기준)는 어디일까?

[세계여행기-들여다보기] 월 7,500원 스타링크에 전파를 달다(+ 세계 여행자를 위한 궁극의 인터넷 사용 방법)

KT 컬러링(콜링) 변경 상세 가이드