Кейс по вайбкодингу автоматизации создания YouTube Shorts

Astraport

Client
Регистрация
01.05.2015
Сообщения
5 066
Благодарностей
4 580
Баллы
113
138664


Вы не задавались вопросом: вот миллионы просмотров и тысячи лайков у короткого ролика на YouTube, почему же автор канала, где таких роликов сотни, не миллионер? Почему внимание миллионов пользователей не конвертируется в миллионы зеленых бумажек? Причины многие понимают. Нет активной ссылки, нет слива, аудитория не прогрета, развлечение != покупка. Так как же создавать такие ролики, которые принесут хороший конверт в продажи? Как сливать аудиторию с коротких роликов на своём канале и как конвертировать просмотры в лиды? Этими вопросами я давно задавался и поэтому решил создать новый, более "материальный" канал на Ютубщине.

Я уже рассказывал в одном из предыдущих конкурсов о своих экспериментах с шортсами на YouTube. Тогда мне удалось легко набирать по несколько десятков тысяч просмотров на одном ролике, а счётчик некоторых роликов перевалил за 600к. Однако просмотры у новых роликов начали падать, нейрогенерации прикольных сцен с котиками и анекдотов стало много в тик-токах и рилсах, аудитория развлекалова никак не хотела даже подписываться на ТГ канал и я охладел к теме, забросил канал. Особенно меня напрягала ручная рутина, которая присутствовала несмотря на автоматизацию Зенкой. Просмотреть ролики, исправить промпты, откорректировать сценарий, склеить сцены - всё это было поначалу интересной игрой в режиссера, но потом наскучило. Да и тратить по 1-2 часа на ролик мне совсем не хотелось.

2025-12-20_12-52-45.png


Однако, был у меня и другой pet-проект связанный со старым хобби любви к рок-музыке, о котором я тоже успел рассказать в одном конкурсе. И у меня зачесались руки накодить какую-нибудь сложную автоматизацию для создания роликов по музыке. Был у меня на примете один сайтик на котором была собрана достаточно большая коллекция mp3 различных групп хорошо систематизированных по альбомам, годам и жанрам. На основе этой информации я и начал агрегировать подборки, сравнения и ТОПы, которые должны были быть интересны меломанам со всего мира, так как в этом проекте моё ГЕО не было ограничено только русскоговорящей аудиторией, которая, к слову, резко сдулась за последний год (спасибо замедлителям).

Критерии для нового проекта были такие:
  1. Это должно нравится мне.
  2. Полная автоматизация (ну или с минимальными ручными действиям, не более 2-3 часа в неделю).
  3. Что-то новое, незаезженное.
  4. Бурж аудитория.
  5. Без голимой, надоедшей нейрогенерации.
  6. Возможность масштабирования контента вплоть до тысячи видосов на канал.
Я внимательно изучил музыкальный контент шортсов, проанализировал успешные ролики и определил несколько направлений или типов роликов, которые я планировал собирать с помощью нашего старого друга FFMPEG. Конечно, читать конфигурационные файлы, скачивать контент, работать по API с озвучкой, добавлять эффекты к картинкам и текстам можно и ЗенноПостером, но были причины, которые требовали добавить в проект Python, а именно библиотеки для улучшения качества картинок, подсветка субтитров и, главное, детект таймстемпа лучшего фрагмента в музыкальном треке. Поэтому я собрал довольно сложный комбайн, где за одну часть отвечает Python, который запускается ЗенноПостером по расписанию, а потом созданный контент публикуется на YouTube опять же ЗенноПостером. Так мне удобнее.

2025-12-20_12-50-26.jpg


Вкратце процесс построен так:
  1. Я добавляю в список идеи новых роликов.
  2. ЗП запускает первый питон скрипт, который делает запрос к Gemini с контекстом базы песен, нужного формата данных и получает JSON с параметрами будущего ролика (текст, картинки, фоны, цвета, продолжительности сцен и т. д.)
  3. Сразу запускается второй скрипт, который скачивает все необходимые ресурсы локально в папки. Если картинки низкого качества, а у моего донора часто так и бывает, то апскейлим до нужного размера либой Waifu2x.
  4. Если скачивание ресурсов прошло без ошибок, то запускается третий скрипт, который на основе JSON с разметкой и ресурсов создаёт итоговый mp4. На первом этапе он анализирует все треки, определяет секунды начала наиболее цепляющего фрагмента (не всегда удачно, но об этом ниже), отправляет текста по АПИ в ElevenLabs, формирует субтитры с подсветкой, накладывает эффекты, переходы, понижает громкость музыки во время речи и т. д.
  5. Зенка заходит на YouTube, загружает ролик, заполняет все текстовые поля из JSON данных, добавляет теги, отмечает нужные чекбоксы и отправляет видео на публикацию.
Сразу скажу, схема довольно сложная, много внешних ресурсов, которые не добавляют системе стабильности, поэтому иногда что-то отваливается, зависает, ошибки обрывают процесс. Фиксить приходится регулярно. Но, тем не менее, этот заводик отнимает намного меньше времени и в этом я вижу небольшие, но интересные перспективы. Внутри проекта есть несколько ответвлений или сценариев позволяющих создавать контент немного разного характера. У меня есть ТОПы с разными прикольными фактами (например, топ групп у которых есть участники инвалиды, или топ групп, которые создали новый музыкальный жанр), это мой любимый формат. Есть сравнения, баттлы, типа Metallica vs Megadeth. Есть подборки по годам и по жанрам. Есть подборки песен по конкретному исполнителю, например лучшие баллады Scorpions. Короче, я примерно прикинул, идей у меня как минимум на 1000 роликов, а можно добавить ещё и квизы, которые я скоро добавлю.

2025-12-20_12-50-01.png


Фидбек от слушателей довольно позитивный. Лайков обычно более 95%. Было пара негативных комментариев на ошибки в произношении имён (да TTS всё ещё далеки от идеала) и ошибки в фактах (неправильно назван год выпуска альбома), но в общем фанаты рок-музыки настроены очень доброжелательно, жаль что это пока не приводит к росту подписной базы.

Основная проблема при автоматизации такого креативного пересоздаваемого контента - это найти такие фрагменты, эпизоды, которые с наибольшей вероятностью зацепят зрителя. Борьба идёт за внимание зрителя, которого нужно заинтересовать в первую же секунду видео. И если вставлять трек на случайной секунде, то вероятность попасть в заданные 7 секунд на нудное соло или унылое вступление, очень высокая. А если даже половина коротких вставок будет вызывать мысли: “знакомый мотив, откуда он?”, то это резко повышает риск свайпа и негативного взаимодействия с моим контентом. Мне нужно чтобы любой зритель услышав рифф или припев мгновенно бы получал свежую дозу дофамина и приступ ностальгии.

В нарезках видосов Ютуба это решается тепловой картой (это такие серые графики, которые всплывают при наведении курсора на прогресс-бар видео). Но как найти самые цепляющие моменты в mp3? Я перерыл весь интернет и не нашёл решения. Логичным выглядело хотя бы определение куплетов и припевов и затем воспроизведение 7-мисекундного фрагмента в найденное время. Но, к сожалению, не существует ни одной рабочей библиотеки, которая разделяет трек, даже с большой погрешностью, на смысловые части. Пришлось придумывать свой велосипед. Самый простой вариант - найти время вокальной партии. Но и это оказалось не просто. Я потратил кучу времени, замучил все доступные мне нейронки, перепробовал десятки вариантов тепловых карт и хитрых алгоритмов, но результаты были слишком случайными. В рок музыке очень плотная стена звука и алгоритмам тяжело понять где начинается один фрагмент и заканчивается другой. Тогда я придумал отделять вокал от основного трека, определять вокал во временном файле и потом по полученным таймстампам обрезать основной трек, это в разы повысило точность определения вокала и в принципе этим методом я и пользуюсь сейчас. Он до сих пор не идеален, но в 80% случаев даёт приемлемый результат, в оставшихся 20% случаев рандом между 20 и 60 секундой в принципе часто удовлетворяет требованиям.

2025-12-20_12-57-34.jpg


Естественно у многих возникнет вопрос, ну с Зенкой понятно, ничего сложного, а как ты написал кучу этих питон скриптов? Да, я совсем не спец по питону, впрочем и не по многим другим языкам, на которых я сейчас успешно пилю довольно сложные проекты, но благодаря так называемому вайбкодингу, это уже не является проблемой. Более того, это мне настолько нравится, настолько вдохновляет и доставляет наслаждение, что я не мог не добавить в статью несколько абзацев по этому феномену. Обладая навыками вайбкодинга можно не ограничивать себя технологиями. Например, когда-то тот же TypeScript я так и не смог осилить, но теперь это и не важно - обладая базовыми познаниями в языке и фундаментальными в архитектуре и процессах приложений я могу создавать проекты, которые раньше могла месяцами делать небольшая команда профессионалов.

Несколько моих персональных советов начинающим вайбкодерам:
  1. Используйте Git. Даже если вы не знаете все команды, гит поможет вам в разы увеличить свою продуктивность. Даже используя его только как сохранение в играх, вы в убережётесь от значительных потерь когда нейронка в очередной раз захочет “оптимизировать” вполне рабочий функционал.
  2. Напишите хорошие системные промпты, примеров полно в сети. Это позволит не только быстрее получать нужный результат и более качественный код, это просто сэкономит токены, что совсем не так очевидно, ведь регулярно расширяя свой контекст системными промптами вроде бы должны быть дополнительные затраты, но нет, это работает наоборот. Также создавай свои правила в .md файлах, за основу можно взять эти изменив их под себя (например вот для C# https://cursor.directory/.NET)
  3. Используй локальные модели, если позволяет комп или есть хотя бы старая видеокарта. Для некоторых несложных задач по фронтенд или классификации какой-нибудь Qwen вполне может выдавать хороший результат. Сравни по рейтингу в LMStudio модели которые запустятся у тебя и подрубай их к своей IDE .
  4. Фронтендерам, верстальщикам, мобильным разработчикам, в общем всем кто чаще использует UI и браузер рекомендую последний Курсор в режиме встроенного браузера - так можно быстро выделить проблемный или исправляемый элемент и передать его контекст в чат с агентом.
  5. Лучше писать промпты на английском. Это и экономия в токенах, и лучшее понимание тебя нейронками (но не факт что удастся точнее выразить мысль), и прокачка знаний языка. Но если используете Kilo Code к примеру, то там есть улучшатель промпта, который переведёт ваш базовый промпт и значительно оптимизирует его.
  6. ОпенРоутер поможет тебе оплачивать токены по низкой цене, либо вообще юзать некоторые модели бесплатно.
  7. Насчёт оплаты из РФ. Пока самый рабочий вариант это юзать Plati маркет. Например пот эту подписку на Claude Code я приобретал и продляю только там, получается даже выгоднее чем оплачивать через виртуальные зарубежные карты. Или годовая подписка на GPT-5.2 выгоднее оплат через чат-ботов или сервисы.
Мой топ инструментов для вайбкодера, которыми я регулярно пользуюсь прыгая с одного на другой:
  1. Cursor
  2. VS Code + KiloCode + Gemini Code Assist
  3. Claude Code (и Web версия в том числе).
  4. Google AI Studio
Также юзал разные CLI, а ещё Factory и Bolt, но они не прижились.

Резюмируя

Несмотря на крайне скромный успех моего канала (особенно на фоне других успешных каналов), я не теряю оптимизма. Мне по прежнему интересно им заниматься, добавлять новые фичи, хуки, зацепки. Простор для роста огромный и масштабирование канала я вижу в таких направлениях как квизы/викторины (угадай группу за 3 секунды, угадай песню по риффу), нарезки видео с клипов, новые направления, например супер-популярная поп и танцевальная музыка, другие языки кроме английского, длинные видео. Ну и конечно, перезалив готового контента в другие соц. сети, а ролики сейчас принимают масса других популярных сеток, от Pinterest до Facebook.

Мы переживаем сейчас эпоху кардинальных изменений, которые переворачивают наше мировоззрение, подходы, убеждения буквально в течении года. Постоянные ужесточения, ограничения, блокировки закаляют нашу психику, укрепляют дух и прокачивают скиллы. Из трёх моих основных направлений (SEO, SMM, AI) первое постепенно теряет актуальность или становится всё более сложным, но трафик с веба не исчезает, он растёт и моё внимание перетекает в другие два направления. Трафик с нейронок является другой важной составляющей повседневной работы, но об этом в других будущих статьях в наступающем году.

С Новым 2026 годом!
 
Последнее редактирование:

vicos

Client
Регистрация
06.02.2017
Сообщения
156
Благодарностей
465
Баллы
63
Снимаю шляпу перед твоим упорством, желаю дальнейших успехов.
С наступающим Новым Годом :-)
 
  • Спасибо
Реакции: Dmitriy_Zenno и Astraport

GeGold

Client
Регистрация
28.09.2015
Сообщения
839
Благодарностей
384
Баллы
63
Можно немного поворчать?

Цель то какая сего мероприятия? Получение просмотров? Закрытие хотелки?

Посмотрел график, ну там всё плохо для шорта и тем более для буржа.

Просто столько сложностей, пытаюсь понять зачем?
 
  • Спасибо
Реакции: AlisaZ

Astraport

Client
Регистрация
01.05.2015
Сообщения
5 066
Благодарностей
4 580
Баллы
113
Посмотрел график, ну там всё плохо для шорта и тем более для буржа.
Согласен, но если бы цель была получить лайки/просмотры/подписки, то я бы выбрал нейро-котиков или продолжил развивать канал с приколами/анекдотами, опыт в такой генерации большой и задел позитивный. Тут я решил начать с нуля. ИМХО лучше 3 посетителя на канале брокерских инсайдов Нью-йорка, чем 1000 юзеров на канале с поеданием дошираков.

Цель проекта я в принципе описал в статье, но можно и повторить - это навайбкодить автономную, практически полностью автоматизированную систему по созданию и публикации контента. Она создана. Контент вполне качественный (кстати, нейрогенерации сейчас встречают всё больше отторжения у зрителей и это будет тренд 2026 года), что подтверждается статой. А то, что рост медленный, просмотров мало, ну так тематика такая, не особо хайповая и рассчитанная на аудиторию от 40 и старше, канал нулевой (возраст канала обычно должен быть от года, а тут 2,5 месяца).

Эти наработки я потом использую и в других проектах. Например создание роликов по статье, принцип такой же: сложная склейка фонового динамического нейро-видео со звуковыми эффектами, фоновой музыки, картинок по теме, речи, текстовых субтитров с подсветкой (кстати, это не либа и не сервис, кодил сам), эффектов, частиц и переходов. Такие ролики служат прокачкой SEO факторов, удержанию юзера на странице, повышению ПФ.

Ну и параллельно я прокачиваю скиллы в вайбкодинге, тренирую насмотренность на тренды, технологии, методы и подходы в SMM.
 
  • Спасибо
Реакции: LaGir, GeGold и volody00

S10n4eg

Client
Регистрация
25.06.2014
Сообщения
341
Благодарностей
61
Баллы
28
Здравствуйте, гугл не любит автоматизацию, как вы это делаете? - Зенка заходит на YouTube, загружает ролик, заполняет все текстовые поля из JSON данных, добавляет теги, отмечает нужные чекбоксы и отправляет видео на публикацию.
 

Astraport

Client
Регистрация
01.05.2015
Сообщения
5 066
Благодарностей
4 580
Баллы
113
гугл не любит автоматизацию, как вы это делаете?
Поэтому и делаю через Зенку. А что именно не понятно? Это самая простая часть процесса. Подгружается зеннопрофиль, открывается YT, файл в кубик "Загрузить на сервер", клик по кнопке, заполнение полей в мастере.
 

S10n4eg

Client
Регистрация
25.06.2014
Сообщения
341
Благодарностей
61
Баллы
28
Поэтому и делаю через Зенку. А что именно не понятно? Это самая простая часть процесса. Подгружается зеннопрофиль, открывается YT, файл в кубик "Загрузить на сервер", клик по кнопке, заполнение полей в мастере.
Да вот думаю что гугл палит это все дело и потом может влепить за автоматизацию бан
 
  • Спасибо
Реакции: AlisaZ

deukech

Client
Регистрация
11.09.2014
Сообщения
227
Благодарностей
153
Баллы
43
  • Спасибо
Реакции: Astraport

Astraport

Client
Регистрация
01.05.2015
Сообщения
5 066
Благодарностей
4 580
Баллы
113
Бана точно не будет, а вот массовая заливка выглядит не естественно и, не важно по АПИ или через браузер, может привести к фильтру и снижению показов в ленте.
 

GeGold

Client
Регистрация
28.09.2015
Сообщения
839
Благодарностей
384
Баллы
63
Бана точно не будет, а вот массовая заливка выглядит не естественно и, не важно по АПИ или через браузер, может привести к фильтру и снижению показов в ленте.

Год назад при массовой заливке меня выбросило из акка по причине взлома, пришлось восстановливать акк, если память не изменяет примерно 15 роликов за 4-6 часов, шорты
 
  • Спасибо
Реакции: Astraport

volody00

Client
Регистрация
06.09.2016
Сообщения
989
Благодарностей
1 105
Баллы
93
  • Спасибо
Реакции: GeGold и Astraport

Astraport

Client
Регистрация
01.05.2015
Сообщения
5 066
Благодарностей
4 580
Баллы
113

GeGold

Client
Регистрация
28.09.2015
Сообщения
839
Благодарностей
384
Баллы
63
  • Спасибо
Реакции: AlisaZ и volody00

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)