- Регистрация
- 01.05.2015
- Сообщения
- 5 066
- Благодарностей
- 4 580
- Баллы
- 113
Вы не задавались вопросом: вот миллионы просмотров и тысячи лайков у короткого ролика на YouTube, почему же автор канала, где таких роликов сотни, не миллионер? Почему внимание миллионов пользователей не конвертируется в миллионы зеленых бумажек? Причины многие понимают. Нет активной ссылки, нет слива, аудитория не прогрета, развлечение != покупка. Так как же создавать такие ролики, которые принесут хороший конверт в продажи? Как сливать аудиторию с коротких роликов на своём канале и как конвертировать просмотры в лиды? Этими вопросами я давно задавался и поэтому решил создать новый, более "материальный" канал на Ютубщине.
Я уже рассказывал в одном из предыдущих конкурсов о своих экспериментах с шортсами на YouTube. Тогда мне удалось легко набирать по несколько десятков тысяч просмотров на одном ролике, а счётчик некоторых роликов перевалил за 600к. Однако просмотры у новых роликов начали падать, нейрогенерации прикольных сцен с котиками и анекдотов стало много в тик-токах и рилсах, аудитория развлекалова никак не хотела даже подписываться на ТГ канал и я охладел к теме, забросил канал. Особенно меня напрягала ручная рутина, которая присутствовала несмотря на автоматизацию Зенкой. Просмотреть ролики, исправить промпты, откорректировать сценарий, склеить сцены - всё это было поначалу интересной игрой в режиссера, но потом наскучило. Да и тратить по 1-2 часа на ролик мне совсем не хотелось.
Однако, был у меня и другой pet-проект связанный со старым хобби любви к рок-музыке, о котором я тоже успел рассказать в одном конкурсе. И у меня зачесались руки накодить какую-нибудь сложную автоматизацию для создания роликов по музыке. Был у меня на примете один сайтик на котором была собрана достаточно большая коллекция mp3 различных групп хорошо систематизированных по альбомам, годам и жанрам. На основе этой информации я и начал агрегировать подборки, сравнения и ТОПы, которые должны были быть интересны меломанам со всего мира, так как в этом проекте моё ГЕО не было ограничено только русскоговорящей аудиторией, которая, к слову, резко сдулась за последний год (спасибо замедлителям).
Критерии для нового проекта были такие:
- Это должно нравится мне.
- Полная автоматизация (ну или с минимальными ручными действиям, не более 2-3 часа в неделю).
- Что-то новое, незаезженное.
- Бурж аудитория.
- Без голимой, надоедшей нейрогенерации.
- Возможность масштабирования контента вплоть до тысячи видосов на канал.
Вкратце процесс построен так:
- Я добавляю в список идеи новых роликов.
- ЗП запускает первый питон скрипт, который делает запрос к Gemini с контекстом базы песен, нужного формата данных и получает JSON с параметрами будущего ролика (текст, картинки, фоны, цвета, продолжительности сцен и т. д.)
- Сразу запускается второй скрипт, который скачивает все необходимые ресурсы локально в папки. Если картинки низкого качества, а у моего донора часто так и бывает, то апскейлим до нужного размера либой Waifu2x.
- Если скачивание ресурсов прошло без ошибок, то запускается третий скрипт, который на основе JSON с разметкой и ресурсов создаёт итоговый mp4. На первом этапе он анализирует все треки, определяет секунды начала наиболее цепляющего фрагмента (не всегда удачно, но об этом ниже), отправляет текста по АПИ в ElevenLabs, формирует субтитры с подсветкой, накладывает эффекты, переходы, понижает громкость музыки во время речи и т. д.
- Зенка заходит на YouTube, загружает ролик, заполняет все текстовые поля из JSON данных, добавляет теги, отмечает нужные чекбоксы и отправляет видео на публикацию.
Фидбек от слушателей довольно позитивный. Лайков обычно более 95%. Было пара негативных комментариев на ошибки в произношении имён (да TTS всё ещё далеки от идеала) и ошибки в фактах (неправильно назван год выпуска альбома), но в общем фанаты рок-музыки настроены очень доброжелательно, жаль что это пока не приводит к росту подписной базы.
Основная проблема при автоматизации такого креативного пересоздаваемого контента - это найти такие фрагменты, эпизоды, которые с наибольшей вероятностью зацепят зрителя. Борьба идёт за внимание зрителя, которого нужно заинтересовать в первую же секунду видео. И если вставлять трек на случайной секунде, то вероятность попасть в заданные 7 секунд на нудное соло или унылое вступление, очень высокая. А если даже половина коротких вставок будет вызывать мысли: “знакомый мотив, откуда он?”, то это резко повышает риск свайпа и негативного взаимодействия с моим контентом. Мне нужно чтобы любой зритель услышав рифф или припев мгновенно бы получал свежую дозу дофамина и приступ ностальгии.
В нарезках видосов Ютуба это решается тепловой картой (это такие серые графики, которые всплывают при наведении курсора на прогресс-бар видео). Но как найти самые цепляющие моменты в mp3? Я перерыл весь интернет и не нашёл решения. Логичным выглядело хотя бы определение куплетов и припевов и затем воспроизведение 7-мисекундного фрагмента в найденное время. Но, к сожалению, не существует ни одной рабочей библиотеки, которая разделяет трек, даже с большой погрешностью, на смысловые части. Пришлось придумывать свой велосипед. Самый простой вариант - найти время вокальной партии. Но и это оказалось не просто. Я потратил кучу времени, замучил все доступные мне нейронки, перепробовал десятки вариантов тепловых карт и хитрых алгоритмов, но результаты были слишком случайными. В рок музыке очень плотная стена звука и алгоритмам тяжело понять где начинается один фрагмент и заканчивается другой. Тогда я придумал отделять вокал от основного трека, определять вокал во временном файле и потом по полученным таймстампам обрезать основной трек, это в разы повысило точность определения вокала и в принципе этим методом я и пользуюсь сейчас. Он до сих пор не идеален, но в 80% случаев даёт приемлемый результат, в оставшихся 20% случаев рандом между 20 и 60 секундой в принципе часто удовлетворяет требованиям.
Естественно у многих возникнет вопрос, ну с Зенкой понятно, ничего сложного, а как ты написал кучу этих питон скриптов? Да, я совсем не спец по питону, впрочем и не по многим другим языкам, на которых я сейчас успешно пилю довольно сложные проекты, но благодаря так называемому вайбкодингу, это уже не является проблемой. Более того, это мне настолько нравится, настолько вдохновляет и доставляет наслаждение, что я не мог не добавить в статью несколько абзацев по этому феномену. Обладая навыками вайбкодинга можно не ограничивать себя технологиями. Например, когда-то тот же TypeScript я так и не смог осилить, но теперь это и не важно - обладая базовыми познаниями в языке и фундаментальными в архитектуре и процессах приложений я могу создавать проекты, которые раньше могла месяцами делать небольшая команда профессионалов.
Несколько моих персональных советов начинающим вайбкодерам:
- Используйте Git. Даже если вы не знаете все команды, гит поможет вам в разы увеличить свою продуктивность. Даже используя его только как сохранение в играх, вы в убережётесь от значительных потерь когда нейронка в очередной раз захочет “оптимизировать” вполне рабочий функционал.
- Напишите хорошие системные промпты, примеров полно в сети. Это позволит не только быстрее получать нужный результат и более качественный код, это просто сэкономит токены, что совсем не так очевидно, ведь регулярно расширяя свой контекст системными промптами вроде бы должны быть дополнительные затраты, но нет, это работает наоборот. Также создавай свои правила в .md файлах, за основу можно взять эти изменив их под себя (например вот для C# https://cursor.directory/.NET)
- Используй локальные модели, если позволяет комп или есть хотя бы старая видеокарта. Для некоторых несложных задач по фронтенд или классификации какой-нибудь Qwen вполне может выдавать хороший результат. Сравни по рейтингу в LMStudio модели которые запустятся у тебя и подрубай их к своей IDE .
- Фронтендерам, верстальщикам, мобильным разработчикам, в общем всем кто чаще использует UI и браузер рекомендую последний Курсор в режиме встроенного браузера - так можно быстро выделить проблемный или исправляемый элемент и передать его контекст в чат с агентом.
- Лучше писать промпты на английском. Это и экономия в токенах, и лучшее понимание тебя нейронками (но не факт что удастся точнее выразить мысль), и прокачка знаний языка. Но если используете Kilo Code к примеру, то там есть улучшатель промпта, который переведёт ваш базовый промпт и значительно оптимизирует его.
- ОпенРоутер поможет тебе оплачивать токены по низкой цене, либо вообще юзать некоторые модели бесплатно.
- Насчёт оплаты из РФ. Пока самый рабочий вариант это юзать Plati маркет. Например пот эту подписку на Claude Code я приобретал и продляю только там, получается даже выгоднее чем оплачивать через виртуальные зарубежные карты. Или годовая подписка на GPT-5.2 выгоднее оплат через чат-ботов или сервисы.
- Cursor
- VS Code + KiloCode + Gemini Code Assist
- Claude Code (и Web версия в том числе).
- Google AI Studio
Резюмируя
Несмотря на крайне скромный успех моего канала (особенно на фоне других успешных каналов), я не теряю оптимизма. Мне по прежнему интересно им заниматься, добавлять новые фичи, хуки, зацепки. Простор для роста огромный и масштабирование канала я вижу в таких направлениях как квизы/викторины (угадай группу за 3 секунды, угадай песню по риффу), нарезки видео с клипов, новые направления, например супер-популярная поп и танцевальная музыка, другие языки кроме английского, длинные видео. Ну и конечно, перезалив готового контента в другие соц. сети, а ролики сейчас принимают масса других популярных сеток, от Pinterest до Facebook.
Мы переживаем сейчас эпоху кардинальных изменений, которые переворачивают наше мировоззрение, подходы, убеждения буквально в течении года. Постоянные ужесточения, ограничения, блокировки закаляют нашу психику, укрепляют дух и прокачивают скиллы. Из трёх моих основных направлений (SEO, SMM, AI) первое постепенно теряет актуальность или становится всё более сложным, но трафик с веба не исчезает, он растёт и моё внимание перетекает в другие два направления. Трафик с нейронок является другой важной составляющей повседневной работы, но об этом в других будущих статьях в наступающем году.
С Новым 2026 годом!
Последнее редактирование:


