Парсинг субтитров с роликов Ютуб

  • Автор темы Автор темы footashes
  • Дата начала Дата начала

footashes

Client
Регистрация
20.02.2015
Сообщения
1 054
Реакции
440
Баллы
83
Сообщение от модератора: Автор 2 месяца не выходит на связь. Прошу воздержатся от покупки.


utube.jpg


Ещё один метод добычи контента - субтитры с youtube.com, которые не индексируются поисковыми системами, сам youtube автоматически их создает при добавлении любого видео на сайт. Такой контент зачастую уникален, но требует небольшой ручной доработки. Неплохо себя показывает в Дзен и на сайтах.
Screenshot_1.jpg



Screenshot_2.jpg



Screenshot_3.jpg
Пример работы шаблона. Видео берутся не более 5 минут:

Для парсинга использовалась версия ZennoPoster (V7 beta) RU 5.30.0.0. Шаблон работает в один поток через вебверсию. Более и не требуется. Шаблон открытый и будет дорабатываться, если будет спрос.

Цена - 250 рублей. Шаблон полностью открытый и без привязок.

Внимание - отключите блокировщик, иначе вы не увидите ссылку на магазин и сам магазин при переходе может не показать ссылку на скачивание! Пишите на емайл: footashes@gmail.com или в телеграмм.

Telegram чат для поддержки:
https://t.me/webarhives

Парсинг субтитров с Ютуб - https://catcut.net/product/36195

Для дополнительного источника парсинга контента и проверку на уникальность можно использовать WebArchiveMaster - парсер Вебархива
 
Последнее редактирование модератором:
Яндекс дзен палит а значит и яндекс.
Просто находил ресурсы где автоматом лежат тексты с субтитров отдельно.
Может по этому находил не уник.
Пробовал 1.5 года назад. Но попробовать можно.
 
Последнее редактирование:
Яндекс дзен палит а значит и яндекс. Пробовал 1.5 года назад. Но попробовать можно.
Там много тонкостей, не только в тексте. Например, все каналы, которые использовали телефон через сервис приема смс разом ушли под фильтр, а каналы со своими симками с лютым текстом живут. Яндекс видимо видит всю активность пользователя за несколько лет назад и казнит или милует.
 
У мен зенка версии 5.29.7.0, будет работать шаблон с ней?
 
Разве с "дзена" еще, что-то можно заработать?
 
Разве с "дзена" еще, что-то можно заработать?
Там есть трафик, значит нужно тестировать и придумать слив. Ну или выводить на монету и получать свои 50 рублей в день.
 
Там есть трафик, значит нужно тестировать и придумать слив. Ну или выводить на монету и получать свои 50 рублей в день.
Не хотите на zp сделать автопостер с дзен за символическую сумму? Я бы приобрел шаблон, думаю многим будет интересно.
 
Не знаю, проверялась на ZennoPoster (V7 beta) RU 5.30.0.0
Можете проверить работу на версии 5.29.7.0, так как чуть не оплати, а потом вспомнил про версию и решил спросить.
Если дадите добро сразу оплачу
 
Не хотите на zp сделать автопостер с дзен за символическую сумму? Я бы приобрел шаблон, думаю многим будет интересно.
Давно делал, постинг статей и создание фотодорвеев - https://zen.yandex.ru/media/id/5a72...rtinki-s-recenziiami-5ab892770422b4b92539f785. Залетали на монету за несколько часов. Сейчас алгоритмы сто раз поменялись. Сам шаблон входит в
WebArchiveMaster - парсер Вебархива, но явно требует доработки. Сейчас с автоматизацией лучше не лезть.
 

Вложения

  • Zen.rar
    Zen.rar
    198,1 KB · Просмотры: 502
  • Спасибо
Реакции: MasterX
Можете проверить работу на версии 5.29.7.0, так как чуть не оплати, а потом вспомнил про версию и решил спросить.
Если дадите добро сразу оплачу
Шаблон открытый, там ничего сложного нет, всегда можно поправить под себя.
 
Шаблон открытый, там ничего сложного нет, всегда можно поправить под себя.
Я не силен в этом и поэтому пользуюсь только готовыми шаблонами, которые не нужно переделывать под себя
 
Посмотреть вложение 49982

Ещё один метод добычи контента - субтитры с youtube.com, которые не индексируются поисковыми системами, сам youtube автоматически их создает при добавлении любого видео на сайт. Такой контент зачастую уникален, но требует небольшой ручной доработки. Неплохо себя показывает в Дзен и на сайтах.
Пример работы шаблона. Видео берутся не более 5 минут:

Для парсинга использовалась версия ZennoPoster (V7 beta) RU 5.30.0.0. Шаблон работает в один поток через вебверсию. Более и не требуется. Шаблон открытый и будет дорабатываться, если будет спрос.

Парсинг субтитров с Ютуб - catcut.net/product/35261

Для дополнительного источника парсинга контента и проверку на уникальность можно использовать WebArchiveMaster - парсер Вебархива
купил, спасибо, а на инглише работает? Или можно (и других языках) сделать если нет?
 
Последнее редактирование:
А если более 5 минут, то не работает?
Больше 5 минут просто незачем.

Обновление - версия "Субтитры Ютуб v1.4"
- поправлен canvas
- зафиксировано разрешение экрана, так-как при плавающем разрешении ютуб подсовывал div, которые не брал даже xpath
- теперь можно выбрать язык, на каком парсить текста - русский или английский. Если выбран определенный язык, шаблон проверит и сравнит
- ускорена загрузка за счет отключений ненужного

Это альфа версия, к тому же ютуб любит менять верстку. Кто хочет поучаствовать в развитии, велкам. Лишний источник текста лишним все-равно не будет. Например, после дополнительной обработки текста, можно использовать как модуль своего дорвея для полусерых дорвеев. Раньше было нечто похожее - парсится ссылка на ролик, и с этого же ролика забирается текст, который идет как статья. Много чего можно придумать.

П.С.
Кто брал в магазине, пришлите свои емейл для рассылки на footashes@gmail.com

П.П.С
.
Разбирал свои каналы Дзен и нашел свой заброшенный канал на статьях из Вебархива, на который уже чуть не год идет с поиска по 100-200 человек по ключам. Сразу не стреляет, значит забрасывается. Сейчас буду думать, какие ссылки туда воткнуть.
Screenshot_44.jpg
 
  • Спасибо
Реакции: Zennovods
Отправил всем.
Новая версия Субтитры Ютубv1.4.
Часть парсинга на русском по ключу "женская психология" с диапозоном 300 (оптимально, если нужны большие статьи, можно ставить 500 и более).
Screenshot_1.jpg

Для дополнительного источника парсинга контента и проверку на уникальность можно использовать WebArchiveMaster - парсер Вебархива
 

Вложения

  • Спасибо
Реакции: vadimlgg2
А как купить то? с какой минимальной версией зп будет работать?
 
А тем, кто купил до обновления, где брать скачать обновление? На мыло запрос отправил, в ответ тишина. Тут писал, сообщения удаляют, типа флуд. Но я же про обновление спрашивал
 
Купил, спасибо, буду тестировать!
 
Del
 
Последнее редактирование:
А тем, кто купил до обновления, где брать скачать обновление? На мыло запрос отправил, в ответ тишина. Тут писал, сообщения удаляют, типа флуд. Но я же про обновление спрашивал
Вы ничего не спрашивали. Если автор игнорит вас по почте, то так и пишите дословно. А не "отправил запрос на мыло". Такие сообщения я расцениваю как флуд. Выражайтесь более конкретно.
 
  • Спасибо
Реакции: CER и Evgeny
Обновление получил, автору спасибо. Такой вопрос до всех: у меня не привязывается Яндекс Дзен канал к Метрике, горит красным. В чем проблема? Номер счетчика прописал, все сделал как нужно. Или нужно чтобы пошел трафик? Спасибо за ответы!
 
@footashes отправьте, пожалуйста, новую версию 1.4 - я покупатель, отписал вам на почту! Спасибо !
 
@footashes отправьте, пожалуйста, новую версию 1.4 - я покупатель, отписал вам на почту! Спасибо !
Зачем вы это здесь пишите?
__
Все кто пишут, отправьте, оплатил, вышлите обнову.
Это будет ваше последнее сообщение в теме.
 
  • Спасибо
Реакции: vadimlgg2
Завтра поставлю эту версию и проверю.
Вы обещали протестировать ваш шаблон на версии зенки 5.29.7.0 .
Видно не судьба.
Наверное в моей покупке этого шаблона автор не заинтересован, а жаль.
Если вы будете разбрасываться покупателями, денег не прибавиться.
 
У кого работает?
У меня пишет всю дорогу что "субтитры не найдены" даже по ключу из мануала
 
Новая версия "Субтитры Ютуб 1.5". Тестировалась сутки на версии ZennoPoster (V7 beta) RU 5.30.0.0 без ошибок. На более низких версиях точно не пойдет из-за BOT UI. Более высокие явно зависят от версии. Всем отправил. По вопросам пишите: footashes@gmail.com

Добавлен выбор продолжительности ролика:
Screenshot_1.jpg

1.jpg


2.jpg
 
Последнее редактирование:
Я попробовал 1 ключ, смотрю в логах пишет 1 секунда, 3 секунды, ну и так до 33 секунд. Типа мало времени в ролике.
Пошел смотреть эти ролики. Оказывается там везде реклама в начале ролика вот как раз эти секунды. Получается шаблон считывает время рекламное и пишет что ролики не хорошие.
Хотя они реально годные.
 

Кто просматривает тему: (Всего: 0, Пользователи: 0, Гости: 0)