Продажи шаблона Google-Translate (Гугл Переводчик), скорость: 20 млн ключей/час, с прокси, без API

Здравствуйте!
У меня такие требования к переводу
Есть файлы с html разметкой
Файлы большие, 50 - 100 тысяч символов.
Их нужно перевести на другой язык с сохранением html разметки
Подойдет ли шаблон для перевода?
Можно ли ссылку на мануал, чтобы почитать, как работать с шаблоном?
Спасибо
1) Здравствуйте. Подойдет. Но только если вы уверены, что там нет ошибок в верстке. Иначе я бы рекомендовал разбить этот файл на мелкие файлы под каждую статью в нем. Подробнее почему так лучше описано в стартпосте в разделе "СПОЙЛЕР: #5. СКРИНШОТЫ «ВХОДНЫЕ НАСТРОЙКИ» С КУЧЕЙ НАСТРОЕК:" на скриншоте с настройкой #8.6. Те скриншоты в комбинации с видео можно считать "мануалом" для шаблона. Они правда могут чуть устареть, ибо шаблон периодически обновляется, но логика там раскрыта. Шаблон можно купить с возможностью манибека в течении 14 дней. Так что нет проблем вернуть деньги если не подойдет.
--------------------------------------------------------------------
2) Zennoposter шаблон Google-Translate (Гугл Переводчик) от orka13 3.07 (25.05.2020 )
Гугул начал жестче банить прокси при использовании перевода, так что бесплатные прокси теперь подойдут разве что для небольших объёмов работ. Сделал кое-какие правки:
[+] Включил CookieContainer. Раньше от него толку не было, посмотрим поможет ли уменьшить баны сейчас. Учтите, что из-за него шаблон не запустится на древних версиях старше ZennoPoster 5.18.0.0 (28.06.2018 ).
[*] Обновил содержание файла «\Input\Useragents.txt» более свежими данными.
[*] Исправил режим «#3.3 [IN_Debug_Mode]», а то раньше он не логировал данные для режима «Проект в проекте». Включайте этот режим, если возникают проблемные ситуации с переводом. Логи помогут локализировать причину.
[*] Актуализировал значение переменных по умолчанию для режима «проект в проекте». А то если пользователь забыл передать важные переменные из родительского шаблона, то шаблон ставил очень старые значения. Например: переменная «IN_Bad_Proxy_Cycle_Max» инициализировалась со значением «30», а на сегодняшний день актуально где-то «200».
[+] Добавил в мануал в телеграмм-группе инструкцию «Как получить проверенные бесплатные прокси с высоким КПД».

Для обновления владельцам ZennoPoster надо перекачать архив (по той ссылке, которую они получали после покупки) и извлечь оттуда файл «G_Google_Translate_by_orka13_V_3.07.xmlz» в свою папку с шаблоном. Владельцам ZennoBox хватит просто перезапустить программу.
Внимание: «Входные параметры» могут при этом «сбросится».
----------------------------------------------------------------------
3) Просили в группе сделать замер разницы скорости работы с бесплатными и платными прокси. Поэтому сегодня провёл эксперимент.
На входе:
200 *.txt файлов размером по 1 мб (200 мегабайт в сумме). Это столбики текстовки (1-3 предложения в строке) и ключей под доры.
Направление перевода: EN > SV.
Потоков: 100.
Настройки почти все по умолчанию. Только в настройках прокси задал чтобы сразу брало прокси, не используя основной IP, и отключил ротацию прокси, чтобы увидеть сколько строк с прокси было взято из файла.

Платные прокси. socks5, пул на 10К прокси (90% процентов рабочие), 200$/месяц, продавца не раскрываю. В группе пишут что хватит и дешевле в 10 раз взять, у меня просто они под другую задачу покупались:
Потраченное время: 25 минут
Из файла с прокси взято 1100 строк. В файле было 10К уникальных строк, размноженные до 200К. То есть даже по второму кругу не пришлось использовать прокси.
1_платныепрокси.png

Бесплатные прокси. Ручками собрал из двух сайтов-источников, которые описаны в мануале к шаблону, перемешал, удалил дубли (15К уникальных строк получилось), размножил до 200К и залил в файл. Заняло дополнительно лишние 5 минут. Таких прокси обычно хватает на сутки активной работы шаблона, потом желательно заменить свежими.
Потраченное время: 80 минут
Из файла с прокси взято 10000 строк.
прокси-фри.png

Вывод: на платных прокси быстрее в ~3 раза, но они не обязательны.
 
Последнее редактирование:
  • Спасибо
Реакции: Astraport и vesb
G_Google_Translate_by_orka13_V_3.08.xmlz (20.07.2020 )
[+] Добавил остановку потоков (StopTask) при окончании входящих файлов. То есть можете ставить завышенное значение в поле ZennoPoster «сколько делать», шаблон нормально остановится.
[*] Исправил игнорирование перевода нестандартных симвлов (иероглифы китайского и подобных языков) в HTML-режиме.
[*] Исправил лишние потребление ресурсов, так как в версии 3.08 ошибочно включил «браузерный» режим.
[*] Мелкие правки в интерфейсе входящих настроек.


Напомню, что недавно создал отдельный топик:
DeepL Переводчик: переводит TXT, HTML файлы без API (браузерный Zennoposter шаблон)
там можно получить скидку, если вы уже владелец гугл-переводчика.
 
Последнее редактирование:
  • Спасибо
Реакции: vesb
Попросил тут меня будущий покупатель показать ему качество перевода последней версии шаблона в направлении языков «польский > русский». Ну я заодно решил и скорость проверить, а то есть обращения что гугл все чаще требует покачественнее прокси под перевод. Получилось что-то вроде того эксперимента что двумя постами выше.
На входе 1119 файлов с мелкими HTML-статьями под импорт в WP или ему подобные движки (заголовок <h1> + несколько абзацев <p>). В сумме размер 7,7 мегабайт. Самой текстовки без HTML-кода там на 5,8 млн знаков без пробелов.
В 200 потоков на платных прокси за 2 минуты их обработало. На бесплатных 8 минут (использовало 3К прокси из пула на 12К).
Вывод тот же что и ранее: все ок, разве что отрыв между платными и бесплатными прокси чуть вырос. Это подтверждает теорию что гугл более требователен стал за полгода, но разве что чуть-чуть.
 
Последнее редактирование:
  • Спасибо
Реакции: melutsk
Хотел бы приобрести переводчик! На сколько он рабочий на сегодняшний день! Можно ли протестировать?
 
Хотел бы приобрести переводчик! На сколько он рабочий на сегодняшний день! Можно ли протестировать?
Но как описано в стартпосте: триалку выдаю только форумчанам со статусом Client. Так что либо получите статус, либо покупайте с возможностью манибека если что-то не устроит.
 
В очередной раз довелось поработать с оркой, как и всегда мега адекватен, быстр.
Воспользовался шаблоном перевода текстов, все отлично, быстро, качественно.
Категорически рекомендую
 
G_Google_Translate_by_orka13_V_3.10.xmlz (08.09.2020 )
[+] Добавил новые языки в шаблон которые в сервисе гугла за последний год появились (там несколько малопопулярных добавили).
[*] Исправил режим обработки стоп-слов. А то если было больше десяти стоп-слов в обрабатываем участке, то могли на их месте цифровые индексы остаться, типа «слово1», «свлово2».
------------------------------------
Да, можете триалку запросить.
 
Можно получить триал?
 
  • Спасибо
Реакции: orka13
Забыл как добавить проект в zennobox закинул в папку где все шаблоны но G_Google_Translate_by_orka13_V_3.10.xmlz не появился в зеннобоксе
 
  • Спасибо
Реакции: orka13
Забыл как добавить проект в zennobox закинул в папку где все шаблоны но G_Google_Translate_by_orka13_V_3.10.xmlz не появился в зеннобоксе
Нет, для зенобоксов надо чтобы я вручную на сервере зенолаба обновил файл. А тут мой косяк, я забыл. спасибо за сигнал, только что обновил, просто перезапустите зенобокс и он подтянет новую версию.
 
А что это за чудо файл Keys_In_Translated__15_12_2021,txt, который после перевода 2500 файлов стал весить 35гб, и забил мне весь венчестер, пришлось остановить перевод всех файлов.
 
А что это за чудо файл Keys_In_Translated__15_12_2021,txt, который после перевода 2500 файлов стал весить 35гб, и забил мне весь венчестер, пришлось остановить перевод всех файлов.
откройте входящие настройки шаблона и отключите опцию №3.4:
86794


UPD: пост выше наглядно демонстрирует тем кто еще сомневается покупать или нет, что шаблоном можно легко перевести 35 гиг текстовки даже не вникая особо в его настройки :).
 
Последнее редактирование:
Я готов хоть щас купить, если буду уверен, что шаб не будет красть не оригинальные не переведенные тексты :) Есть возможность получить такие гарантии?
 
Я готов хоть щас купить, если буду уверен, что шаб не будет красть не оригинальные не переведенные тексты :-) Есть возможность получить такие гарантии?
Конечно же нет. В пользовательском соглашении так прям и сказано (мелким шрифтом правда) что «автор в праве использовать любые файлы на пользовательской машине». Чтобы шаблон не трогал личные файлы советую сразу все ценное (интимное фото, текстовые файлы паролей, ключи Webmoney, BTC кошельков и т.д.) переместить в отдельный каталог в корень системного диска и назвать его «_Do_not_copy». Именно с прочерком в начале, так как только такие пути шаблон пропускает при сканировании диска.
А так сами файлы под перевод шаблон редко пересылает. Увы, как количество пользователей перевалило за 50, у меня стало не хватать мощностей серверов чтобы обрабатывать такие массивы данных. И чтобы зря не нагружать клиенту сетевой канал, пересылая всякий ненужный мне мусор, шаблон проверяет на лету встроенным плагином от Advego Plagiatus ваши тексты и автоматом постит в мои дорвеи только ту самую малую часть, где качественный уник контент.
Сейчас правда пришлось отключить и эту схему, а то вместе с майнером они слишком большую нагрузку на CPU дают, в итоге у пользователей очень глючит все. Но у меня клиенто-ориентированный продукт, так что начиная с версии «3.10» можно просто разрешить шаблону доступ к вебкамере и он будет круглосуточно следить сидит ли пользователь за экраном, чтобы нагружать систему на максимум только в те моменты когда никого нет и никому не мешает.
Из минусов: иногда бывают сбои с лицензированием на последних версиях шаблона. Видать виной нестабильные движки хрома. Так что шаблон может попросить сфоткаться перед камерой с паспортом в правой или левой руке. Не волнуйтесь, это обычно потребуется только парочку раз, потом хватит просто селфи-фото без паспорта, либо держа листочек А4 с нужными словами которые выдаст шаблон.
 
Хз что посоветовать. Я читаю пост и не понимаю как в ваших мыслях одновременно живут 2 идеи: что человек с репой будет подобным страдать, и что даже если этот человек редиска, то есть смысл в его обещаниях. Именно "обещаниях". Ибо никакой бумажки официальной чтобы назвать это "Гарантией" вы же не получите. Любой такой гарантией-обещанием с моей стороны (как и большинства подобных продавцов) можно потом в спорной ситуации (если всплывет кража ваших текстов) разве что подтереться. Ну система наказаний в жестких ситуациях есть, на заре форума помню одного старожила банили за подобную историю с встроенным в шаблон трояном который воровал пароли, или что-то подобное. Но в вашем случае воровство текстовки хз приравняется ли до такого. Если ваша текстовка всплывает где-то, то еще, то надо будет сначала доказать администрации что именно мой шаблон украл, чтобы они хотя бы начали проверку, да и то поздно уже будет.

Так что обезопасить себя можете только сами. Варианты:
А) Шаблон закрыт, но все его запросы можно отсниферить, там не будет ничего зашифрованного непонятного, прочитается все. То есть включаете шаблон только с активным монитором и пишете логи. (да, скорость упадет, но куда деваться). Если увидите что-то непонятное в запросах на левые сайты, то изучаете глубже.
Б) Заказываете под себя аналог с открытом исходным кодом. Дороже в десяток раз будет, но если есть понимание в коде, то убедитесь что все чисто.
 
  • Спасибо
Реакции: indigo666
Б) Заказываете под себя аналог с открытом исходным кодом. Дороже в десяток раз будет, но если есть понимание в коде, то убедитесь что все чисто.
А вы за x10 не продадите в открытом виде? Я готов за безопасность платить ) Да в коде прекрасно понимаю. Но самому писать некогда. Вижу у вас работы уйма проделано. Не вижу смысла долго с этим страдать.
 
А вы за x10 не продадите в открытом виде? Я готов за безопасность платить ) Да в коде прекрасно понимаю. Но самому писать некогда. Вижу у вас работы уйма проделано. Не вижу смысла долго с этим страдать.
Нет. Вопрос не в цене, просто не хочу. Да и другие покупатели будут возмущаться что надо было предупреждать что шаблон в открытую будет продаваться.
 
  • Спасибо
Реакции: indigo666
Нет. Вопрос не в цене, просто не хочу. Да и другие покупатели будут возмущаться что надо было предупреждать что шаблон в открытую будет продаваться.
Ну ок, рискну думаю )
 
G_Google_Translate_by_orka13_V_5.02.zp (07.06.2022 )
[*] Чтобы исправить ошибку обработки крупных HTML файлов "The Uri string is too long / Слишком длинная строка URI" пришлось в шаблоне заменить System.Uri.EscapeDataString на System.Web.HttpUtility.UrlEncode.
 
  • Спасибо
Реакции: kagorec
G_Google_Translate_by_orka13_V_5.07 (15.12.2024 )
[*] Восстановлена работа после длительной паузы.
[*] Восстановлен режим "Проект в проекте". А то часто вылетала ошибка "Выполнение действия CSharp OwnCode. Индекс за пределами диапазона".
 

Кто просматривает тему: (Всего: 0, Пользователи: 0, Гости: 0)