Продажи шаблона Google-Translate (Гугл Переводчик), скорость: 20 млн ключей/час, с прокси, без API

orka13

Client
Регистрация
07.05.2015
Сообщения
2 179
Благодарностей
2 187
Баллы
113
Здравствуйте!
У меня такие требования к переводу
Есть файлы с html разметкой
Файлы большие, 50 - 100 тысяч символов.
Их нужно перевести на другой язык с сохранением html разметки
Подойдет ли шаблон для перевода?
Можно ли ссылку на мануал, чтобы почитать, как работать с шаблоном?
Спасибо
1) Здравствуйте. Подойдет. Но только если вы уверены, что там нет ошибок в верстке. Иначе я бы рекомендовал разбить этот файл на мелкие файлы под каждую статью в нем. Подробнее почему так лучше описано в стартпосте в разделе "СПОЙЛЕР: #5. СКРИНШОТЫ «ВХОДНЫЕ НАСТРОЙКИ» С КУЧЕЙ НАСТРОЕК:" на скриншоте с настройкой #8.6. Те скриншоты в комбинации с видео можно считать "мануалом" для шаблона. Они правда могут чуть устареть, ибо шаблон периодически обновляется, но логика там раскрыта. Шаблон можно купить с возможностью манибека в течении 14 дней. Так что нет проблем вернуть деньги если не подойдет.
--------------------------------------------------------------------
2) Zennoposter шаблон Google-Translate (Гугл Переводчик) от orka13 3.07 (25.05.2020 )
Гугул начал жестче банить прокси при использовании перевода, так что бесплатные прокси теперь подойдут разве что для небольших объёмов работ. Сделал кое-какие правки:
[+] Включил CookieContainer. Раньше от него толку не было, посмотрим поможет ли уменьшить баны сейчас. Учтите, что из-за него шаблон не запустится на древних версиях старше ZennoPoster 5.18.0.0 (28.06.2018 ).
[*] Обновил содержание файла «\Input\Useragents.txt» более свежими данными.
[*] Исправил режим «#3.3 [IN_Debug_Mode]», а то раньше он не логировал данные для режима «Проект в проекте». Включайте этот режим, если возникают проблемные ситуации с переводом. Логи помогут локализировать причину.
[*] Актуализировал значение переменных по умолчанию для режима «проект в проекте». А то если пользователь забыл передать важные переменные из родительского шаблона, то шаблон ставил очень старые значения. Например: переменная «IN_Bad_Proxy_Cycle_Max» инициализировалась со значением «30», а на сегодняшний день актуально где-то «200».
[+] Добавил в мануал в телеграмм-группе инструкцию «Как получить проверенные бесплатные прокси с высоким КПД».

Для обновления владельцам ZennoPoster надо перекачать архив (по той ссылке, которую они получали после покупки) и извлечь оттуда файл «G_Google_Translate_by_orka13_V_3.07.xmlz» в свою папку с шаблоном. Владельцам ZennoBox хватит просто перезапустить программу.
Внимание: «Входные параметры» могут при этом «сбросится».
----------------------------------------------------------------------
3) Просили в группе сделать замер разницы скорости работы с бесплатными и платными прокси. Поэтому сегодня провёл эксперимент.
На входе:
200 *.txt файлов размером по 1 мб (200 мегабайт в сумме). Это столбики текстовки (1-3 предложения в строке) и ключей под доры.
Направление перевода: EN > SV.
Потоков: 100.
Настройки почти все по умолчанию. Только в настройках прокси задал чтобы сразу брало прокси, не используя основной IP, и отключил ротацию прокси, чтобы увидеть сколько строк с прокси было взято из файла.

Платные прокси. socks5, пул на 10К прокси (90% процентов рабочие), 200$/месяц, продавца не раскрываю. В группе пишут что хватит и дешевле в 10 раз взять, у меня просто они под другую задачу покупались:
Потраченное время: 25 минут
Из файла с прокси взято 1100 строк. В файле было 10К уникальных строк, размноженные до 200К. То есть даже по второму кругу не пришлось использовать прокси.
1_платныепрокси.png

Бесплатные прокси. Ручками собрал из двух сайтов-источников, которые описаны в мануале к шаблону, перемешал, удалил дубли (15К уникальных строк получилось), размножил до 200К и залил в файл. Заняло дополнительно лишние 5 минут. Таких прокси обычно хватает на сутки активной работы шаблона, потом желательно заменить свежими.
Потраченное время: 80 минут
Из файла с прокси взято 10000 строк.
прокси-фри.png

Вывод: на платных прокси быстрее в ~3 раза, но они не обязательны.
 
Последнее редактирование:
  • Спасибо
Реакции: Astraport и vesb

orka13

Client
Регистрация
07.05.2015
Сообщения
2 179
Благодарностей
2 187
Баллы
113
G_Google_Translate_by_orka13_V_3.08.xmlz (20.07.2020 )
[+] Добавил остановку потоков (StopTask) при окончании входящих файлов. То есть можете ставить завышенное значение в поле ZennoPoster «сколько делать», шаблон нормально остановится.
[*] Исправил игнорирование перевода нестандартных симвлов (иероглифы китайского и подобных языков) в HTML-режиме.
[*] Исправил лишние потребление ресурсов, так как в версии 3.08 ошибочно включил «браузерный» режим.
[*] Мелкие правки в интерфейсе входящих настроек.


Напомню, что недавно создал отдельный топик:
DeepL Переводчик: переводит TXT, HTML файлы без API (браузерный Zennoposter шаблон)
там можно получить скидку, если вы уже владелец гугл-переводчика.
 
Последнее редактирование:
  • Спасибо
Реакции: vesb

orka13

Client
Регистрация
07.05.2015
Сообщения
2 179
Благодарностей
2 187
Баллы
113
Попросил тут меня будущий покупатель показать ему качество перевода последней версии шаблона в направлении языков «польский > русский». Ну я заодно решил и скорость проверить, а то есть обращения что гугл все чаще требует покачественнее прокси под перевод. Получилось что-то вроде того эксперимента что двумя постами выше.
На входе 1119 файлов с мелкими HTML-статьями под импорт в WP или ему подобные движки (заголовок <h1> + несколько абзацев <p>). В сумме размер 7,7 мегабайт. Самой текстовки без HTML-кода там на 5,8 млн знаков без пробелов.
В 200 потоков на платных прокси за 2 минуты их обработало. На бесплатных 8 минут (использовало 3К прокси из пула на 12К).
Вывод тот же что и ранее: все ок, разве что отрыв между платными и бесплатными прокси чуть вырос. Это подтверждает теорию что гугл более требователен стал за полгода, но разве что чуть-чуть.
 
Последнее редактирование:
  • Спасибо
Реакции: melutsk
Регистрация
23.07.2018
Сообщения
4
Благодарностей
0
Баллы
1
Хотел бы приобрести переводчик! На сколько он рабочий на сегодняшний день! Можно ли протестировать?
 

orka13

Client
Регистрация
07.05.2015
Сообщения
2 179
Благодарностей
2 187
Баллы
113
Хотел бы приобрести переводчик! На сколько он рабочий на сегодняшний день! Можно ли протестировать?
Но как описано в стартпосте: триалку выдаю только форумчанам со статусом Client. Так что либо получите статус, либо покупайте с возможностью манибека если что-то не устроит.
 
Регистрация
23.07.2018
Сообщения
4
Благодарностей
0
Баллы
1
Статус изменил!
 
Регистрация
23.07.2018
Сообщения
4
Благодарностей
0
Баллы
1
Скажите! Логин имеется ввиду имя на сайте или email?
 

orka13

Client
Регистрация
07.05.2015
Сообщения
2 179
Благодарностей
2 187
Баллы
113

backoff

Client
Регистрация
20.04.2015
Сообщения
6 095
Благодарностей
6 496
Баллы
113
В очередной раз довелось поработать с оркой, как и всегда мега адекватен, быстр.
Воспользовался шаблоном перевода текстов, все отлично, быстро, качественно.
Категорически рекомендую
 

indigo666

Client
Регистрация
10.05.2014
Сообщения
1 154
Благодарностей
374
Баллы
83

orka13

Client
Регистрация
07.05.2015
Сообщения
2 179
Благодарностей
2 187
Баллы
113
G_Google_Translate_by_orka13_V_3.10.xmlz (08.09.2020 )
[+] Добавил новые языки в шаблон которые в сервисе гугла за последний год появились (там несколько малопопулярных добавили).
[*] Исправил режим обработки стоп-слов. А то если было больше десяти стоп-слов в обрабатываем участке, то могли на их месте цифровые индексы остаться, типа «слово1», «свлово2».
------------------------------------
Да, можете триалку запросить.
 

indigo666

Client
Регистрация
10.05.2014
Сообщения
1 154
Благодарностей
374
Баллы
83
Можно телегу ? )
 
  • Спасибо
Реакции: orka13

creck

Client
Регистрация
05.08.2014
Сообщения
94
Благодарностей
9
Баллы
8
Можно получить триал?
 
  • Спасибо
Реакции: orka13

wcw2007

Новичок
Регистрация
23.09.2018
Сообщения
12
Благодарностей
2
Баллы
3
Забыл как добавить проект в zennobox закинул в папку где все шаблоны но G_Google_Translate_by_orka13_V_3.10.xmlz не появился в зеннобоксе
 
  • Спасибо
Реакции: orka13

orka13

Client
Регистрация
07.05.2015
Сообщения
2 179
Благодарностей
2 187
Баллы
113
Забыл как добавить проект в zennobox закинул в папку где все шаблоны но G_Google_Translate_by_orka13_V_3.10.xmlz не появился в зеннобоксе
Нет, для зенобоксов надо чтобы я вручную на сервере зенолаба обновил файл. А тут мой косяк, я забыл. спасибо за сигнал, только что обновил, просто перезапустите зенобокс и он подтянет новую версию.
 

wcw2007

Новичок
Регистрация
23.09.2018
Сообщения
12
Благодарностей
2
Баллы
3
А что это за чудо файл Keys_In_Translated__15_12_2021,txt, который после перевода 2500 файлов стал весить 35гб, и забил мне весь венчестер, пришлось остановить перевод всех файлов.
 

orka13

Client
Регистрация
07.05.2015
Сообщения
2 179
Благодарностей
2 187
Баллы
113
А что это за чудо файл Keys_In_Translated__15_12_2021,txt, который после перевода 2500 файлов стал весить 35гб, и забил мне весь венчестер, пришлось остановить перевод всех файлов.
откройте входящие настройки шаблона и отключите опцию №3.4:
86794


UPD: пост выше наглядно демонстрирует тем кто еще сомневается покупать или нет, что шаблоном можно легко перевести 35 гиг текстовки даже не вникая особо в его настройки :-).
 
Последнее редактирование:

indigo666

Client
Регистрация
10.05.2014
Сообщения
1 154
Благодарностей
374
Баллы
83
Я готов хоть щас купить, если буду уверен, что шаб не будет красть не оригинальные не переведенные тексты :-) Есть возможность получить такие гарантии?
 

orka13

Client
Регистрация
07.05.2015
Сообщения
2 179
Благодарностей
2 187
Баллы
113
Я готов хоть щас купить, если буду уверен, что шаб не будет красть не оригинальные не переведенные тексты :-) Есть возможность получить такие гарантии?
Конечно же нет. В пользовательском соглашении так прям и сказано (мелким шрифтом правда) что «автор в праве использовать любые файлы на пользовательской машине». Чтобы шаблон не трогал личные файлы советую сразу все ценное (интимное фото, текстовые файлы паролей, ключи Webmoney, BTC кошельков и т.д.) переместить в отдельный каталог в корень системного диска и назвать его «_Do_not_copy». Именно с прочерком в начале, так как только такие пути шаблон пропускает при сканировании диска.
А так сами файлы под перевод шаблон редко пересылает. Увы, как количество пользователей перевалило за 50, у меня стало не хватать мощностей серверов чтобы обрабатывать такие массивы данных. И чтобы зря не нагружать клиенту сетевой канал, пересылая всякий ненужный мне мусор, шаблон проверяет на лету встроенным плагином от Advego Plagiatus ваши тексты и автоматом постит в мои дорвеи только ту самую малую часть, где качественный уник контент.
Сейчас правда пришлось отключить и эту схему, а то вместе с майнером они слишком большую нагрузку на CPU дают, в итоге у пользователей очень глючит все. Но у меня клиенто-ориентированный продукт, так что начиная с версии «3.10» можно просто разрешить шаблону доступ к вебкамере и он будет круглосуточно следить сидит ли пользователь за экраном, чтобы нагружать систему на максимум только в те моменты когда никого нет и никому не мешает.
Из минусов: иногда бывают сбои с лицензированием на последних версиях шаблона. Видать виной нестабильные движки хрома. Так что шаблон может попросить сфоткаться перед камерой с паспортом в правой или левой руке. Не волнуйтесь, это обычно потребуется только парочку раз, потом хватит просто селфи-фото без паспорта, либо держа листочек А4 с нужными словами которые выдаст шаблон.
 

indigo666

Client
Регистрация
10.05.2014
Сообщения
1 154
Благодарностей
374
Баллы
83

orka13

Client
Регистрация
07.05.2015
Сообщения
2 179
Благодарностей
2 187
Баллы
113
Хз что посоветовать. Я читаю пост и не понимаю как в ваших мыслях одновременно живут 2 идеи: что человек с репой будет подобным страдать, и что даже если этот человек редиска, то есть смысл в его обещаниях. Именно "обещаниях". Ибо никакой бумажки официальной чтобы назвать это "Гарантией" вы же не получите. Любой такой гарантией-обещанием с моей стороны (как и большинства подобных продавцов) можно потом в спорной ситуации (если всплывет кража ваших текстов) разве что подтереться. Ну система наказаний в жестких ситуациях есть, на заре форума помню одного старожила банили за подобную историю с встроенным в шаблон трояном который воровал пароли, или что-то подобное. Но в вашем случае воровство текстовки хз приравняется ли до такого. Если ваша текстовка всплывает где-то, то еще, то надо будет сначала доказать администрации что именно мой шаблон украл, чтобы они хотя бы начали проверку, да и то поздно уже будет.

Так что обезопасить себя можете только сами. Варианты:
А) Шаблон закрыт, но все его запросы можно отсниферить, там не будет ничего зашифрованного непонятного, прочитается все. То есть включаете шаблон только с активным монитором и пишете логи. (да, скорость упадет, но куда деваться). Если увидите что-то непонятное в запросах на левые сайты, то изучаете глубже.
Б) Заказываете под себя аналог с открытом исходным кодом. Дороже в десяток раз будет, но если есть понимание в коде, то убедитесь что все чисто.
 
  • Спасибо
Реакции: indigo666

indigo666

Client
Регистрация
10.05.2014
Сообщения
1 154
Благодарностей
374
Баллы
83
Б) Заказываете под себя аналог с открытом исходным кодом. Дороже в десяток раз будет, но если есть понимание в коде, то убедитесь что все чисто.
А вы за x10 не продадите в открытом виде? Я готов за безопасность платить ) Да в коде прекрасно понимаю. Но самому писать некогда. Вижу у вас работы уйма проделано. Не вижу смысла долго с этим страдать.
 

orka13

Client
Регистрация
07.05.2015
Сообщения
2 179
Благодарностей
2 187
Баллы
113
А вы за x10 не продадите в открытом виде? Я готов за безопасность платить ) Да в коде прекрасно понимаю. Но самому писать некогда. Вижу у вас работы уйма проделано. Не вижу смысла долго с этим страдать.
Нет. Вопрос не в цене, просто не хочу. Да и другие покупатели будут возмущаться что надо было предупреждать что шаблон в открытую будет продаваться.
 
  • Спасибо
Реакции: indigo666

indigo666

Client
Регистрация
10.05.2014
Сообщения
1 154
Благодарностей
374
Баллы
83
Нет. Вопрос не в цене, просто не хочу. Да и другие покупатели будут возмущаться что надо было предупреждать что шаблон в открытую будет продаваться.
Ну ок, рискну думаю )
 

orka13

Client
Регистрация
07.05.2015
Сообщения
2 179
Благодарностей
2 187
Баллы
113
G_Google_Translate_by_orka13_V_5.02.zp (07.06.2022 )
[*] Чтобы исправить ошибку обработки крупных HTML файлов "The Uri string is too long / Слишком длинная строка URI" пришлось в шаблоне заменить System.Uri.EscapeDataString на System.Web.HttpUtility.UrlEncode.
 
  • Спасибо
Реакции: kagorec

orka13

Client
Регистрация
07.05.2015
Сообщения
2 179
Благодарностей
2 187
Баллы
113
G_Google_Translate_by_orka13_V_5.07 (15.12.2024 )
[*] Восстановлена работа после длительной паузы.
[*] Восстановлен режим "Проект в проекте". А то часто вылетала ошибка "Выполнение действия CSharp OwnCode. Индекс за пределами диапазона".
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)