Добрый день!
Нужен открытый шаблон для решения следующей задачи.
Есть текстовый файл srt1.srt - это автоматически сгенерированные сторонним сервисом субтитры. И есть файл text1.txt - это правильный исходный текст.
В тексте файла srt1.srt есть орфографические и пункттационные ошибки, склеенные слова. Ошибок не очень много, но они есть.
Нужно исправить текст в файле srt1.srt используя оригинальный текст из файла text1.txt. Метки в srt не трогать, только текст.
Текст по смыслу в srt не должен измениться. То есть если в srt фрагмент "из за Сунами", то он должен быть исправлен на "из-за цунами", а не на "из-за" или "из-за цунами накатило" - что бы субтитры не отставали и не операжли аудио. Надеюсь понятно объяснил.
То есть это задача на логику и регулярки, без браузера.
Возможные языки: русский, английский, немецкий. Примеры файлов для обработки во вложении.
Цену и сроки предлагайте. Мой телеграм: https://t.me/Mr_burns_corp
Нужен открытый шаблон для решения следующей задачи.
Есть текстовый файл srt1.srt - это автоматически сгенерированные сторонним сервисом субтитры. И есть файл text1.txt - это правильный исходный текст.
В тексте файла srt1.srt есть орфографические и пункттационные ошибки, склеенные слова. Ошибок не очень много, но они есть.
Нужно исправить текст в файле srt1.srt используя оригинальный текст из файла text1.txt. Метки в srt не трогать, только текст.
Текст по смыслу в srt не должен измениться. То есть если в srt фрагмент "из за Сунами", то он должен быть исправлен на "из-за цунами", а не на "из-за" или "из-за цунами накатило" - что бы субтитры не отставали и не операжли аудио. Надеюсь понятно объяснил.
То есть это задача на логику и регулярки, без браузера.
Возможные языки: русский, английский, немецкий. Примеры файлов для обработки во вложении.
Цену и сроки предлагайте. Мой телеграм: https://t.me/Mr_burns_corp
Вложения
-
5 КБ Просмотры: 78