- Регистрация
- 24.08.2013
- Сообщения
- 979
- Благодарностей
- 523
- Баллы
- 93
Первым делом надо установить Python на пк если ранее не ставили (видео инструкция)
В Project Manager подключение скрипта `.py` происходит через кубик `Запуск программы`
В параметре запуска передается уникальный ид (рандом 5 символов например),
которые будут служить для указания имени in_{name}.txt файла откуда брать контент.
Также это название будет для файла с результатом out_{name}.txt
Многопоток будет работать корректно при условии что `ids` уникальный в каждом потоке.
Содержимое скрипта `.py` пример для суммаризации статьи:
Внимание на строки 34-35
В Project Manager подключение скрипта `.py` происходит через кубик `Запуск программы`
В параметре запуска передается уникальный ид (рандом 5 символов например),
которые будут служить для указания имени in_{name}.txt файла откуда брать контент.
Также это название будет для файла с результатом out_{name}.txt
Многопоток будет работать корректно при условии что `ids` уникальный в каждом потоке.
Содержимое скрипта `.py` пример для суммаризации статьи:
Внимание на строки 34-35
Запуск скрипта, данные подтягивает с тхт файла и рядом пишет в результат:
import sys
from sumy.parsers.plaintext import PlaintextParser
from sumy.nlp.tokenizers import Tokenizer
from sumy.summarizers.lsa import LsaSummarizer
def summarize_file(input_file, output_file, num_sentences=2):
# Чтение содержимого HTML файла
with open(input_file, "r", encoding="utf-8") as file:
html_content = file.read()
# Парсим текст
parser = PlaintextParser.from_string(html_content, Tokenizer("english"))
# Создаем объект LSA Summarizer
summarizer = LsaSummarizer()
# Генерация суммаризации
summary = summarizer(parser.document, num_sentences)
# Запись результата в выходной файл
with open(output_file, "w", encoding="utf-8") as out_file:
for sentence in summary:
out_file.write(str(sentence) + '\n')
if __name__ == "__main__":
if len(sys.argv) != 2:
print("Usage: sum.py <name>")
sys.exit(1)
# Получаем параметр из командной строки
name = sys.argv[1]
# Формируем пути к файлам
input_file = f"T:\\py\\in_{name}.txt"
output_file = f"T:\\py\\out_{name}.txt"
try:
# Вызываем функцию суммаризации
summarize_file(input_file, output_file)
print(f"Суммаризация завершена. Результат записан в {output_file}.")
except Exception as e:
print(f"Ошибка: {e}")
Последнее редактирование: