- Регистрация
- 24.08.2013
- Сообщения
- 1 088
- Благодарностей
- 598
- Баллы
- 113
Первым делом надо установить Python на пк если ранее не ставили (видео инструкция)
В Project Manager подключение скрипта `.py` происходит через кубик `Запуск программы`
	
	
		
		
	
	
		
			
		
		 
	
В параметре запуска передается уникальный ид (рандом 5 символов например),
которые будут служить для указания имени in_{name}.txt файла откуда брать контент.
Также это название будет для файла с результатом out_{name}.txt
Многопоток будет работать корректно при условии что `ids` уникальный в каждом потоке.
Содержимое скрипта `.py` пример для суммаризации статьи:
Внимание на строки 34-35
	
	
	
	
	
	
		
			
			
			
			
			
		
	
	
	
		
	
	
		
	
								В Project Manager подключение скрипта `.py` происходит через кубик `Запуск программы`
 
	В параметре запуска передается уникальный ид (рандом 5 символов например),
которые будут служить для указания имени in_{name}.txt файла откуда брать контент.
Также это название будет для файла с результатом out_{name}.txt
Многопоток будет работать корректно при условии что `ids` уникальный в каждом потоке.
Содержимое скрипта `.py` пример для суммаризации статьи:
Внимание на строки 34-35
			
				Запуск скрипта, данные подтягивает с тхт файла и рядом пишет в результат:
			
		
		
		import sys
from sumy.parsers.plaintext import PlaintextParser
from sumy.nlp.tokenizers import Tokenizer
from sumy.summarizers.lsa import LsaSummarizer
def summarize_file(input_file, output_file, num_sentences=2):
    # Чтение содержимого HTML файла
    with open(input_file, "r", encoding="utf-8") as file:
        html_content = file.read()
    # Парсим текст
    parser = PlaintextParser.from_string(html_content, Tokenizer("english"))
    # Создаем объект LSA Summarizer
    summarizer = LsaSummarizer()
    # Генерация суммаризации
    summary = summarizer(parser.document, num_sentences)
    # Запись результата в выходной файл
    with open(output_file, "w", encoding="utf-8") as out_file:
        for sentence in summary:
            out_file.write(str(sentence) + '\n')
if __name__ == "__main__":
    if len(sys.argv) != 2:
        print("Usage: sum.py <name>")
        sys.exit(1)
    # Получаем параметр из командной строки
    name = sys.argv[1]
    # Формируем пути к файлам
    input_file = f"T:\\py\\in_{name}.txt"
    output_file = f"T:\\py\\out_{name}.txt"
    try:
        # Вызываем функцию суммаризации
        summarize_file(input_file, output_file)
        print(f"Суммаризация завершена. Результат записан в {output_file}.")
    except Exception as e:
        print(f"Ошибка: {e}")
								
									Последнее редактирование: 
									
							
						
						
	
		
			
		
	
					



 
 
		