Парсер сайта ФИПИ с сортировкой

GNT

Новичок
Регистрация
30.05.2020
Сообщения
5
Благодарностей
1
Баллы
3
Если все возможности сложно реализовать в одном скрипте допускается разделение на несколько.

МИНИМАЛЬНЫЕ ТРЕБОВАНИЯ К СКРИПТУ:

Возможность запускать только одну тему в одном предмете или один предмет целиком.

Каждая тема в своей папке

Задание сохраняется в виде картинки (jpg/png) и текстового документа (txt) название файла это код задания (973F29 как пример, написаны в левом нижнем углу, очень блекло)

Спарсить задания из следующих разделов из открытого банка заданий ФИПИ:

ОГЭ математика
Для категории "Практические задачи"
Отдельная логика:
В папке категории создается папка с кодом задания, внутри фото + текст основной части задания (наименование : код задания-00-00) + под папки "Задание 1"/"Задание 2". В под папках соответствующие задания, каждое задание так-же отдельным фото и текстом (наименование код задания-номер задания(двухзначное число)-двухзначный номер по порядку)

ОГЭ информатика
Часть заданий имеет прикрепленные файлы (пример Информационные и коммуникационные технологии страница 121), такие файлы надо сложить в отдельную папку, к части заданий прикреплен один и тот-же файл, если файл уже есть в папке повторно скачивать не надо.

ДОПОЛНИТЕЛЬНАЯ ВОЗМОЖНОСТЬ:
Сохранять список ранее спарсенных заданий и при повторном проходе парсить только новые задания.

Внутри категории находить аналогичные задания и собирать их в одну папку.

ВТОРАЯ ЧАСТЬ ЗАДАНИЯ:
Аналогичные скрипты для ЕГЭ
обратите внимание, что на странице выше есть Старая версия «Открытый банк заданий ЕГЭ» там так-же необходимо спарсить:
Информатика
Математика. Базовый уровень
Математика. Профильный уровень

На новой версии сайта изначально отсутствует разделение на категории, но есть фильтр. Соответственно необходимо добавить возможность настраивать фильтр или запускать без него.
 

Dexio

Client
Регистрация
09.05.2014
Сообщения
1 254
Благодарностей
220
Баллы
63
бюджет?
 

GNT

Новичок
Регистрация
30.05.2020
Сообщения
5
Благодарностей
1
Баллы
3

Кто просматривает тему: (Всего: 2, Пользователи: 0, Гости: 2)