- Регистрация
- 24.11.2011
- Сообщения
- 149
- Благодарностей
- 57
- Баллы
- 28
Приветствую.
Нужна помощь с реализацией одной задачи
Задача в следующем.
Есть несколько сайтов с предметами и ценами на них. Наличие предметов постоянно меняется, цена меняется не так часто от пары раз в день до раз в пару часов. Но проблема в том, что в каждый конкретный момент на сайте могут находится абсолютно разные предметы.
Все предметы на всех сайтах называются одинаково, либо незначительно отличаются.
Задача следующая.
Парсить все сайты одновременно собирая базу данных предметов. Скорее всего будет по 1му шабу на каждый сайт.
Потом будет выделен отдельный шаб, который будет обрабатывать информацию по базе и искать несоответствия в ценах.
Собственно задача в следующем.
1. Как лучше сделать обработку данных? Дело в том, что наименований предметов действительно много около 3-4 тысяч. Если цена изменилась, то нужно удалить старую цену в базе и записать новую. Но перебирать по 1му предмету долго. Может есть какой-то снипет, который справится с этой задачей быстрее, чем построчный перебор в зенке?
2. Собственно база и разница в цене предметов нужна для работы другого шаба, который будет нажимать по этим предметам в выдаче. Что лучше использовать для самой базы? Стоит ли прикупить хостинг и использовать MySQL или хватит обычного текстового/экселевского файла?
Может у кого-то был опыт решения подобных задач? Подскажите что-нить дельное
Нужна помощь с реализацией одной задачи
Задача в следующем.
Есть несколько сайтов с предметами и ценами на них. Наличие предметов постоянно меняется, цена меняется не так часто от пары раз в день до раз в пару часов. Но проблема в том, что в каждый конкретный момент на сайте могут находится абсолютно разные предметы.
Все предметы на всех сайтах называются одинаково, либо незначительно отличаются.
Задача следующая.
Парсить все сайты одновременно собирая базу данных предметов. Скорее всего будет по 1му шабу на каждый сайт.
Потом будет выделен отдельный шаб, который будет обрабатывать информацию по базе и искать несоответствия в ценах.
Собственно задача в следующем.
1. Как лучше сделать обработку данных? Дело в том, что наименований предметов действительно много около 3-4 тысяч. Если цена изменилась, то нужно удалить старую цену в базе и записать новую. Но перебирать по 1му предмету долго. Может есть какой-то снипет, который справится с этой задачей быстрее, чем построчный перебор в зенке?
2. Собственно база и разница в цене предметов нужна для работы другого шаба, который будет нажимать по этим предметам в выдаче. Что лучше использовать для самой базы? Стоит ли прикупить хостинг и использовать MySQL или хватит обычного текстового/экселевского файла?
Может у кого-то был опыт решения подобных задач? Подскажите что-нить дельное