Неточное совпадение

baracuda

Client
Регистрация
19.06.2013
Сообщения
793
Благодарностей
278
Баллы
63
Всем привет.

Озадачился работой с данными.
есть таблица с данными например
наименование|характеристики|цена
смартфон iphone 12|бла-бла-бла|100$

поиск по наименованию.
наша задача сравнить цены на 10 сайтах.

как можно реализовать по неточному совпадению или точному. уже запутался.
Берём товар, ищем в таблице..., если не находим, добавляем новый(главное не задублировать), если находим проверяем цену, если есть изменение то меняем на новое значение.

бывает

Настенная сплит-система Aeronik ASI/ASO-07IL2
или
Настенная сплит-система Aeronik ASI/ASO-07IL3

разница всего в последнем символе

а с другой стороны на некоторых сайтах это и сплит система. и кондиционер. даже по кириллице аэроник называют... это и с телевизорами, и с телефона.. вообщем бытовая техника
 

Phoenix78

Client
Read only
Регистрация
06.11.2018
Сообщения
11 790
Благодарностей
5 720
Баллы
113
думаю что тема сложная. беглый поиск выводит на описание мозголомающих алгоритмы, но готового решения вряд ли так просто найти.
 

orka13

Client
Регистрация
07.05.2015
Сообщения
2 177
Благодарностей
2 184
Баллы
113
Как вариант: искать не по базе-таблице собраной с готовых сайтов, а каждый раз через гугл (или другой поисковик где капчи меньше просит, типа Bing) по каждому из 10 сайтов, через оператор типа:
Aeronik ASI/ASO-07IL2 site:tecl.ru
Но тогда много лишних запросов и логику перестраивать придется. Например, конкретно к этому сайту если на первом месте гугл показывает не товар а страницу категории (https://tecl.ru/category/......), то логично предположить что такого товара нет на сайте. И подобную проверку для остальных 9 сайтов сделать.
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)