поиск по множеству слов

APXOHT

Client
Регистрация
27.12.2013
Сообщения
881
Благодарностей
189
Баллы
43
Подскажите пож-та.
Есть куча статей (парсинг копипастный). Хочу делать к ним теги - метки.
Есть список ключевых слов которые станут метками-тегами. В списке ~ 10 000 слов.
Как наименее ресурсозатратно сделать поиск совпадений слов из файла с теми словами что будут в статьях? Если искать рандомом то хватит 3-5 совпадений... Но сам рандом наверное добавит нагрузку...
Винт SSD
:bw:
 

7make

Client
Регистрация
25.06.2011
Сообщения
1 547
Благодарностей
1 311
Баллы
113

Обращаем Ваше внимание на то, что данный пользователь заблокирован.
Не рекомендуем проводить с 7make какие-либо сделки.

загони в базу mysql и делай поиск совпадений.
если использовать индексы в mysql будет минимум раз в 100 быстрее, чем через поиск по всей таблице или чтение всего файла.

при твоих обьемах никакой нагрузки ниче не создаст. можешь и по файлу искать совпадения.
 
  • Спасибо
Реакции: APXOHT

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)