взять взять переменную где текст страницы без тегов, перегнать весь текст нижний регистр, выпарсить все слова регуляркой в список, отсортировать список. Перебрать список увеличивая счётчик каждую итерацию сравнивая слово из прошлой строки с нынешней. Как только слова рознятся - записать если надо куда надо слово прошлое + счётчик его повторений, обнулить счётчик, сравнивать дальше