Ну да, это только, как сказал Сергоджан, - искать отличительные особенности информационных статей. Наверное там что-то да найдется, и можно будет исключить треш. Стоп-слова посмотри, может поможет.
А про загрузку DOM - это естественно, структура сайтов такая, не чтобы все на главной было ))...