«те статьи которые уже были скопированы» - записывать их урл, или заголовок, или ID в отдельный файл с новой строки, или в файл-список.
При проверке новой статьи искать ее по признакам в этом файле или файл-списке. Если статьи там нет, то обрабатываем. Если есть, то пропускаем.