Парсинг инфы и разбиение ее на файлы.

backoff

Client
Регистрация
20.04.2015
Сообщения
6 166
Благодарностей
6 533
Баллы
113
Имеем мега огромную БД инфы, в которой выйдет миллионы строк и файл в несколько Гигов. Чтобы потом можно было с инфой работать, сделал следующее. Стал разбивать 1 файл на файлы при самом парсинге.
То есть. если в файле больше 100000 строк, то его перемещают в туже папку, но с другим именем, на выходе мы имеем это:



есть файлы по 7-8Мб, это файлы где чуть больше 100к строк.
Но так же появляются огрызки по 6-50кб

Как избежать появления этих огрызков?
Шаблон идет в много поток

вот так выглядит шаб (основная часть исполнения)


ps | в принципе все равно, я потом файлы соберу в кучу, но просто для собственного саморазвития - интересно. спасибо
 

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)