Добавить статьи и файла

atheroth

Client
Регистрация
06.06.2014
Сообщения
127
Благодарностей
17
Баллы
18
Привет всем. Вот я и добрался до работы с файлами. В общем, нужно, чтобы зенка, как в дорвеях брала текст из файла.

ЧТО ЕСТЬ:
Есть 1 600 000 символов текста в 3 файлах. Статьи обычно отформатированы, имеют свои заголовки. Между статьями отступ 3 строки.

ЧТО НУЖНО:
Нужно как-то сделать так, чтобы зенка брала текст из файла, помещала в переменную. Далее я сам сделаю, чтобы добавляла на сайт.

КАК СДЕЛАТЬ?
Уже голову ломаю целых 2 дня. До последнего пытался сделать своими силами. Сделал полностью шаблон, один косяк в том, чтобы взять текст из файла, который весит мегайбайт по 100. Если решение кроется в C#, то точно бы не догадался, так как языком не владею.

Помогите плиз) Заранее спасибо.
 

black_pariah

Client
Регистрация
08.09.2014
Сообщения
294
Благодарностей
91
Баллы
28
может я чёт не понимаю ,но есть экшн работа с файлами,а в нём взять текст и ложится в переменную
 

atheroth

Client
Регистрация
06.06.2014
Сообщения
127
Благодарностей
17
Баллы
18
Есть там функция взять текст. Все правильно, но у меня видели объем файлов? У меня 3 файла, общим объемом 1 600 000 символов. Каждая статья в среднем 2500 знаков. Там около 650 статей. Руками я буду месяц разбирать. Мне и нужно, как-то определить начало и конец статьи, чтобы взять ее из файла и пометить в переменную.


Еесли бы текста было мало, я бы сам раскидал каждую статью в отдельный файл и запостил их с помощью данной функции.
 

Sergodjan

Administrator
Команда форума
Регистрация
05.09.2012
Сообщения
20 274
Благодарностей
9 056
Баллы
113
как вариант делать организацию в файле - по одной строке на стаьтю + отделить спец-разделителем заголовок..
загонять этот файл в список (или привязать к списку) и брать строку с удалением, а потом регулярками отделять заголовок и текст..

но если файл уже готовый, то это уже труднее.. :-)
 
  • Спасибо
Реакции: atheroth

atheroth

Client
Регистрация
06.06.2014
Сообщения
127
Благодарностей
17
Баллы
18
Я наверное сделаю так:

Ручками проставлю маркировку, пусть уйдет хоть 1 неделя. А при следующем парсинге уник контента, уже буду расставлять эти маркеры перед сохранением в файл)))
 

black_pariah

Client
Регистрация
08.09.2014
Сообщения
294
Благодарностей
91
Баллы
28
Я наверное сделаю так:

Ручками проставлю маркировку, пусть уйдет хоть 1 неделя. А при следующем парсинге уник контента, уже буду расставлять эти маркеры перед сохранением в файл)))
примерно так и я подумал --перед каждым заголовком или в конце каждоой статьи ставить например @ ,а потом взять текст и регуляркой с разрешёнными переносами выбивать каждую статью.
 

Radzhab

Client
Регистрация
23.05.2014
Сообщения
1 500
Благодарностей
1 268
Баллы
113
Есть вариант запихнуть все в stringbuilder и там регулярками парсить. Значительно быстрее будет
 

wizard

Client
Регистрация
04.10.2011
Сообщения
1 003
Благодарностей
632
Баллы
113
Между статьями отступ 3 строки.
в notepad++ регуляркой делаешь замену 3 пустых строки на -----разделитель------- и все ...

потом в зенке все читаешь из файла и делишь регуляркой с счетчиком совпадений
 
  • Спасибо
Реакции: Sergodjan

Кто просматривает тему: (Всего: 0, Пользователи: 0, Гости: 0)