Сколько строк из списка Зенка может переварить не подавившись?

Valiksim · 28.04.2017

amyboose сказал(а):
3 месяца скорее уйдет, а не 3 дня

Это уже детали

amyboose сказал(а):
в книгах уже давно все разжевано

В книгах многое чего разжёвано. Однако, я не видел ещё книги, в которой было бы хоть что-то про работу Зенно
Второе,- ты говоришь про книги, в которых это уже разжёвано, а вот мне такие не попадались. Другим также, наверное.
Например, на Западе студенты платят денежку профессорам и друг другу за "библиографию" (список книг на определённую тему).
Так что, знать название книг, то есть "где и куда копать" тоже многое значит

arhip1985 · 28.04.2017

есть одно но, в книгах стараются писать правильно, а не понятно. поэтому статьи бывают гораздо доступнее, чем изложение в книгах

Valiksim · 28.04.2017

arhip1985 сказал(а):
в книгах стараются писать правильно, а не понятно

Золотые слова. Книги по программированию, пишут-то в основном для роботов, или для тех, у кого мозги как у робота.
Всё приходится додумывать самому

amyboose · 28.04.2017

arhip1985 сказал(а):
есть одно но, в книгах стараются писать правильно, а не понятно. поэтому статьи бывают гораздо доступнее, чем изложение в книгах

Каждый понимает текст по-своему, а в книгах пишут текстом, который представляет из себя компромисс между сжатостью, правильностью изложения, понятностью и простотой. Если пытаться то же самое расписывать самому, то текст увеличится в раза 2. Но по многопоточности чтобы все понять надо прочитать нескольких популярных авторов и их подход к многопотоку. Плюс видео посмотреть различное и статьи на хабре ещё почитать, так что со временем можно во всем разобраться.

Valiksim · 28.04.2017

amyboose сказал(а):
Если пытаться то же самое расписывать самому, то текст увеличится в раза 2.

Смотря кто и как пишет. Если излагаемый вопрос или тему я хорошо знаю, я всегда смогу объяснить его в нескольких фразах. Доступно и понятно

amyboose сказал(а):
Но по многопоточности чтобы все понять надо прочитать нескольких популярных авторов и их подход к многопотоку.

Не подходил ещё к данной теме.

amyboose сказал(а):
Плюс видео посмотреть различное и статьи на хабре ещё почитать, так что со временем можно во всем разобраться.

Да, точно. Всегда и во всём можно разобраться. С годами, говорят, всё приходит (или проходит?

)

arhip1985 · 28.04.2017

понимание приходит не с годами, а через практику. надо пропустить через пальцы как минимум три задачки по одной теме, ну подсматривать кое-когда, но стараться запоминать основное, а в конце самому себе задачку придумать и выполнить, придумать задачку обычно тяжелее чем выполнить. И в программировании не хватает именно задачников с решениями

Valiksim · 28.04.2017

arhip1985 сказал(а):
придумать задачку обычно тяжелее чем выполнить

Это мало кто понимает. И ещё меньше тех, кто оценит

zhekan3 · 26.09.2017

Adigen сказал(а):
Он со скрежетом на больших файлах работать и будет, да еще и в один поток только.

Замените код на такой, будет намного быстрее обрабатывать:

C#:

string[] first = File.ReadAllLines(@"c:\file1.txt"); string[] second = File.ReadAllLines(@"c:\file2.txt"); string[] third = second.AsParallel().Except(first.AsParallel()).ToArray(); File.WriteAllLines(@"c:\file2.txt", third);

Дальше, для ускорения, надо делать оптимизацию исходя из конкретики.

Подскажите пожалуйста, как такое же сделать, но со списками? Как исправить код?
Заранее благодарен.

arhip1985 · 26.09.2017

zhekan3 сказал(а):
Подскажите пожалуйста, как такое же сделать, но со списками? Как исправить код?
Заранее благодарен.

ничего исправлять не надо - всё идеально

zhekan3 · 26.09.2017

arhip1985 сказал(а):
ничего исправлять не надо - всё идеально

я имею ввиду - если списки привязаны к проекту, то как изменить код, чтобы в коде был не путь к фалу, а именно список

string[] first = File.ReadAllLines(project.Lists["Listfirst"]);
string[] second = File.ReadAllLines(project.Lists["Listsecond"]);
string[] third = second.AsParallel().Except(first.AsParallel()).ToArray();
File.WriteAllLines(project.Lists["Listsecond"]);

если так изменить, то не работает... подскажите как правильно указать список?

zhekan3 · 26.09.2017

Adigen сказал(а):
Он со скрежетом на больших файлах работать и будет, да еще и в один поток только.

Замените код на такой, будет намного быстрее обрабатывать:

C#:

string[] first = File.ReadAllLines(@"c:\file1.txt"); string[] second = File.ReadAllLines(@"c:\file2.txt"); string[] third = second.AsParallel().Except(first.AsParallel()).ToArray(); File.WriteAllLines(@"c:\file2.txt", third);

Дальше, для ускорения, надо делать оптимизацию исходя из конкретики.

Спасибо за код, полностью рабочий. Подскажите пожалуйста, что сделать чтобы не выскакивала ошибка в многопотоке - "Процесс не может получить доступ к файлу так как этот файл используется другим процессом". В один поток все нормально, а когда больше одного иногда выдает эту ошибку.
Прошу помощи. Заранее благодарен.

Adigen · 27.09.2017

zhekan3 сказал(а):
Спасибо за код, полностью рабочий. Подскажите пожалуйста, что сделать чтобы не выскакивала ошибка в многопотоке - "Процесс не может получить доступ к файлу так как этот файл используется другим процессом". В один поток все нормально, а когда больше одного иногда выдает эту ошибку.
Прошу помощи. Заранее благодарен.

C#:

lock(SyncObjects.ListSyncer){
    string[] first = File.ReadAllLines(@"c:\file1.txt");
    string[] second = File.ReadAllLines(@"c:\file2.txt");
    string[] third = second.AsParallel().Except(first.AsParallel()).ToArray();
    File.WriteAllLines(@"c:\file2.txt", third);
}

Только не понятно зачем это, т.к. файл и так обрабатывается в многопотоке, средствами c#, а используя блокировку, мы другие потоки будем заставлять ожидать свой очереди, и более многопоточного многопотока (во сказанул) не получится. :-)

zhekan3 · 27.09.2017

Adigen сказал(а):
C#:

lock(SyncObjects.ListSyncer){ string[] first = File.ReadAllLines(@"c:\file1.txt"); string[] second = File.ReadAllLines(@"c:\file2.txt"); string[] third = second.AsParallel().Except(first.AsParallel()).ToArray(); File.WriteAllLines(@"c:\file2.txt", third); }

Только не понятно зачем это, т.к. файл и так обрабатывается в многопотоке, средствами c#, а используя блокировку, мы другие потоки будем заставлять ожидать свой очереди, и более многопоточного многопотока (во сказанул) не получится.

Спасибо за ответы, все решил через выход по ошибочной ветке из кубика.

zhekan3 · 29.09.2017

Adigen сказал(а):
C#:

lock(SyncObjects.ListSyncer){ string[] first = File.ReadAllLines(@"c:\file1.txt"); string[] second = File.ReadAllLines(@"c:\file2.txt"); string[] third = second.AsParallel().Except(first.AsParallel()).ToArray(); File.WriteAllLines(@"c:\file2.txt", third); }

Только не понятно зачем это, т.к. файл и так обрабатывается в многопотоке, средствами c#, а используя блокировку, мы другие потоки будем заставлять ожидать свой очереди, и более многопоточного многопотока (во сказанул) не получится.

Еще появился вопрос в процессе. Код удалят только полностью одинаковые строки. Как сделать чтобы удалял по части строки, например сейчас удаляет только точное вхождение строки такое как http://сайт. но не удалит строку http://сайт.ру, т.е. строка http://сайт. и http://сайт.ру вроде одинакова но ее не удаляет. Не пойму как сделать поиск по части строки. Заранее всем спасибо.

smartwisard · 13.09.2018

Adigen сказал(а):
Он со скрежетом на больших файлах работать и будет, да еще и в один поток только.

Замените код на такой, будет намного быстрее обрабатывать:

C#:

string[] first = File.ReadAllLines(@"c:\file1.txt"); string[] second = File.ReadAllLines(@"c:\file2.txt"); string[] third = second.AsParallel().Except(first.AsParallel()).ToArray(); File.WriteAllLines(@"c:\file2.txt", third);

Дальше, для ускорения, надо делать оптимизацию исходя из конкретики.

Я правильно понял, что этот код может удалить из файла 2 всё, что есть в файле 1?

alexsandroid · 04.11.2018

Adigen сказал(а):

C#:

string[] first = File.ReadAllLines(@"c:\file1.txt");
string[] second = File.ReadAllLines(@"c:\file2.txt");
string[] third = second.AsParallel().Except(first.AsParallel()).ToArray();
File.WriteAllLines(@"c:\file2.txt", third);

А если нужно чтобы в результате сохранялась такая же последовательность строк как и в исходных данных?
Так будет правильно?

Код:

string[] first = File.ReadAllLines(@"c:\file1.txt");
string[] second = File.ReadAllLines(@"c:\file2.txt");
string[] third = second.AsParallel().AsOrdered().Except(first.AsParallel().AsOrdered()).ToArray();
File.WriteAllLines(@"c:\file3.txt", third);

Наверное я тут вообще не в тему, т.к. у мне нужно сравнивать списки в которых всего лишь 30 строк.

irving zisman · 11.07.2020

Друзья, а как можно ускорить вот этот код......
К примеру таблицу из 9000 строк он обрабатывает минуты 3, это очень долго и по моим меркам таблица маленькая, в задачах стоит обрабатывать в среднем по 100-500к строк.

Поясню что делает код: Есть таблица с двумя столбиками, нам нужен только первый столбец, берем оттуда первую строку, и сравниваем с каждой последующей, если находится дубль, удаляем. Когда дошли до последний строки, берем вторую строку и делаем все тоже самое, затем третью и тд.

C#:

IZennoTable table = project.Tables["base"];

lock (SyncObjects.TableSyncer)
{
for (int i = 0; i < table.RowCount; i++)
{
    for (int j = i + 1; j < table.RowCount; j++)
    {
        if (table.GetCell("A", i) == table.GetCell("A", j))
        {
            table.DeleteRow(j); j--;
        }
    }
}
}

Не обязательно работать именно с таблицей, можно все эти данные занести в список, но тогда нужно учитывать, что все что идет после разделителя "." нам не важно. (образно это будет столбец B)

Sergodjan · 11.07.2020

irving zisman сказал(а):
Друзья, а как можно ускорить вот этот код......
К примеру таблицу из 9000 строк он обрабатывает минуты 3, это очень долго и по моим меркам таблица маленькая, в задачах стоит обрабатывать в среднем по 100-500к строк.

Поясню что делает код: Есть таблица с двумя столбиками, нам нужен только первый столбец, берем оттуда первую строку, и сравниваем с каждой последующей, если находится дубль, удаляем. Когда дошли до последний строки, берем вторую строку и делаем все тоже самое, затем третью и тд.

C#:

IZennoTable table = project.Tables["base"]; lock (SyncObjects.TableSyncer) { for (int i = 0; i < table.RowCount; i++) { for (int j = i + 1; j < table.RowCount; j++) { if (table.GetCell("A", i) == table.GetCell("A", j)) { table.DeleteRow(j); j--; } } } }

Не обязательно работать именно с таблицей, можно все эти данные занести в список, но тогда нужно учитывать, что все что идет после разделителя "." нам не важно. (образно это будет столбец B)

Попробуйте на вашей таблице протестировать стандартный кубик удаления дублей, может быть он будет быстрее обрабатывать.

irving zisman · 11.07.2020

@sergodjan66 Спасибо! Что-то я в дебри полез и не подумал о таком простом способе, работает отлично, пару секунд и таблица в 350к строк почистилась!
Но заметил странность, этот метод не удалил все дубли, какие-то остались, только после второго запуска, спустя 3 секунды, все до конца почистилось. Это не глюк, проверил на четырех базах. Возможно причина в том, что перед этим эта база была привязана к списку, затем я ее привязываю к таблице.

ЗЫ Проверил сейчас без привязки в списку, все ок, в этом проблема была

Sergodjan · 11.07.2020

irving zisman сказал(а):
Возможно причина в том, что перед этим эта база была привязана к списку, затем я ее привязываю к таблице.

Да, привязка файла должна осущ. к чему то одному.

Сколько строк из списка Зенка может переварить не подавившись?

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Client

Administrator

Client

Administrator

Кто просматривает тему: (Всего: 1, Пользователи: 0, Гости: 1)