Результаты поиска

  1. Аркадий

    Как спарсить все заголовки видео на канале в Youtube

    Спасибо)) Буду разбираться))
  2. Аркадий

    Как спарсить все заголовки видео на канале в Youtube

    Не заметил его) Спасибо) А это единственный способ или есть еще варианты реализации ajax подгрузки?)
  3. Аркадий

    Как спарсить все заголовки видео на канале в Youtube

    Здравствуйте) Пишу шаблон, который смог бы спарсить все заголовки видео на канале в Youtube. Шаблон работает так: 1. Логинимся на youtube 2. Переходим на нужный канал, который указывается во входных данных 3. Переходим по ссылки Видео (чтобы видеть все видео канала) 4. Собираем заголовки видео...
  4. Аркадий

    AJAX подгрузка страницы на Авито - как решить?

    Здравствуйте) В академических целях пишу шаблон для авито, который парсит контакты. Столкнулся с проблемой ajax загрузки контента. По умолчанию авито подгружает примерно 30 объявлений, но как мне получить 60,90 и т.д.? Если мышкой прокрутить вниз страницы, через браузер, то идет динамическая...
  5. Аркадий

    Как обработать большой массив данных регуляркой?

    Да))) То что нужно!) Проверил на 10 000 сайтах ваш вариант, ни одного зависания)) Огромнейшее спасибо))))) Вот эту часть правда немного не понял (?s:(?=""((?!<a {0,2}href).) Особенно ?s: это видимо спицифика C#?
  6. Аркадий

    Как обработать большой массив данных регуляркой?

    Ваш вариант регулярки не найдет ссылку на контакты вот в этом примере: </li><li class="normal"> <a href="warranty/"> <span class="navigation-item-text">Гарантия</span> </a> </li><li class="normal"> <a href="contact-us/"> <span class="navigation-item-bullet">></span> <span...
  7. Аркадий

    Как обработать большой массив данных регуляркой?

    Да, видимо все же придется изменить регулярку. Правда искать будет хуже. Ваш вариант работает, но не справляется с примером выше) Эх..
  8. Аркадий

    Как обработать большой массив данных регуляркой?

    Действительно, так и буду делать)
  9. Аркадий

    Как обработать большой массив данных регуляркой?

    Проверил на примере перекрепленном в теме вроде работает. Но вот только странная штука, если содержимое страницы получить предварительно через GET запрос и так же положить в переменную dom, а после обработать указанным C# кодом, то шаблон снова виснет... Почему? Хотя этот же C# код...
  10. Аркадий

    Как обработать большой массив данных регуляркой?

    Этот вариант регулярного выражения хуже работает. Он не найдет вот такой вариант: </li><li class="normal"> <a href="warranty/"> <span class="navigation-item-text">Гарантия</span> </a> </li><li class="normal"> <a href="contact-us/"> <span class="navigation-item-bullet">></span> <span...
  11. Аркадий

    Как обработать большой массив данных регуляркой?

    Да, забыл в переменную dom вложить данные:) Исправил, шаблон перезалил. Попробуйте еще раз пожалуйста. В самом ZP так же виснит.
  12. Аркадий

    Как обработать большой массив данных регуляркой?

    Здравствуйте! Столкнулся с такой проблемой. Если в переменной содержится большой массив данных для обработки, то кубик с регулярным выражением начинает подвисать. Прикрепляю пример. В переменной dom содержатся теги - ссылки около 10 000. Задача регулярного выражения: "найти ссылку ведущую на...
  13. Аркадий

    В базе макросов такого макроса нет

    А вы можете помочь немого изменить этот код? Он удаляет комментарии со страницы, а нужно чтобы наоборот находил все комментарии. (Первый вариант) И еще, как сделать, чтобы он находил ни все комментарии, а только последний вариант? (Второй вариант) string Test = project.Variables["dom"].Value...
  14. Аркадий

    Помогите с С# кодом

    А можно еще чуть сократить код?:) Алгоритм такой: - берем из переменной dom - получаем все ссылки регуляркой - кладем все ссылки в переменную dom?
  15. Аркадий

    Помогите с С# кодом

    Саму проблему описывать не стал) Проблема ни в скорости) Для шаба нужен такой код)
  16. Аркадий

    Помогите с С# кодом

    Здравствуйте! Не силен в C# коде, поэтому обращаюсь за помощью:) Очень нужно заменить 2 кубика на 1 кубик с С# кодом. Первый кубик: - получает переменную {-Variable.dom-} - осуществляет поиск всех ссылок на странице <a .*?a>, берет все значения - кладет все значения в список href Второй...
  17. Аркадий

    Виснит регулярка при получении страницы через GET запрос. Баг?

    Протестил. Вставил после GET запроса кубик с кодом C#, отрабатывает, но почему то вторая регулярка работает плохо, т.е. вместо utf-8 она находит просто 8. Хотя если эту регулярку протестить в тестере, то находит utf-8...
  18. Аркадий

    Виснит регулярка при получении страницы через GET запрос. Баг?

    А не могли бы вы помочь встроить его в шаблон? А то в C# не силен)
  19. Аркадий

    Виснит регулярка при получении страницы через GET запрос. Баг?

    Обязательно? А почему? Вроде и так работает без ошибок:) Запустил Ваш пример. Сработало, но очень долго выполняется... Больше тут ничего не придумать? А можно ли сделать так: если кубик с регуляркой не выполнится в течении 10 секунд, то перейти к другому действию? Мой шаблон постоянно об...
  20. Аркадий

    Виснит регулярка при получении страницы через GET запрос. Баг?

    Здравствуйте! Пишу шаблон, который GET запросом получает содержимое страницы, после чего при помощи регулярки поэтапно получает нужную информацию. В целом данный шаблон работает хорошо. Но столкнулся с проблемой: При работе зенопостера он просто не мог пройти дальше, как будто завис, но при...
  21. Аркадий

    Как получить содержимое страницы GET запросом без квакозябр?

    Спасибо)) Видимо это единственный способ) Без GET запроса на проверку кодировки тут не обойтись) А можете помочь с кодом на C#? А то в нем не силен)
  22. Аркадий

    Как получить содержимое страницы GET запросом без квакозябр?

    Спасибо)) Видимо это единственный способ) Без GET запроса на проверку кодировки тут не обойтись)
  23. Аркадий

    Как получить содержимое страницы GET запросом без квакозябр?

    Не вариант, так как кодировка в экшене устанавливается вручную. Для некоторых мне нужно utf8 для других (их меньше) windows1251 Конечно можно и проверку предварительную делать (лишний запрос), но не хотелось бы, так как это повлияет на скорость работы шаблона. Этот вариант рассматриваю, но...
  24. Аркадий

    Как получить содержимое страницы GET запросом без квакозябр?

    Не вариант, так как кодировка в экшене устанавливается вручную. Для некоторых мне нужно utf8 для других (их меньше) windows1251
  25. Аркадий

    Как получить содержимое страницы GET запросом без квакозябр?

    Здравствуйте! Не могу решить такую проблему: Имеется шаблон, который отправляет экшеном GET запрос на сайты (кодировка по умолчанию в экшене стоит utf-8) и получает содержимое страницы. Если сервер отдает содержимое в кодировке utf-8, то проблем нет, весь текст читаем, а если отдает в windows...
  26. Аркадий

    Бесплатно напишу регулярное выражение. Часть 2.

    Спасибо все работает)) Даже немного усовершенствовать получилось)))
  27. Аркадий

    Парсинг при помощи Яндекс XML

    Да, я тоже убедился, что купить легче, при том ни так дорого. Ну или аккаунт в аренду взять, тоже вариант)
  28. Аркадий

    Парсинг при помощи Яндекс XML

    Сделал шаблон, в который загружаю кучу запросов и он вытаскивает из Яндекса по каждому запросу 1000 сайтов, все работает прекрасно. Правда сам шаблон еще улучшать нужно, чтобы удобней им было управлять и формировать свою базу сайтов по тематикам) С вопросами разобрался: 1. Авторизацию в шаблоне...
  29. Аркадий

    Бесплатно напишу регулярное выражение. Часть 2.

    А можно вашу регулярку еще немного улучшить, чтобы она справлялась и с таким вариантом? (пробовал свои варианты, но безрезультатно) </li><li class="normal"> <a href="warranty/"> <span class="navigation-item-text">Гарантия</span> </a> </li><li...
  30. Аркадий

    Бесплатно напишу регулярное выражение. Часть 2.

    ах вот оно что))) потестил, вроде работает) Получается вы одной регуляркой сразу 2 действия сделали)) Попробую разобраться в ней) Спасибо)))
  31. Аркадий

    Бесплатно напишу регулярное выражение. Часть 2.

    Это первое, что я сделал, когда увидел ваш пост))) Проблема в том, что если бы Контакты находились в середине то "Брать последнее совпадение", как вы написали, не помогло бы решить задачу)
  32. Аркадий

    Бесплатно напишу регулярное выражение. Часть 2.

    Ни то что хотелось бы. Нужно написать универсальную регулярку из расчета, что контакты могут быть не последними. А получить регуляркой нужно вот такую конструкцию <a href="/index.php/kontakty" >Контакты</a> или вот такую <a href="/index.php/kontakty" class="menu"><span...
  33. Аркадий

    Бесплатно напишу регулярное выражение. Часть 2.

    Столкнулся еще с одной проблемой... Попытался сам составить регулярное выражение и вроде регулярка должна работать как надо, но... Задача состоит в следующем: Имеется DOM дерево сайта. При помощи регулярного выражения нужно: 1. найти вот такую конструкци <a href="/index.php/kontakty"...
  34. Аркадий

    Парсинг при помощи Яндекс XML

    Понял) обязательно гляну)) Спасибо))
  35. Аркадий

    Бесплатно напишу регулярное выражение. Часть 2.

    Скажите, а восклицательный знак какую роль в регулярке играет? Читал книгу по регулярки и что то там не было восклицательного метасимвола)))
  36. Аркадий

    Бесплатно напишу регулярное выражение. Часть 2.

    Спасибо)) попробую разобрать ваш шаблон)
  37. Аркадий

    Бесплатно напишу регулярное выражение. Часть 2.

    Тоже уже думал о таком решении:) Хотелось бы еще варианты, если они есть. Я так понял, что в регулярном выражении нельзя указать: искать email, кроме [email protected] ?
  38. Аркадий

    Бесплатно напишу регулярное выражение. Часть 2.

    Ну как бы задачу решили) Только решение не универсальное)) Еще раз пост дополню) HTML разметка может быть любой, этого я не уточнил, моя вина)
  39. Аркадий

    Бесплатно напишу регулярное выражение. Часть 2.

    Пост выше немного дополнил, а то ни совсем точно описал задачу. Т.е. нужно, чтобы email адрес "[email protected]" пропускался и находился обычный email адрес пользователя. При этом "[email protected]" может находится или первым или вторым
  40. Аркадий

    Бесплатно напишу регулярное выражение. Часть 2.

    Не могу решить вот такую задачу, если ее вообще можно решить при помощи регулярного выражения. Есть DOM дерево, где находятся 2 email адреса: Пример: "текст<span class='mail'>[email protected]</span>Тут какой нибудь текст<div id='main-mail'>[email protected]</div>опять текст" Возможно ли, чтобы...
  41. Аркадий

    Бесплатно напишу регулярное выражение. Часть 2.

    Спасибо) Вот теперь справляется, возьму на вооружение) потестим)))
  42. Аркадий

    Бесплатно напишу регулярное выражение. Часть 2.

    Спасибо за ссылку)) Обязательно гляну:)
  43. Аркадий

    Парсинг при помощи Яндекс XML

    Только это или еще как то можно использовать?:) И еще такой вопрос: через GET можно ведь получить только 1000 сайтов по определенному поисковому запросу? К примеру в выдачи (если через браузер) то Яндекс показывает 100 страниц по 10 документов на каждой. Через GET такие же ограничения? Или там...
  44. Аркадий

    Парсинг при помощи Яндекс XML

    Мда... ну я слепой))) Спасибо) Нужно проверить, виляет ли тип поска на поисковую выдачу)
  45. Аркадий

    Парсинг при помощи Яндекс XML

    Еще вопрос: В настройках яндекс xml нужно указать IP для того, чтобы можно было получать ответы, если IP другой, то ответы приходить не будут. Так вот.. возможно ли IP менять на нужное через GET запросы или только через браузер?
  46. Аркадий

    Парсинг при помощи Яндекс XML

    Попробовал найти эту опцию в настройках, но чего то нету) Не подскажите где она?
  47. Аркадий

    Парсинг при помощи Яндекс XML

    Я так понимаю диапозон страниц указывать в GET запросе нельзя? И максимальное количество сайтов за 1 запрос это 100? Соответственно мне нужно 10 запросов, чтобы спарсить 1000 сайтов. У меня всего 10 лимитов)))
  48. Аркадий

    Парсинг при помощи Яндекс XML

    Здравствуйте! Недавно открыл для себя новую информацию, оказывается спарсить сайты в поисковой выдачи можно гораздо быстрее, используя Яндекс XML. Решил разобраться в этой теме, но вот информации в интернете маловато... Да пишут, что такое яндекс xml, что такое лимиты, а вот как правильно...