Severip
Client
- Регистрация
- 17.10.2013
- Сообщения
- 346
- Благодарностей
- 98
- Баллы
- 28
Просьба еще помочь с регуляркой.
Задача: по концу предложения разделить исходный текст регулярками на анонс (около 600 символов) и основную часть, т.е. сделать два текста без повторяющихся предложений.
Вот что у меня получилось:
Первая регулярка (вроде работает): \A[\w\W]{1,600}\w\.
Вторая: (?<=\A[\w\W]{1,600}\w\.)[\w\W]*\Z
начинает брать текст с "В администрации", т.е. тексты пересекаются.
Как исправить вторую, чтобы брало со слов "В сентябре" ???
Вот исходный текст:
---------------------------------
Солдат израильской армии запускает беспилотник Фото: REUTERS 2015
О срыве сделки агентству анонимно рассказал израильский чиновник, который не был уполномочен обсуждать этот вопрос под запись.
2 --> В администрации премьер-министра Нетаньяху, Минобороны Израиля и компании IAI, изготовителе БПЛА, отказались от комментариев.
Агентство пишет, что в октябре 2014 года во время визита в Израиль главы украинского МИДа Павла Климкина он заявил местным журналистам, что его страна очень заинтересована в поставках израильских беспилотников, чтобы мониторить соблюдение перемирия с ополченцами. <-- 1
? --> В сентябре, напоминает агентство, второй канал израильского телевидения сообщал, что компания IAI договорилась о продаже Украине беспилотников, однако сделка была сорвана под давлением ее противников в правительстве Израиля.
СМИ сообщали, что сделку заблокировал МИД Израиля, опасающийся испортить отношения с Россией.
По словам научного сотрудника Института исследований национальной безопасности в Тель-Авиве Сары Файнберг, Израиль воздерживался от поставок вооружений Киеву в надежде, что Россия не будет поставлять ЗРК С-300 Ирану, но теперь собирается пересмотреть свою позицию.
Источник агентства в Израиле полагает, что Россия отказывалась поставлять зенитно-ракетные комплексы Ирану, чтобы не сорвать закупку израильских беспилотников, но, получив первые образцы этой технологии, перестала рассматривать эту сделку как сдерживающий фактор...
Задача: по концу предложения разделить исходный текст регулярками на анонс (около 600 символов) и основную часть, т.е. сделать два текста без повторяющихся предложений.
Вот что у меня получилось:
Первая регулярка (вроде работает): \A[\w\W]{1,600}\w\.
Вторая: (?<=\A[\w\W]{1,600}\w\.)[\w\W]*\Z
начинает брать текст с "В администрации", т.е. тексты пересекаются.
Как исправить вторую, чтобы брало со слов "В сентябре" ???
Вот исходный текст:
---------------------------------
Солдат израильской армии запускает беспилотник Фото: REUTERS 2015
О срыве сделки агентству анонимно рассказал израильский чиновник, который не был уполномочен обсуждать этот вопрос под запись.
2 --> В администрации премьер-министра Нетаньяху, Минобороны Израиля и компании IAI, изготовителе БПЛА, отказались от комментариев.
Агентство пишет, что в октябре 2014 года во время визита в Израиль главы украинского МИДа Павла Климкина он заявил местным журналистам, что его страна очень заинтересована в поставках израильских беспилотников, чтобы мониторить соблюдение перемирия с ополченцами. <-- 1
? --> В сентябре, напоминает агентство, второй канал израильского телевидения сообщал, что компания IAI договорилась о продаже Украине беспилотников, однако сделка была сорвана под давлением ее противников в правительстве Израиля.
СМИ сообщали, что сделку заблокировал МИД Израиля, опасающийся испортить отношения с Россией.
По словам научного сотрудника Института исследований национальной безопасности в Тель-Авиве Сары Файнберг, Израиль воздерживался от поставок вооружений Киеву в надежде, что Россия не будет поставлять ЗРК С-300 Ирану, но теперь собирается пересмотреть свою позицию.
Источник агентства в Израиле полагает, что Россия отказывалась поставлять зенитно-ракетные комплексы Ирану, чтобы не сорвать закупку израильских беспилотников, но, получив первые образцы этой технологии, перестала рассматривать эту сделку как сдерживающий фактор...