qru
Новичок
Разбивка в определенном месте регулярного выражения
Добрый день..
Задача у меня следующия - необходимо найти в тексте окончания предложений и разбить текст по предложениям в массив.
Если использовать к примеру $text1mas = explode (". ", $text1); то строки с инициалами и т.п. разбиваются не верно (ведь точка там - не конец предложения).
Я пытался использовать такое вот регулярное выражение (php не русский у меня на хосте):
'[АБВГДЕЁЖЗИЙКЛМНОРПСТУФХЦЧШЩЪЬЫЭЮЯабвгдеёжзийклмнорпстуфхцчшщъьыэюяA-Za-z]+(\.)( )[АБВГДЕЁЖЗИЙКЛМНОРПСТУФХЦЧШЩЪЬЫЭЮЯA-Z][АБВГДЕЁЖЗИЙКЛМНОРПСТУФХЦЧШЩЪЬЫЭЮЯабвгдеёжзийклмнорпстуфхцчшщъьыэюяA-Za-z]*'
Но сколько функций разных не перепробывал (типа preg_match, split и т.п) - никак не получается сделать чтобы разбивка происходила в определенном месте регулярного выражения (там где пробел)...
При этом ничего страшного если в некоторых ячейках массива попадет не одно а 2-3 предложения.
Буду признателен за помощь.. Возможно есть какая-то функция или комбинация функций для осуществления пободного действия.
Спасибо.
Добрый день..
Задача у меня следующия - необходимо найти в тексте окончания предложений и разбить текст по предложениям в массив.
Если использовать к примеру $text1mas = explode (". ", $text1); то строки с инициалами и т.п. разбиваются не верно (ведь точка там - не конец предложения).
Я пытался использовать такое вот регулярное выражение (php не русский у меня на хосте):
'[АБВГДЕЁЖЗИЙКЛМНОРПСТУФХЦЧШЩЪЬЫЭЮЯабвгдеёжзийклмнорпстуфхцчшщъьыэюяA-Za-z]+(\.)( )[АБВГДЕЁЖЗИЙКЛМНОРПСТУФХЦЧШЩЪЬЫЭЮЯA-Z][АБВГДЕЁЖЗИЙКЛМНОРПСТУФХЦЧШЩЪЬЫЭЮЯабвгдеёжзийклмнорпстуфхцчшщъьыэюяA-Za-z]*'
Но сколько функций разных не перепробывал (типа preg_match, split и т.п) - никак не получается сделать чтобы разбивка происходила в определенном месте регулярного выражения (там где пробел)...
При этом ничего страшного если в некоторых ячейках массива попадет не одно а 2-3 предложения.
Буду признателен за помощь.. Возможно есть какая-то функция или комбинация функций для осуществления пободного действия.
Спасибо.