помогите пожалуйста составить регулярноевыражение для preg_grep

mikemike · 15 Янв 2009

помогите пожалуйста составить регулярноевыражение для preg_grep

Приветствую!

Есть массив русских слов - каждый элемент масива, отдельное слово.
подскажите ,как с помощью preg_grep оставить в масиве слова с заглавной буквы, а все слова которые начинаются с прописной буквы, удалить (в том числе если слово начинается с кавычек).

x-yuri · 15 Янв 2009

http://phpfaq.ru/regexp
http://ua2.php.net/manual/ru/function.preg-grep.php

mikemike · 15 Янв 2009

понимаю что мое сообщение похоже на сообщение лентяя, но поверьте, читал я мануал, еще читал это http://ruscoder.ru/2008/06/08/regulyarnye_vyrazheniya_na_php.html

вот что уменя получилось $words=preg_grep('/[А-ЯA-Z]{1}[а-яa-z]+/', $words);
но не всегда работает.
Я понимаю что ответ где-то рядом, направьте на истинный путь...

x-yuri · 15 Янв 2009

во-первых у тебя нету привязки к началу строки
во-вторых, если речь о cp1251, в диапазон А-Я не попадает Ё, так как диапазон определяется кодами символов (http://ru.wikipedia.org/wiki/Cp1251)

-~{}~ 15.01.09 17:15:

в-третьих присутствие/отсутствие {1} ни на что не виляет
в-четвертых, если будет привязка к началу строки, то многое из твоего шаблона не понадобится

mikemike · 15 Янв 2009

спасибо за ответ.
тое нужно так?
$words=preg_grep('/^[А-ЯA-Z][а-яa-z]+$/', $words);
речь идет о UTF-8

HraKK · 15 Янв 2009

А я бы вообще сделал бы без preg, что-то типа такого:

PHP:

<?php

function cut( &$value )
{
    $upper = mb_strtoupper($value[0]);
    if( $value === $upper )
    {
        return;
    }
    
    unset( $value );
}
$array = array( 'Голубцы', 'котлеты', 'Ёжики', 'индуссы с pregom');
array_map( 'cut', $array);
var_dump($array);

mikemike · 15 Янв 2009

HraKK
Спасибо что развернули мое мышление в другую сторону! зациклился я на этих регулярных выражениях. Сейчас попробую внедрить!

x-yuri · 15 Янв 2009

HraKK а что быстрее? не факт, что это заметно ускорит генерацию странички
mikemike '/^[А-ЯA-Z]/u'

HraKK · 15 Янв 2009

Скорее даже не ускорит, я не сказал что это единственно правельный. Это нетипичная задача для строковых, поэтопу grep тут лучше наверно, просто я привык все решать если возможно без регулярок, вот и написал. Но самое главно что скорость тут не играет решающию роль, а вот еслиб ТС подумал бы об алтернативе регулярок то давно бы решил эту проблему и забыл - вот я к чему))

mikemike · 15 Янв 2009

x-yuri
благодарю! Работает!
просьба - объясните мне тупому, что делает /u?

я нашел инфу /u — означает, что следующий символ регулярного выражения преобразуется в верхний регистр.

^ -начало строки, тут все понятно
[А-ЯA-Z] - диапазон символов - тоже понимаю.

но что как вданном примере работает /u? ума не приложу...

x-yuri · 15 Янв 2009

http://ua2.php.net/manual/ru/reference.pcre.pattern.modifiers.php

-~{}~ 15.01.09 18:13:

это не часть регулярного выражения, это его модификатор

mikemike · 15 Янв 2009

врубился...
эта регулярка означает дословно "если в начале строки есть заглавная буква в кодировке UTF-8"

правильно?

Спасибо большое! теперь для меня это не такой темный лес как было до этого топика...

помогите пожалуйста составить регулярноевыражение для preg_grep

mikemike

Новичок

x-yuri

Новичок

mikemike

Новичок

x-yuri

Новичок

mikemike

Новичок

HraKK

Мудак

mikemike

Новичок

x-yuri

Новичок

HraKK

Мудак

mikemike

Новичок

x-yuri

Новичок

mikemike

Новичок