Фонетическая перекодировка

tche · 24 Окт 2003

Фонетическая перекодировка

существует ли что-то готовое на ПХП? То есть необходима функция, которая берет строку типа 'Müller' и переделывает ее в 'Muller', то есть без аксанов, умляутов и т.п.
Винды это потой делают сами при copy/paste, например выделить французский текст мышей и вспомнить его в FAR, то вместо аксанов получим соотвествующие ближайшие буквы.
Спасибо,
Дима

HEm · 24 Окт 2003

[m]ord[/m] [m]chr[/m]
ты же не думаешь что фар проверяет похожесть букв? типа с французского и русского например

tche · 24 Окт 2003

не очень понял, при чем здесь вышеуказанные функции. Я пытаюсь понять, есть ли какая-то четкая зависимость, как превратить спецсимвол в соотв. букву, например

в букву e превращать è é ê

в букву o превращать ð ò &ocirk;

и т.п.

пока есть 2 соображения:
1. брать букву, которая идет сразу за &
2. создать таблицу соответсвий на все случаи жизни, благо таковых вполне конечно число, и тупо заменять.

пока склоняюсь к последнему, это надежно, хотя и неспортивно

HEm · 24 Окт 2003

откуда ты берешь эти буквы?

[m]strtr[/m] тебе поможет

Vasya · 24 Окт 2003

Все дело в том, как эти умляуты кодируются...
В некоторых кодировках они кодируются так:
- ставится байт букивки U в обычной ASCII
- после нее ставится байт (>0x80) который обозначает "ставим умляут на предыдущую букивку"
Ферштейн?

tche · 25 Окт 2003

Автор оригинала: Vasya
Все дело в том, как эти умляуты кодируются...
В некоторых кодировках они кодируются так:
- ставится байт букивки U в обычной ASCII
- после нее ставится байт (>0x80) который обозначает "ставим умляут на предыдущую букивку"
Ферштейн?

ДА, то есть можно ориентироваться на первую букву, но это неуниверсально, например, в случае легатуры и еще некоторых.

Фонетическая перекодировка

tche

Новичок

HEm

Сетевой бобер

tche

Новичок

HEm

Сетевой бобер

Vasya

Guest

tche

Новичок