Фонетическая перекодировка

tche

Новичок
Фонетическая перекодировка

существует ли что-то готовое на ПХП? То есть необходима функция, которая берет строку типа 'Müller' и переделывает ее в 'Muller', то есть без аксанов, умляутов и т.п.
Винды это потой делают сами при copy/paste, например выделить французский текст мышей и вспомнить его в FAR, то вместо аксанов получим соотвествующие ближайшие буквы.
Спасибо,
Дима
 

HEm

Сетевой бобер
[m]ord[/m] [m]chr[/m]
ты же не думаешь что фар проверяет похожесть букв? типа с французского и русского например
 

tche

Новичок
не очень понял, при чем здесь вышеуказанные функции. Я пытаюсь понять, есть ли какая-то четкая зависимость, как превратить спецсимвол в соотв. букву, например

в букву e превращать è é ê

в букву o превращать ð ò &ocirk;

и т.п.

пока есть 2 соображения:
1. брать букву, которая идет сразу за &
2. создать таблицу соответсвий на все случаи жизни, благо таковых вполне конечно число, и тупо заменять.

пока склоняюсь к последнему, это надежно, хотя и неспортивно
 

HEm

Сетевой бобер
откуда ты берешь эти буквы?

[m]strtr[/m] тебе поможет
 

Vasya

Guest
Все дело в том, как эти умляуты кодируются...
В некоторых кодировках они кодируются так:
- ставится байт букивки U в обычной ASCII
- после нее ставится байт (>0x80) который обозначает "ставим умляут на предыдущую букивку"
Ферштейн? :)
 

tche

Новичок
Автор оригинала: Vasya
Все дело в том, как эти умляуты кодируются...
В некоторых кодировках они кодируются так:
- ставится байт букивки U в обычной ASCII
- после нее ставится байт (>0x80) который обозначает "ставим умляут на предыдущую букивку"
Ферштейн? :)
ДА, то есть можно ориентироваться на первую букву, но это неуниверсально, например, в случае легатуры и еще некоторых.
 
Сверху