texrdcom
Новичок
подскажите алгоритм определения кодировки - русско язычной
Подскажите алгоритм определения кодировки - русско язычной.
То что нашел на форуме не очень устраивает,
функция (tony...) не срабатывает на словах с заглавных букв,
для примера ПРОБА ... - это не критика а так замечание.
По инету нарыл еще два
1) Подсчет определенных букв в тексте(практически не применим для текста длиной в одно слово)
2) Подсчет возможных и не возможных сочетаний символов в русском языке . - более приемлемый - Но возможно кто то знает еще какой-то алгоритм - подскажите.
А надо это добро для определения кодировок электронных писем, так как, выборочно проанализировав несколько тысяч писем в the-bat на локале натолкнулся на несколько в которых указана кодировка в оглавлении, но она не соответствует действительности
Подскажите алгоритм определения кодировки - русско язычной.
То что нашел на форуме не очень устраивает,
функция (tony...) не срабатывает на словах с заглавных букв,
для примера ПРОБА ... - это не критика а так замечание.
По инету нарыл еще два
1) Подсчет определенных букв в тексте(практически не применим для текста длиной в одно слово)
2) Подсчет возможных и не возможных сочетаний символов в русском языке . - более приемлемый - Но возможно кто то знает еще какой-то алгоритм - подскажите.
А надо это добро для определения кодировок электронных писем, так как, выборочно проанализировав несколько тысяч писем в the-bat на локале натолкнулся на несколько в которых указана кодировка в оглавлении, но она не соответствует действительности
