htmlentities и htmlspecialchars к сожалению не помогают
htmlentities выдает строку & auml ;& cedil ; & frac34 ; (пробелы вставлены мною) на иероглиф 举 код которого 4E3E (шестнадцатиричная запись) & # 20030 (десятеричная запись)
почему не просто в nnnn ?
Это уже в идеале, & # x nnnn; в nnnn превратить никакого труда уже не составит. nnnn это конечная цель.
даже если получить его в виде & # NNNNN (десятеричная запись), то уже было бы легче
кстати, интересное наблюдение - при редактировании этого поста в форме на месте иероглифа оказывается его десятеричная запись & # 20030 ; т.е. при написании поста я просто копирую и вставляю иероглиф в форму, а при редактировании на его месте десятеричная запись. Вот, собственно мне бы так
