#html #unicode #encoding #character
#HTML #юникод #кодирование #символ
Вопрос:
В нашем приложении есть проблема с качеством данных. В основном некоторые символы из очень давних времен не были сохранены со стандартными символами.
Тире отображаются как amp;#150
;
Апостроф отображается как amp;#146
;
и т.д.
Является ли это стандартным Юникодом? Я искал несколько таблиц, но не смог найти amp;#150
или amp;#146
, которые соответствуют ожидаемым символам пунктуации.
Кроме того, есть ли простой способ отобразить эти символы HTML? Прямо сейчас в некоторых редакторах он отображается в виде квадратных полей, а в Notepad он отображается как SPA (в черном поле).
Комментарии:
1. Это похоже на некоторую частную транслитерацию, подобную европейскому алфавиту Войнича , где элементы управления типа
amp;#146;
илиamp;#150;
отображаются на отображаемые глифы. Для их отображения по назначению вам нужен связанный шрифт…2. Объект HTML
amp;#150;
— это кодовая точка ЮникодаU 0096 START OF GUARDED AREA
, которую браузер может отображать как тире. А объект HTMLamp;#146;
— это кодовая точка ЮникодаU 0092 PRIVATE USE TWO
, которую браузер может отображать как апостроф. Это зависит от используемого шрифта.