#xml #encoding #entityreference
#xml #кодирование #entityreference
Вопрос:
В чем разница между ссылками на кодировку и сущности в xml?
Ответ №1:
Кодирование относится к способу представления символа последовательностью байтов. Это происходит на довольно низком уровне в цепочке обработки: вы считываете байты и используете кодировку для преобразования в поток символов. ASCII, Latin-1 и UTF-8 являются примерами кодировок.
Ссылки на сущности обрабатываются самим анализатором XML. Последовательность символов, начинающаяся amp;
и заканчивающаяся ;
, используется для представления другой последовательности символов (обычно только одного). Это происходит на довольно высоком уровне, концептуально «после» синтаксического анализатора XML определил, где находятся теги. Вот почему amp;<
превращается в обычный старый знак меньше, чем знак, а не в начало тега.
Комментарии:
1. итак, если я заменю ‘%’ на ‘amp; # 37;’ это ссылка на кодировку или объект?
2. @SoftwareGeek Это ссылка на сущность. Слово «encoding» также может использоваться для описания ссылки на объект в том смысле, что это способ «кодирования» вещей в смысле английского языка, но обычно, когда люди используют слово encoding в таком контексте, они имеют в виду кодировку символов, которой это не является.