Ссылки на XML-объекты в сравнении с кодировкой

#xml #encoding #entityreference

#xml #кодирование #entityreference

Вопрос:

В чем разница между ссылками на кодировку и сущности в xml?

Ответ №1:

Кодирование относится к способу представления символа последовательностью байтов. Это происходит на довольно низком уровне в цепочке обработки: вы считываете байты и используете кодировку для преобразования в поток символов. ASCII, Latin-1 и UTF-8 являются примерами кодировок.

Ссылки на сущности обрабатываются самим анализатором XML. Последовательность символов, начинающаяся amp; и заканчивающаяся ; , используется для представления другой последовательности символов (обычно только одного). Это происходит на довольно высоком уровне, концептуально «после» синтаксического анализатора XML определил, где находятся теги. Вот почему amp;< превращается в обычный старый знак меньше, чем знак, а не в начало тега.

Комментарии:

1. итак, если я заменю ‘%’ на ‘amp; # 37;’ это ссылка на кодировку или объект?

2. @SoftwareGeek Это ссылка на сущность. Слово «encoding» также может использоваться для описания ссылки на объект в том смысле, что это способ «кодирования» вещей в смысле английского языка, но обычно, когда люди используют слово encoding в таком контексте, они имеют в виду кодировку символов, которой это не является.