Вопрос о кодировке символов

#unicode #utf-8 #character-encoding #terminology

#Юникод #utf-8 #кодировка символов #терминология

Вопрос:

Если Unicode является стандартом, а UTF-8 является типом ecoding для этого стандарта, почему я могу сохранить текстовый документ как любой из них в блокноте?

Ответ №1:

Потому что у Microsoft есть своя терминология, в которой они говорят «Unicode», в то время как остальные из нас сказали бы «UTF-16LE».

(или до Windows XP это означало «UCS-2LE»)

Комментарии:

1. 1, но объединение их собственной реализации с общим термином является нормой для курса в MSFT (например, «синий значок с надписью «Интернет»», подсказка-подсказка)

2. На самом деле я не уверен, всегда ли в Microsoft Unicode используется строчный порядковый номер. Запускался ли когда-либо какой-либо из портов семейства Windows NT как big endian?

3. Какой вежливый способ сказать, что Microsoft снова перепутала терминологию ! 🙂

4. @tchrist: Я практикую свою дипломатию на SO (-:

5. Да, в свою защиту могу сказать, что они были первыми пользователями Unicode, и все в то время ожидали, что он будет только 16-разрядным. Это также спасло их от изменения имени при обновлении с UCS-2 до UTF-16. Но это создает много путаницы, когда пользователи Windows задают вопросы, а пользователи Unix отвечают на них, или наоборот.