#unicode #utf-8 #character-encoding #terminology
#Юникод #utf-8 #кодировка символов #терминология
Вопрос:
Если Unicode является стандартом, а UTF-8 является типом ecoding для этого стандарта, почему я могу сохранить текстовый документ как любой из них в блокноте?
Ответ №1:
Потому что у Microsoft есть своя терминология, в которой они говорят «Unicode», в то время как остальные из нас сказали бы «UTF-16LE».
(или до Windows XP это означало «UCS-2LE»)
Комментарии:
1. 1, но объединение их собственной реализации с общим термином является нормой для курса в MSFT (например, «синий значок с надписью «Интернет»», подсказка-подсказка)
2. На самом деле я не уверен, всегда ли в Microsoft Unicode используется строчный порядковый номер. Запускался ли когда-либо какой-либо из портов семейства Windows NT как big endian?
3. Какой вежливый способ сказать, что Microsoft снова перепутала терминологию ! 🙂
4. @tchrist: Я практикую свою дипломатию на SO (-:
5. Да, в свою защиту могу сказать, что они были первыми пользователями Unicode, и все в то время ожидали, что он будет только 16-разрядным. Это также спасло их от изменения имени при обновлении с UCS-2 до UTF-16. Но это создает много путаницы, когда пользователи Windows задают вопросы, а пользователи Unix отвечают на них, или наоборот.