#java #utf-8
#java #utf-8
Вопрос:
Есть ли какая-либо утилита Java или библиотека для преобразования Java-кодировки UTF-8 в HTML-кодировку?
Пример:
Для заменяющего символа используется Java-кодировка "u001A"
и HTML-кодировка amp;#26;
.
Как преобразовать Java-кодировку в HTML-кодировку?
Комментарии:
1.
u001A
это не UTF-8. Это выход Java Unicode.2. Пожалуйста, обратитесь по этой ссылке. fileformat.info/info/charset/UTF-8/list.htm @StephenC
3. UTF-8 является правым столбцом этой таблицы! Найдите UTF-8 и Unicode в Википедии (или на unicode.org ) если вы хотите действительно понять, что означают термины.
4. Шестнадцатеричный 0x1A равен 26 десятичным числам.
"u001A"
это строка с единицейchar
, значение которой равно 0x001A. Просто возьмите этоchar
и выведите его числовое значение с префиксомamp;#
и суффиксом с;
.5. Вероятно, вам больше всего поможет библиотека, которая позволяет создавать HTML-документ как объект и может сериализовать (записать) его в файл или поток, используя указанную вами кодировку символов.
Ответ №1:
Apache предлагает StringEscapeUtils.
Он содержит escape / unescape Java.
А также escape / unescape html.
Используя строку в середине, вы должны быть в состоянии выполнить преобразование, которое вы хотите.