Как преобразовать java-кодировку символов UTF-8 в HTML-кодировку?

#java #utf-8

#java #utf-8

Вопрос:

Есть ли какая-либо утилита Java или библиотека для преобразования Java-кодировки UTF-8 в HTML-кодировку?

Пример:

Для заменяющего символа используется Java-кодировка "u001A" и HTML-кодировка amp;#26; .

Как преобразовать Java-кодировку в HTML-кодировку?

Комментарии:

1. u001A это не UTF-8. Это выход Java Unicode.

2. Пожалуйста, обратитесь по этой ссылке. fileformat.info/info/charset/UTF-8/list.htm @StephenC

3. UTF-8 является правым столбцом этой таблицы! Найдите UTF-8 и Unicode в Википедии (или на unicode.org ) если вы хотите действительно понять, что означают термины.

4. Шестнадцатеричный 0x1A равен 26 десятичным числам. "u001A" это строка с единицей char , значение которой равно 0x001A. Просто возьмите это char и выведите его числовое значение с префиксом amp;# и суффиксом с ; .

5. Вероятно, вам больше всего поможет библиотека, которая позволяет создавать HTML-документ как объект и может сериализовать (записать) его в файл или поток, используя указанную вами кодировку символов.

Ответ №1:

Apache предлагает StringEscapeUtils.

Он содержит escape / unescape Java.

А также escape / unescape html.

Используя строку в середине, вы должны быть в состоянии выполнить преобразование, которое вы хотите.