Преобразование китайского символа в индекс для массива

#arrays #trie #cjk

#массивы #trie #cjk

Вопрос:

Я изучаю структуру данных Trie и пишу отчет о них. Мой профессор спрашивает меня: «Что, если я передам код Trie в chienese? Какие изменения они должны внести, чтобы адаптировать структуру к своему языку? »

Для английской версии я использую массив длиной 26. Я преобразую символ в индекс массива таким образом (str [i] — ‘a’). Китайский алфавит состоит из 21 буквы. Итак, мое мнение о массиве — оставить его как английскую версию, игнорируя символы, которые китайцы не используют. Но проблема в том, как я могу преобразовать китайский символ в индекс массива?

Спасибо за помощь!

Комментарии:

1. Как насчет использования хэш-таблицы вместо массива?

2. Я хотел бы оставить свою реализацию с Array. Итак, если я не могу преобразовать китайскую букву в индекс, я напишу в своем отчете, что мне нужно изменить структуру (используя карту или хэш-таблицу, как вы сказали). Но trie является альтернативой хэш-таблице. Почему я должен использовать хэш-таблицу внутри trie? Я должен все это объяснить