Генерация (приблизительно) однородного хэша для набора чисел с уклоном

#hash #partitioning

Мне нужно поместить массив ключевых байтов k в n корзины (для разбиения на разделы по Кафке).

Обычно я бы просто взял наивный пробормотал хэш строки (используя встроенный алгоритм Кафки) и mod n дал мне ведра с равномерным распределением.

Однако, прежде чем я начну, я знаю, что мои входные строки (перед преобразованием в массив байтов) являются смещенными, как показано ниже:

т. е. первая цифра, равная 0, в 29 раз более вероятна, чем первая цифра, равная 8.

Учитывая эти условия, как я могу сгенерировать хэш, который равномерно распределит ключи по n сегментам?