#python #pandas
Вопрос:
Я пытаюсь создать облако слов из моего фрейма данных, приведенного ниже
Borough Minor Text 2019 Bexley Arson 4 Bexley Burglary - Business 11 Bexley Burglary - Residential 130 Bexley Drug Trafficking 5
Я хочу визуализировать наиболее часто встречающиеся элементы в столбце второстепенного текста в wordcloud, но проблема в том, что частота указана в столбце «2019» в виде целого числа. Фактический кадр данных довольно большой, но соответствует тому же формату, что и выше. Кто-нибудь может подсказать, как я могу преобразовать свой столбец «Второстепенный текст», чтобы я мог точно создать облако слов?
Спасибо
Ответ №1:
Я не знаю критериев визуализации. Например, wordcloud PowerBI не принимает целочисленное значение для управления размером слова, но оно основывается на том, сколько элементов оно повторяет. Поэтому я справляюсь с этим, преобразуя текст в список, а затем умножая его на целое число (следовательно, повторяя текст столько раз, сколько говорит целое число), а затем PowerBI видит, что строка 3 повторяется 130 раз, в то время как строка 4 только 5 раз, что делает текст строки 3 в 26 раз больше, чем текст строки 4.
Объяснив это, я использую именно эту строку кода:
df['Visual text'] = df['Minor Text'].map(lambda x: [x]) * df['2019']