Как я могу умножить свои строковые значения на целое число для облака слов?

#python #pandas

Вопрос:

Я пытаюсь создать облако слов из моего фрейма данных, приведенного ниже

 Borough Minor Text 2019  Bexley Arson 4   Bexley Burglary - Business 11  Bexley Burglary - Residential 130  Bexley Drug Trafficking 5  

Я хочу визуализировать наиболее часто встречающиеся элементы в столбце второстепенного текста в wordcloud, но проблема в том, что частота указана в столбце «2019» в виде целого числа. Фактический кадр данных довольно большой, но соответствует тому же формату, что и выше. Кто-нибудь может подсказать, как я могу преобразовать свой столбец «Второстепенный текст», чтобы я мог точно создать облако слов?

Спасибо

Ответ №1:

Я не знаю критериев визуализации. Например, wordcloud PowerBI не принимает целочисленное значение для управления размером слова, но оно основывается на том, сколько элементов оно повторяет. Поэтому я справляюсь с этим, преобразуя текст в список, а затем умножая его на целое число (следовательно, повторяя текст столько раз, сколько говорит целое число), а затем PowerBI видит, что строка 3 повторяется 130 раз, в то время как строка 4 только 5 раз, что делает текст строки 3 в 26 раз больше, чем текст строки 4.

Объяснив это, я использую именно эту строку кода:

 df['Visual text'] = df['Minor Text'].map(lambda x: [x]) * df['2019']