#class #histogram #weka
Вопрос:
Я новичок в Веке. У меня есть набор данных. Когда я пытаюсь загрузить набор данных на этапе предварительной обработки, я получаю следующую картину
В моем наборе данных есть класс. Набор данных предсказывает рак. Злокачественная она или доброкачественная? Синяя часть предназначена для злокачественных, а красная-для доброкачественных.
Я хотел бы знать, в чем смысл этой гистограммы? Здесь какая-то часть синяя, какая-то красная, а какая-то представляет собой смесь красного и синего.
Также с гистограммой связано некоторое число, например 189,104,128.
Кто-нибудь может, пожалуйста, объяснить мне график?
Спасибо.
Ответ №1:
clump
Атрибут в наборе данных о раке молочной железы является числовым (класс, как вы указали, является двоичным).- Значения для этого атрибута были разделены на восемь ячеек.
- Число над каждой ячейкой представляет количество строк в вашем наборе данных, которые попадают в эту конкретную ячейку.
- Цветовые пропорции показывают, сколько строк принадлежит к какому классу. Как вы можете видеть, чем меньше скопление, тем больше
benign
строк попадает в корзину, а чем больше, тем большеmalignant
.