значение параметра «Информация» в описании набора данных

#r #rattle

#r #rattle

Вопрос:

Запуск описательной статистики в rattle и необходимость знать, какая «Информация» содержится в результатах. Не удалось найти какую-либо информацию в виньетке. Вот пример того, о чем я говорю:

Переменная
1 n отсутствует уникальная информация Среднее значение суммы
89588 0 2 0.61 25735 0.2873 

Мы считаем, что это счет от 0 до 1, но мы не можем найти точное определение.

Комментарии:

1. Какую команду rattle вы использовали, чтобы получить результат, указанный выше? Можете ли вы предоставить немного больше контекста, например, фрагмент кода или данные?

2. Радость — графический интерфейс rattle был вызван с помощью функции rattle(). Набор данных загружен, и на вкладке «исследовать» мы выбрали «описать» данные. Вывод для одной из наших переменных находится в комментарии.

Ответ №1:

Функция describe, используемая в Rattle, поступает из пакета HMisc.

В документации HMisc::describe это говорится об информации:

Для числовых переменных describe добавляет элемент с именем Info, который является относительной информационной мерой, использующей относительную эффективность теста пропорциональных коэффициентов / Уилкоксона для переменной относительно того же теста для переменной, которая не имеет связей. Информация связана с тем, насколько непрерывна переменная, и связи менее вредны, чем больше существует развязанных значений. Формула для Info равна единице минус сумма кубов относительных частот значений, деленная на единицу минус квадрат обратной величины размера выборки. Наименьшая информация поступает от переменной, имеющей только одно уникальное значение, за которым следует сильно искаженная двоичная переменная. Информация передается с точностью до двух знаков после запятой.

Комментарии:

1. Спасибо! Именно то, что мне было нужно.

2. @Phiver, есть мысли о практических последствиях этой меры?