Orange DM: как Orange вычисляет евклидово расстояние для категориальных данных?

#python #euclidean-distance #orange #discrete

#python #евклидово расстояние #Оранжевый #дискретный

Вопрос:

Я уже некоторое время использую Orange и пытаюсь реализовать некоторые методы классификации для классификации моих данных.

Я использую виджет Test и Score для тестирования нескольких методов классификации (kNN, ANN и т. Д.) В моем наборе данных и использую k-кратную перекрестную проверку.

Мой набор данных — это набор данных питомника из доступного здесь репозитория UCI, который содержит только категориальные атрибуты.

Вот мой вопрос: как алгоритм kNN вычисляет евклидово расстояние? Я думал, что для категориальных наборов данных следует использовать «расстояние Хэмминга». Однако, когда я использую расстояние Хэмминга, которое я должен запрограммировать вручную в виджете python:

 import Orange
knn = Orange.classification.KNNLearner(n_neighbors=9, metric="hamming")
out_learner=knn

 

результаты с обоими расстояниями всегда одинаковы.