Помогите решить проблему с пробелами в версии (AI)

#algorithm #artificial-intelligence #machine-learning

#алгоритм #искусственный интеллект #машинное обучение

Вопрос:

Я новичок в ИИ (искусственный интеллект), изучающий пространства версий, и мне нужна помощь в решении задач с суммами. Я использую программное обеспечение, которое будет выполнять процесс обучения, поэтому моя задача — изучить и понять, что происходит (я имею в виду, почему программное обеспечение выдает такие результаты) и т.д..

Моя задача в том, чтобы у меня была марка автомобилей:

 Brand   Likes
_____   _____
opel    yes
toyota  no
bmw     yes
ford    yes
nissan  no
  

и мои вопросы:

1) как я могу узнать, какая марка автомобиля нравится человеку? насколько я понимаю, первая марка (opel) в примерах должна быть положительной (да) или?

2) как я могу узнать, какая марка автомобиля человеку не нравится?
должен ли я сделать первую марку отрицательной (no)?

3)
как я могу создать две иерархии, чтобы их можно было использовать для изучения, какие марки автомобилей человеку нравятся, а какие нет?

ОБНОВЛЕНИЕ Мне также нужна помощь по следующим требованиям:

1)
Составьте две разные иерархии для изучения примеров. Обе иерархии позволяют узнать, какой бренд нравится пользователю, в то время как изучение того, какие бренды человеку не нравятся, может быть изучено только с помощью одной иерархии и не может быть изучено с помощью другой иерархии.

2)
Какой вы можете сделать вывод о том, когда можно изучить противоположную концепцию, а когда нет?


Пожалуйста, я узнаю, как это работает, поэтому будьте терпеливы со мной. Спасибо

спасибо за вашу помощь.

Комментарии:

1. Если человеку не нравится машина, он говорит «нет» подобной. И если ему нравится машина, он говорит, что она ему нравится. Вы можете разделить автомобили на две группы по симпатиям и антипатиям.

2. Спасибо за ваш ответ. пожалуйста, можете ли вы также помочь мне с обновленной частью? Я обновил свой пост. Спасибо

Ответ №1:

Пространства версий были своего рода академической концепцией, которая никогда не была действительно полезной. Некоторые недостатки заключаются в:

  1. Ограниченное представление — в основном либо 1-CNF (одиночный конъюнкт), либо 1-DNF (одиночный дизъюнкт)

  2. Не могу справиться с шумом

  3. Экспоненциальное время и пространство.

Для описаний с 1-CNF существует простой алгоритм «возьмите пересечение» (который работает точно так, как вы могли себе представить, по крайней мере, в двумерном или трехмерном пространстве), который представляет собой алгоритм обучения pac (вероятно, приблизительно правильный), который является полиномом по количеству примеров.

Однако ограниченное представление — это то, что действительно убивает ее — даже алгоритм «возьмите пересечение» не используется (также известный как максимально специфичное конъюнктивное обобщение или MSCG) из-за ограниченного представления.

Вместо этого сегодня широко используются такие вещи, как деревья решений, списки решений, нейронные сети, генетические алгоритмы, алгоритм SVG.