#sampling #automl
Вопрос:
Я надеюсь, что вы сможете помочь мне своим опытом и широтой знаний по проблеме, которую я постараюсь сформулировать как можно лучше 🙂 У меня есть проблема, которая, насколько я понимаю, должна также возникать в подходах AutoML.
Контекст: Для объекта я могу вычислить n (в моем случае 9) объектов, которые определяют производные объекты. Одним случайным примером может быть изображение (объект) и его особенности, например, насколько хорошо оно может быть сжато, или показатель контрастности, или сколько ребер можно найти и т. Д. и т. Д. Пока все хорошо, но теперь размеры не обязательно являются некоррелированными/линейно независимыми. Это может означать, что высокое значение в одном измерении может означать высокое значение в другом измерении или низкое значение или ограничивать диапазоны значений. Наглядный пример: Изображение, которое может быть плохо сжато, показывает, скорее всего, высокую дисперсию с точки зрения цвета или градиентов. (Я все это выдумываю).
Проблема: Теперь представьте, что я хочу «изучить» генератор объектов, который может создавать все эти объекты для меня в зависимости от местоположения в (производном) Пространство для функций HD. Обратите внимание, что этот вопрос ЗАКЛЮЧАЕТСЯ НЕ в том, какая модель ML (GAN, вариационные автокодеры или некоторые другие модели искусственного интеллекта, как вы их называете) может быть использована для этой проблемы. Моя задача состоит в том, чтобы убедиться, что я «захватил» все пространство функциональных возможностей для этапа обучения модели ИИ. Но как я могу быть уверен, что я произвел выборку пространства (достаточно), если мне даже не ясно, как выглядят функциональные зависимости между измерениями? Кроме того, даже если бы у меня были оценки корреляции между измерениями, какой безумный математический оптимизатор использует это в качестве входных данных, чтобы рассказать мне, как «выглядит»пространство HD?
Довольно расплывчатое математическое описание проблемы состояло бы в том, что у меня есть n-мерное пространство признаков, размеры которого не образуют ортонормированную основу. Следовательно, размеры не являются (обязательно) линейно независимыми, и их зависимости не могут быть легко/полностью выведены. Как я могу (экспериментально) определить возможное пространство решений? Какая математическая задача имеет (по крайней мере, некоторые) общие черты? Какая дисциплина математики, МЛ, ИИ занимается такого рода проблемами?
Еще одно: я не ожидаю полноценного решения любого рода, а только указателей.
БОЛЬШОЕ ВАМ СПАСИБО!!!!
Ответ №1:
Рассматривали ли вы возможность снижения деменциональности? Если вас особенно интересуют линейные отношения, вы можете рассмотреть разложение на собственные значения (или анализ основных компонентов, если вы предпочитаете этот термин). Это может помочь определить доступное подпространство вашего функционального пространства.
Существуют также более продвинутые методы уменьшения размерности, которые также способны определять нелинейные зависимости между объектами. Одним из примеров является использование автоэнкодера ANN.