#java #r #math #regression #renjin
#java #r #математика #регрессия #renjin
Вопрос:
Я хочу использовать Java для выполнения множественной корреляции с использованием больших наборов данных. Я не могу найти ни одной библиотеки, которая предоставляет это. Ближайший, который я смог найти, находится по адресу [https://commons.apache.org/proper/commons-math/apidocs/org/apache/commons/math3/stat/correlation/SpearmansCorrelation.html][1 ] но это только делает частичную корреляцию не кратной. Я полагаю, я мог бы использовать R для этого, но мои наборы данных очень большие (триллионы), и я хотел бы извлечь выгоду из использования производительности Java (многопоточность, многоядерность и т. Д.). Есть ли библиотека, которая выполняет множественную корреляцию, о которой кто-нибудь знает? Было бы также здорово, если бы библиотека могла выполнять пошаговую множественную регрессию.
Ответ №1:
Ваш лучший выбор, вероятно, Apache Mahout, который предоставляет набор масштабируемых алгоритмов поверх Hadoop.