как использовать renjin внутри java-приложения для создания нескольких корреляций

#java #r #math #regression #renjin

#java #r #математика #регрессия #renjin

Вопрос:

Я хочу использовать Java для выполнения множественной корреляции с использованием больших наборов данных. Я не могу найти ни одной библиотеки, которая предоставляет это. Ближайший, который я смог найти, находится по адресу [https://commons.apache.org/proper/commons-math/apidocs/org/apache/commons/math3/stat/correlation/SpearmansCorrelation.html][1 ] но это только делает частичную корреляцию не кратной. Я полагаю, я мог бы использовать R для этого, но мои наборы данных очень большие (триллионы), и я хотел бы извлечь выгоду из использования производительности Java (многопоточность, многоядерность и т. Д.). Есть ли библиотека, которая выполняет множественную корреляцию, о которой кто-нибудь знает? Было бы также здорово, если бы библиотека могла выполнять пошаговую множественную регрессию.

Ответ №1:

Ваш лучший выбор, вероятно, Apache Mahout, который предоставляет набор масштабируемых алгоритмов поверх Hadoop.

https://mahout .apache.org/