Линейный прогноз Pyspark

#pyspark #apache-spark-sql

Вопрос:

Я все еще новичок в мире Pyspark и больших данных…..

Моя проблема связана с функцией линейного прогнозирования и с тем, как получить эти данные для большего набора данных в pyspark

Ниже приведена ссылка на данные, которые я использую для расчета значения сценария

Scenario_Data

Данные сценария с выводом с использованием возврата

На основе ожидаемой доходности я рассчитываю значение сценария

Пример, если ожидаемый доход составляет 3% —> я вручную определяю строки, которые будут содержать значения для X amp; Y…..so в этом случае 3% будут составлять от 1% до 5%. после определения этой строки вручную я рассчитываю значение сценария, используя формулы в Excel (прогноз. линейный), поэтому в этом случае 3% , мое значение сценария, вычисленное будет -162,5

Цель состоит в том, чтобы рассчитать все это в пределах pyspark без каких-либо ручных усилий, о которых упоминалось выше

Дайте мне знать, если вам понадобится дополнительная информация по этому запросу

Заранее большое спасибо за помощь

Примечание: Для этой задачи я использую базы данных

С уважением, Хитеш

Комментарии:

1. Пожалуйста, приведите пример (фрагмент кода), что именно вы хотите сделать. Вы хотите прогнозировать данные?

2. Привет @JAdel, как упоминалось ранее, я делаю это вручную в excel, цель состоит в том, чтобы автоматизировать это в pyspark добавлен новый снимок экрана в разделе Данные сценария с выводом с использованием возврата !! Надеюсь, это поможет

3. Я голосую за то, чтобы этот вопрос был закрыт, потому что он не имеет ничего общего с pyspark или apache-spark-sql. Пожалуйста, опишите вашу проблему и логику более точно в вашем следующем вопросе. Используйте фрагменты кода для восстановления вашей проблемы.

4. Это очень бесполезно и невежливо…..я описал свою постановку проблемы и то, как я в настоящее время делаю это в Excel….я также предоставил примеры данных….. вам нужно понять, что не все являются экспертами на этой платформе…некоторые новички, как я