#pyspark #apache-spark-sql
Вопрос:
Я все еще новичок в мире Pyspark и больших данных…..
Моя проблема связана с функцией линейного прогнозирования и с тем, как получить эти данные для большего набора данных в pyspark
Ниже приведена ссылка на данные, которые я использую для расчета значения сценария
Данные сценария с выводом с использованием возврата
На основе ожидаемой доходности я рассчитываю значение сценария
Пример, если ожидаемый доход составляет 3% —> я вручную определяю строки, которые будут содержать значения для X amp; Y…..so в этом случае 3% будут составлять от 1% до 5%. после определения этой строки вручную я рассчитываю значение сценария, используя формулы в Excel (прогноз. линейный), поэтому в этом случае 3% , мое значение сценария, вычисленное будет -162,5
Цель состоит в том, чтобы рассчитать все это в пределах pyspark без каких-либо ручных усилий, о которых упоминалось выше
Дайте мне знать, если вам понадобится дополнительная информация по этому запросу
Заранее большое спасибо за помощь
Примечание: Для этой задачи я использую базы данных
С уважением, Хитеш
Комментарии:
1. Пожалуйста, приведите пример (фрагмент кода), что именно вы хотите сделать. Вы хотите прогнозировать данные?
2. Привет @JAdel, как упоминалось ранее, я делаю это вручную в excel, цель состоит в том, чтобы автоматизировать это в pyspark добавлен новый снимок экрана в разделе Данные сценария с выводом с использованием возврата !! Надеюсь, это поможет
3. Я голосую за то, чтобы этот вопрос был закрыт, потому что он не имеет ничего общего с pyspark или apache-spark-sql. Пожалуйста, опишите вашу проблему и логику более точно в вашем следующем вопросе. Используйте фрагменты кода для восстановления вашей проблемы.
4. Это очень бесполезно и невежливо…..я описал свою постановку проблемы и то, как я в настоящее время делаю это в Excel….я также предоставил примеры данных….. вам нужно понять, что не все являются экспертами на этой платформе…некоторые новички, как я