#python #sentiment-analysis #reddit #praw
Вопрос:
Для своей диссертации я пытаюсь собрать сообщения, связанные с GameStop, и соответствующие комментарии от r/wallstreetbets с декабря 2020 года по конец февраля 2021 года.
Я попытался использовать следующий код, но результаты-это просто сообщения, связанные с игровым топом, из каждого субреддита, хотя я (думал, что я) указал сообщения именно из r/wallstreetbets
from psaw import PushshiftAPI
from datetime import datetime, timezone, timedelta
from dateutil.relativedelta import relativedelta
months_back = 7
dt = datetime.now() - relativedelta(months=months_back)
timestamp = int(dt.replace(tzinfo=timezone.utc).timestamp())
api = PushshiftAPI()
submissions = api.search_submissions(aggs='title body subreddit', after=timestamp, q='GME GameStop wallstreetbets')
c = 0
for post in submissions:
c = 1
title = post.title
try:
body = post.body
except Exception as e:
body = ''
subreddit = post.subreddit
print(f'{c}: {title} - {body} - {subreddit}')
Я вообще не очень хорошо кодирую, поэтому мне было интересно, может ли кто-нибудь предложить, как создать команду, которая возвращает необходимые мне данные, основываясь на этих параметрах:
- Включает ключевые слова «GME, GameStop»
- Опубликовано в период с декабря 2020 года по февраль 2021 года
- Опубликовано на r/wallstreetbets
Любое предложение высоко ценится!