Анализ настроений с использованием NLTK и beautifulsoup

#list #nlp #nltk #sentiment-analysis

#Список #nlp #nltk #анализ настроений

Вопрос:

Я работаю над личным проектом, в котором я думаю провести анализ настроений с использованием NLTK и Vader для сравнения президентских речей.

Я смог использовать beautiful soup, чтобы найти одну из речей Джорджа Вашингтона, и мне удалось поместить речь в список. Но после этого я не совсем уверен, что лучший способ пойти дальше. Кажется, что для файла типично чтение из текстового файла, но у меня есть скобки со списком, которые затрудняют это. Я не уверен, должен ли я хранить речь, скопированную из Интернета, в файле или просто работать со списком. Или, может быть, мне уже следует поместить речь в фрейм данных? Я не слишком уверен.

 from bs4 import BeautifulSoup
import requests
import spacy
import pandas as pd

page_link = 'https://www.ourdocuments.gov/doc.php?flash=falseamp;doc=11amp;page=transcript'
page_response = requests.get(page_link, timeout=5)
page_content = BeautifulSoup(page_response.content, "html.parser")

textContent = []
for i in range(0, 7):
    paragraphs = page_content.find_all("p")[i].text
    textContent.append(paragraphs)

toWrite = open('washington.txt', 'w')
line = textContent
toWrite.write(str(line))
toWrite.close()
 

Любая помощь или указания будут с благодарностью приняты.

Ответ №1:

Вы можете обратиться за помощью к этой статье…Проверьте.

https://towardsdatascience.com/basic-binary-sentiment-analysis-using-nltk-c94ba17ae386