#list #nlp #nltk #sentiment-analysis
#Список #nlp #nltk #анализ настроений
Вопрос:
Я работаю над личным проектом, в котором я думаю провести анализ настроений с использованием NLTK и Vader для сравнения президентских речей.
Я смог использовать beautiful soup, чтобы найти одну из речей Джорджа Вашингтона, и мне удалось поместить речь в список. Но после этого я не совсем уверен, что лучший способ пойти дальше. Кажется, что для файла типично чтение из текстового файла, но у меня есть скобки со списком, которые затрудняют это. Я не уверен, должен ли я хранить речь, скопированную из Интернета, в файле или просто работать со списком. Или, может быть, мне уже следует поместить речь в фрейм данных? Я не слишком уверен.
from bs4 import BeautifulSoup
import requests
import spacy
import pandas as pd
page_link = 'https://www.ourdocuments.gov/doc.php?flash=falseamp;doc=11amp;page=transcript'
page_response = requests.get(page_link, timeout=5)
page_content = BeautifulSoup(page_response.content, "html.parser")
textContent = []
for i in range(0, 7):
paragraphs = page_content.find_all("p")[i].text
textContent.append(paragraphs)
toWrite = open('washington.txt', 'w')
line = textContent
toWrite.write(str(line))
toWrite.close()
Любая помощь или указания будут с благодарностью приняты.
Ответ №1:
Вы можете обратиться за помощью к этой статье…Проверьте.
https://towardsdatascience.com/basic-binary-sentiment-analysis-using-nltk-c94ba17ae386