Допустим, вы работаете над проектом, которому необходимо выполнить очистку веб-страниц, но вы не знаете веб-сайтов, на которых необходимо выполнить очистку заранее, вместо этого вам необходимо выполнить поиск в Google, а затем перейти в соответствии с результатами поиска Google на несколько веб-сайтов. В этом случае вам понадобятся результаты поиска Google для ваших различных запросов.
- Одним из способов достижения этой цели является использование запроса и красивого супа, который обсуждался здесь при реализации веб-очистки в Python с помощью BeautifulSoup.
- Вместо того, чтобы вкладывать столько усилий в тривиальную задачу, был создан пакет Google. Это почти однострочное решение для прямого поиска ссылок на все результаты поиска Google.
- Используя пакет python google, мы можем получать результаты поиска Google из скрипта python. Мы можем получить ссылки на первые n результатов поиска.
Установка
пакет Google имеет одну зависимость от beautifulsoup, которую необходимо установить в первую очередь.
pip install beautifulsoup4
Затем установите пакет Google
pip install google
- query: строка запроса, которую мы хотим найти.
- TLD: TLD расшифровывается как домен верхнего уровня, что означает, что мы хотим искать наши результаты на google.com или в гугле. в какой-либо другой области.
- lang: лэнг расшифровывается как язык.
- num: Количество результатов, которые мы хотим получить.
- start: Первый результат, который нужно получить.
- stop: Последний полученный результат. Не используйте ни одного, чтобы продолжать поиск вечно.
- pause: Время ожидания между HTTP-запросами. Слишком короткое время может привести к тому, что Google заблокирует ваш IP-адрес. Сохранение значительных ошибок замедлит вашу программу, но это безопасный и лучший вариант.
- Return: Генератор (итератор) , который выдает найденные URL-адреса. Если параметр stop не указан, итератор будет зацикливаться вечно.
Коды Python о том, как выполнить поиск в Google с помощью скрипта python
Пример 1: google_search.py
try:
from googlesearch import search
except ImportError:
print("No module named 'google' found")
# to search
query = "Geeksforgeeks"
for j in search(query, tld="co.in", num=10, stop=10, pause=2):
print(j)
Выход:
Давайте выполним поиск в Google вручную и проверим наш результат
Пример 2: google_search.py
try:
from googlesearch import search
except ImportError:
print("No module named 'google' found")
# to search
query = "A computer science portal"
for j in search(query, tld="co.in", num=10, stop=10, pause=2):
print(j)
Выход:
Давайте выполним поиск в Google вручную и проверим наш результат
Ссылка: Пакет Google python