#python #bioinformatics
#python #биоинформатика
Вопрос:
Я пытаюсь использовать Python для автоматической загрузки, отправки и извлечения файлов на веб-сайтах, которые выполняют последовательную обработку.
Пример: https://www.ncbi.nlm.nih.gov/Structure/bwrpsb/bwrpsb.cgi
Кто-нибудь знает лучший способ сделать это, будь то конкретные модули или учебные пособия? Будет ли это работать с модулем запросов? Заранее большое спасибо.
Ответ №1:
Пример выглядит как более старая система, но, если это вообще возможно, я бы предложил добавить автоматизацию через API из-за ваших требований к «извлечению», прежде чем рассматривать Selenium.
Однако, если вы обнаружите, что используете Python с Selenium Webdriver, сэкономьте время на настройке и ознакомьтесь с SeleniumBase.
Кроме того, стоит проверить, есть ли бюджет, связанный с этим проектом, и вам нужна поддержка поставщика, UiPath RPA.
Комментарии:
1. Большое спасибо за ваш ответ. Я не уверен, что для этого веб-сайта есть API, совместимый, поэтому я попробую сначала использовать Selenium.
2. Звучит неплохо, ознакомьтесь с SeleniumBase, которая сэкономит вам время на настройке selenium для работы с python. Стоит отметить, что вы хотите ограничить количество шагов в тестах, которые вы пишете, чтобы они не ломались и не считались «ненадежными»
3. Отлично, я обязательно это проверю! Знаете ли вы способ сделать его кроссплатформенным, а не создавать каждый раз новый webdriver? Это часть более крупного проекта, предназначенного для широкой аудитории, так что что-то подобное было бы здорово. Я видел сообщение с использованием модуля pyautogui, но я не совсем уверен, как все настроить.
4. Конечно, с помощью selenium вы можете загружать отдельные двоичные файлы, например geckodriver, chromedriver и т.д. Но стоит отметить, что SeleniumBase предоставит это для вас, поэтому вам не придется тратить кучу времени на настройку работы (что может быть затруднительно). Итак, это ваш кроссбраузерный охват. Что касается кроссплатформенности, вы можете захотеть проверить запуск Selenium Grid в контейнерах docker. Существуют управляемые версии этого, такие как SauceLabs, BrowserStack и т.д. Надеюсь, это поможет,
5. Есть ли способ определить класс и методы для SeleniumBase и запустить их в том же скрипте, а не с помощью командной строки? Спасибо!
Ответ №2:
Я предлагаю вам использовать Selenium.
Вы можете использовать его в разных веб-браузерах.
Поскольку задача заключается в обработке последовательности, она должна быть простой. С уважением!!!