#java #selenium #cookies #clojure
#java #selenium #файлы cookie #clojure
Вопрос:
Я хочу использовать Selenium для входа на сайт, а затем экспортировать файл cookie в httpclient.
(defn convert-selemium-cookie-to-httpclient-cookie [x]
(let [sf (SimpleDateFormat. "yyyy-MM-dd")
fake-date (.parse sf "2018-08-06")]
(doto
(BasicClientCookie. (:name x) (:value x))
(.setDomain (:domain x))
(.setPath (:path x))
(.setExpiryDate (if (:expiry x) (:expiry x) fake-date))
(.setSecure (:secure? x)))))
(defn add-selenium-cookies-to-httpclient-cookie-store [x]
(let [cs (clj-http.cookies/cookie-store)
http-cookies (map convert-selemium-cookie-to-httpclient-cookie x)]
(mapv (fn[x] (.addCookie cs x)) http-cookies)
cs))
(def driver (new-driver {:browser :firefox}))
(def a (login driver ...)) ;; login
(def c (cookies driver)) ;; get the cookies
(def cs (add-selenium-cookies-to-httpclient-cookie-store c))
(println (client/get "some web site"
{:cookie-store cs
:client-params {"http.useragent"
"Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US) AppleWebKit/534.20 (KHTML, like Gecko) Chrome/11.0.672.2 Safari/534.20"}}))
Хотя я успешно вошел в систему в webdriver, и этот сайт сохраняет файлы cookie во время сеансов, после копирования файлов cookie в хранилище client/get
файлов cookie все равно возвращается страница, НА которую НЕ был выполнен вход. Я пробовал аналогичную вещь в python, и она может успешно передавать файлы cookie из webdriver в запросы (http-клиент для python). Не уверен, в чем проблема для java / clojure.
Ответ №1:
Вы не указали версии своих зависимостей. Я протестировал ваш код следующим образом:
[org.clojure/clojure "1.8.0"]
[clj-webdriver "0.7.2"]
[org.seleniumhq.selenium/selenium-server "3.0.0-beta4"]
Firefox 48.0.2
Mac OS Sierra 10.12
Сеанс REPL в конце моего ответа показывает, что он работает (я использовал https://httpbin.org/
его для тестирования).
Для устранения неполадок я бы проверил следующее:
- распечатайте, какие файлы cookie были возвращены из драйвера, или проверьте в консоли браузера, содержит ли ответ с вашей страницы входа заголовки для установки правильных файлов cookie
- распечатайте, что содержит ваш http-клиент cookiestore
- включите ведение журнала отладки для http-клиента (или включите ведение журнала отладки на вашем сервере), чтобы увидеть, какой фактический запрос отправляется на вашу страницу, защищенную логином, и содержит ли запрос файлы cookie, установленные страницей входа.
В сеансе REPL вы можете видеть, что файлы cookie, возвращаемые из selenium, содержат файлы cookie, установленные первым запросом. Они также присутствуют в хранилище файлов cookie http-клиента, и они правильно возвращаются https://httpbin.org/cookies
URL-адресом, указывающим, что они были отправлены с запросом http-клиентом.
(require '[clj-webdriver.taxi :as taxi])
(require '[clj-http.client :as client])
(require '[clj-http.cookies :as cookies])
(require '[clojure.pprint :refer [pprint]])
(import java.text.SimpleDateFormat)
(import org.apache.http.impl.cookie.BasicClientCookie)
(defn convert-selemium-cookie-to-httpclient-cookie [x]
(let [sf (SimpleDateFormat. "yyyy-MM-dd")
fake-date (.parse sf "2018-08-06")]
(doto
(BasicClientCookie. (:name x) (:value x))
(.setDomain (:domain x))
(.setPath (:path x))
(.setExpiryDate (if (:expiry x) (:expiry x) fake-date))
(.setSecure (:secure? x)))))
(defn add-selenium-cookies-to-httpclient-cookie-store [x]
(let [cs (cookies/cookie-store)
http-cookies (map convert-selemium-cookie-to-httpclient-cookie x)]
(mapv (fn [x] (.addCookie cs x)) http-cookies) cs))
(def cookie-name (str "c1" (System/currentTimeMillis)))
(def cookie-value (str "v1" (System/currentTimeMillis)))
(pprint cookie-name)
;; "c11475935066134"
(pprint cookie-value)
;; "v11475935066814"
(def driver (taxi/new-driver {:browser :firefox}))
(taxi/to driver (format "https://httpbin.org/cookies/set?%s=%s" cookie-name cookie-value))
(def selenium-cookies (taxi/cookies driver))
(pprint selenium-cookies)
;; #{{:cookie
;; #object[org.openqa.selenium.Cookie 0x4dc96ce8 "c11475935066134=v11475935066814; path=/; domain=httpbin.org"],
;; :name "c11475935066134",
;; :value "v11475935066814",
;; :path "/",
;; :expiry nil,
;; :domain "httpbin.org",
;; :secure? false}}
(def http-client-cookie-store (add-selenium-cookies-to-httpclient-cookie-store selenium-cookies))
(pprint http-client-cookie-store)
;; #object[org.apache.http.impl.client.BasicCookieStore 0x6dfa86f5 "[[version: 0][name: c11475935066134][value: v11475935066814][domain: httpbin.org][path: /][expiry: Mon Aug 06 00:00:00 CEST 2018]]"]
(def http-client-response
(client/get
"https://httpbin.org/cookies"
{:cookie-store http-client-cookie-store}))
(pprint http-client-response)
;; {:status 200,
;; :headers
;; {"Server" "nginx",
;; "Date" "Sat, 08 Oct 2016 13:58:01 GMT",
;; "Content-Type" "application/json",
;; "Content-Length" "64",
;; "Connection" "close",
;; "Access-Control-Allow-Origin" "*",
;; "Access-Control-Allow-Credentials" "true"},
;; :body
;; "{n "cookies": {n "c11475935066134": "v11475935066814"n }n}n",
;; :request-time 1001,
;; :trace-redirects ["https://httpbin.org/cookies"],
;; :orig-content-encoding nil}
Ответ №2:
Вы пробовали selenium-requests? https://pypi.python.org/pypi/selenium-requests /
Комментарии:
1. Я использую clojure вместо python. Для версии python я уже это делаю.