Механизация захвата 404 => Net ::HttpNotFound

#ruby #http-status-code-404 #mechanize-ruby

#ruby #http-status-code-404 #механизировать-ruby

Вопрос:

Я написал простую функцию, которая обрабатывает выборку URL:

 def tender_page_get url, agent
  sleep(rand(6) 2)
  begin
    return agent.get(url).parser
  rescue Errno::ETIMEDOUT, Timeout::Error, Net::HTTPNotFound
    EYE.debug "--winter sleep #{url}"
    puts "-x-#{url}"
    sleep(300)
    tender_page_get url, agent
  rescue => e
    puts "-x-#{url}"
    EYE.debug "--unknown exception"
    EYE.debug "#{url} #{e.inspect}"
  end
end
  

Проблема в том, что, хотя я перехватываю Net::HTTPNotFound в своем первом блоке восстановления, я все еще вижу в своих записях журнала такие:

 --unknown exception
{url} 404 => Net::HTTPNotFound
  

это означает, что это исключение было перехвачено вторым блоком восстановления. Что может быть причиной этого?

Ответ №1:

Mechanize вызывает Mechanize::ResponseCodeError для 404, а не Net:: HttpNotFound. to_s для Mechanize::ResponseCodeError выглядит следующим образом:

 def to_s
  "#{response_code} => #{Net::HTTPResponse::CODE_TO_OBJ[response_code]}"
end
  

Это возвращает ‘404 => Net:: HttpNotFound’, что создает впечатление, что это вызываемое исключение.

Комментарии:

1. в этом сценарии есть ли у нас конкретная строка, которую мы можем перехватить для HTTP 404? Извините, я новичок в ruby, и из вашего ответа, который объясняет причину проблемы, я не смог найти решение.