действительно проблема с разбиением на страницы веб-сайта

#excel #vba #web-scraping #screen-scraping

Вопрос:

Я действительно застрял на навигации по страницам при создании веб-страниц. Навигация по моей странице работала нормально, но неделю назад она остановилась, и я, похоже, не могу ее исправить. Он просто переходит со страницы 1 на страницу 2 в цикле, поэтому при поиске на 6 страницах он посетит страницу 1 2 по три раза каждый.

Я перепробовал несколько методов, все они просто переходят со страницы 1 на страницу 2, а затем снова возвращаются на страницу 1. Не мог бы кто-нибудь посоветовать, пожалуйста, какой правильный класс или объект запроса?

Действительно

Я использовал это

 Do
    If pageNumber >=6 Then Exit Do
        On Error Resume Next
        Set nextPageElement = HTML.getElementsByClassName("np")(0) ' CLICK TO NEXT PAGE

    If nextPageElement Is Nothing Then Exit Do
        Application.Wait (Now   TimeValue("0:00:04"))
        nextPageElement.Click 'next web page
   
   Do While objIE.Busy = True Or objIE.readyState <> 4
    Loop

 

С тех пор я пробовал это, но, похоже, не могу с этим справиться

 Do
  If pageNumber >=6  Then Exit Do
        Set nextPageElement = HTML.getElementsByClassName("pagination-list")(0)
       'Set nextPageElement = HTML.getElementsByClassName("pagination")(0)
  If Not nextPageElement Is Nothing Then
         nextPageElement.document.querySelector(".np").Click
        'nextPageElement.document.querySelector(".pn").Click
        'nextPageElement.document.querySelector("span.pn").Click
        'nextPageElement.document.querySelector("span.np").Click
          Application.Wait (Now   TimeValue("0:00:04"))
        Else:
            Exit Do
        End If

    Do While objIE.Busy = True Or objIE.readyState <> 4
    Loop
 
 <nav role="navigation" aria-label="pagination">
  <div class="pagination" onmousedown="pclk(event);">
    <ul class="pagination-list">
      <li><b aria-current="true" aria-label="1" tabindex="0">1</b></li>
      <li>
        <a href="/jobs?q=manageramp;amp;l=londonamp;amp;start=10" aria-label="2" data-pp="gQAPAAAAAAAAAAAAAAABpUM3WgA3AQAHXaNdLSF435uhaW440sBEPpyo6wu9yyY2dv2zPlwOkia1_Ad0YcnE3oC5V5SAQfMv9shHtgAA" onmousedown="addPPUrlParam amp;amp;amp;amp; addPPUrlParam(this);" rel="nofollow"><span class="pn">2</span></a>
      </li>
      <li>
        <a href="/jobs?q=manageramp;amp;l=londonamp;amp;start=20" aria-label="3" data-pp="gQAeAAAAAAAAAAAAAAABpUM3WgBeAQEBCG4JQk5YFZSUl7gsr035q39vtzDHJitYqr4vM2MFHgSufSgx4aWdnXw91UygifbITTf_9Xd-zeBWg6A2eTj9AkpYnhX-rcAjN1nrUkthXyccybLf4M72Myp_oAAA" onmousedown="addPPUrlParam amp;amp;amp;amp; addPPUrlParam(this);"
          rel="nofollow"><span class="pn">3</span></a></li>
      <li>
        <a href="/jobs?q=manageramp;amp;l=londonamp;amp;start=30" aria-label="4" data-pp="gQAtAAAAAAAAAAAAAAABpUM3WgCCAQMBCBIHEAgKK3TbOCxrwjMPxwTV6_j9fNaHMo3xNxBWr7N7iCbTP36N-nxYL04iAaq5_diz3DVQ63zhssHzded33JzRuIfyx9aiyFO2ElmBhWcblWNGlmhwv7P7-3rovVi7CVDOHjCKDCVg45A442qbMJ5Wo9JtMKsCponthuH3GQAA"
          onmousedown="addPPUrlParam amp;amp;amp;amp; addPPUrlParam(this);" rel="nofollow"><span class="pn">4</span></a></li>
      <li>
        <a href="/jobs?q=manageramp;amp;l=londonamp;amp;start=40" aria-label="5" data-pp="gQA8AAAAAAAAAAAAAAABpUM3WgChAQIBCBISRVBBqQZzCe6zv5ptH6EOR3ZxgRqrJvxsJggbwhKYOoxC_WmDgzvp-t1_I5-ajTgabdUP917NrwmP_ZTSJKw7Qsu2h2XODIZnEGpR4EUkRNB8BJX7y01xkWMfbFMYqgQQyGS_4mI9NrbWaont2mhvbhw4_6obi9V3Dq16okhKL7ATYpwifpNN_iYSoSsoyTM2DFqJO76sH6r8Cg4AAA"
          onmousedown="addPPUrlParam amp;amp;amp;amp; addPPUrlParam(this);" rel="nofollow"><span class="pn">5</span></a></li>
      <li>
        <a href="/jobs?q=manageramp;amp;l=londonamp;amp;start=10amp;amp;pp=gQAPAAAAAAAAAAAAAAABpUM3WgA3AQAHXaNdLSF435uhaW440sBEPpyo6wu9yyY2dv2zPlwOkia1_Ad0YcnE3oC5V5SAQfMv9shHtgAA" aria-label="Next" data-pp="gQAPAAAAAAAAAAAAAAABpUM3WgA3AQAHXaNdLSF435uhaW440sBEPpyo6wu9yyY2dv2zPlwOkia1_Ad0YcnE3oC5V5SAQfMv9shHtgAA"
          onmousedown="addPPUrlParam amp;amp;amp;amp; addPPUrlParam(this);" rel="nofollow">
          <span class="pn">
          <span class="np">
          <svg width="24" height="24" fill="none"><path d="M10 6L8.59 7.41 13.17 12l-4.58 4.59L10 18l6-6-6-6z" fill="#2D2D2D"></path>
          </svg></span>
          </span>
        </a>
      </li>
    </ul>
  </div>
</nav> 

Как всегда заранее спасибо

############### ОБНОВЛЕНИЕ СЕГОДНЯ, 20 МАЯ #####################

Веб-сайт действительно называется «Это версия для Великобритании», я не размещал эту ссылку, так как на нем есть только страница поиска работы, на которой нет разбивки на страницы. Эта ссылка Новая ссылка появляется, когда найдены критерии поиска, и именно на этой странице указана разбивка на страницы, поэтому я разместил ее в своем первом посте.

Спасибо, что посмотрели

################## обновление 22/5/20201 ###########################

Также опубликовано здесь, г-н Эксель

Комментарии:

1. Можем ли мы, пожалуйста, получить фактический URL-адрес?

2. QHarr, пожалуйста, ознакомьтесь с моей правкой выше в моем посте, который касается вашего вопроса

3. Я действительно застрял на этом и не могу с этим работать, я был бы признателен, если бы кто-нибудь мог посоветовать правильный класс или запрос. Как всегда заранее спасибо