#excel #vba #web-scraping #screen-scraping
Вопрос:
Я действительно застрял на навигации по страницам при создании веб-страниц. Навигация по моей странице работала нормально, но неделю назад она остановилась, и я, похоже, не могу ее исправить. Он просто переходит со страницы 1 на страницу 2 в цикле, поэтому при поиске на 6 страницах он посетит страницу 1 2 по три раза каждый.
Я перепробовал несколько методов, все они просто переходят со страницы 1 на страницу 2, а затем снова возвращаются на страницу 1. Не мог бы кто-нибудь посоветовать, пожалуйста, какой правильный класс или объект запроса?
Я использовал это
Do
If pageNumber >=6 Then Exit Do
On Error Resume Next
Set nextPageElement = HTML.getElementsByClassName("np")(0) ' CLICK TO NEXT PAGE
If nextPageElement Is Nothing Then Exit Do
Application.Wait (Now TimeValue("0:00:04"))
nextPageElement.Click 'next web page
Do While objIE.Busy = True Or objIE.readyState <> 4
Loop
С тех пор я пробовал это, но, похоже, не могу с этим справиться
Do
If pageNumber >=6 Then Exit Do
Set nextPageElement = HTML.getElementsByClassName("pagination-list")(0)
'Set nextPageElement = HTML.getElementsByClassName("pagination")(0)
If Not nextPageElement Is Nothing Then
nextPageElement.document.querySelector(".np").Click
'nextPageElement.document.querySelector(".pn").Click
'nextPageElement.document.querySelector("span.pn").Click
'nextPageElement.document.querySelector("span.np").Click
Application.Wait (Now TimeValue("0:00:04"))
Else:
Exit Do
End If
Do While objIE.Busy = True Or objIE.readyState <> 4
Loop
<nav role="navigation" aria-label="pagination">
<div class="pagination" onmousedown="pclk(event);">
<ul class="pagination-list">
<li><b aria-current="true" aria-label="1" tabindex="0">1</b></li>
<li>
<a href="/jobs?q=manageramp;amp;l=londonamp;amp;start=10" aria-label="2" data-pp="gQAPAAAAAAAAAAAAAAABpUM3WgA3AQAHXaNdLSF435uhaW440sBEPpyo6wu9yyY2dv2zPlwOkia1_Ad0YcnE3oC5V5SAQfMv9shHtgAA" onmousedown="addPPUrlParam amp;amp;amp;amp; addPPUrlParam(this);" rel="nofollow"><span class="pn">2</span></a>
</li>
<li>
<a href="/jobs?q=manageramp;amp;l=londonamp;amp;start=20" aria-label="3" data-pp="gQAeAAAAAAAAAAAAAAABpUM3WgBeAQEBCG4JQk5YFZSUl7gsr035q39vtzDHJitYqr4vM2MFHgSufSgx4aWdnXw91UygifbITTf_9Xd-zeBWg6A2eTj9AkpYnhX-rcAjN1nrUkthXyccybLf4M72Myp_oAAA" onmousedown="addPPUrlParam amp;amp;amp;amp; addPPUrlParam(this);"
rel="nofollow"><span class="pn">3</span></a></li>
<li>
<a href="/jobs?q=manageramp;amp;l=londonamp;amp;start=30" aria-label="4" data-pp="gQAtAAAAAAAAAAAAAAABpUM3WgCCAQMBCBIHEAgKK3TbOCxrwjMPxwTV6_j9fNaHMo3xNxBWr7N7iCbTP36N-nxYL04iAaq5_diz3DVQ63zhssHzded33JzRuIfyx9aiyFO2ElmBhWcblWNGlmhwv7P7-3rovVi7CVDOHjCKDCVg45A442qbMJ5Wo9JtMKsCponthuH3GQAA"
onmousedown="addPPUrlParam amp;amp;amp;amp; addPPUrlParam(this);" rel="nofollow"><span class="pn">4</span></a></li>
<li>
<a href="/jobs?q=manageramp;amp;l=londonamp;amp;start=40" aria-label="5" data-pp="gQA8AAAAAAAAAAAAAAABpUM3WgChAQIBCBISRVBBqQZzCe6zv5ptH6EOR3ZxgRqrJvxsJggbwhKYOoxC_WmDgzvp-t1_I5-ajTgabdUP917NrwmP_ZTSJKw7Qsu2h2XODIZnEGpR4EUkRNB8BJX7y01xkWMfbFMYqgQQyGS_4mI9NrbWaont2mhvbhw4_6obi9V3Dq16okhKL7ATYpwifpNN_iYSoSsoyTM2DFqJO76sH6r8Cg4AAA"
onmousedown="addPPUrlParam amp;amp;amp;amp; addPPUrlParam(this);" rel="nofollow"><span class="pn">5</span></a></li>
<li>
<a href="/jobs?q=manageramp;amp;l=londonamp;amp;start=10amp;amp;pp=gQAPAAAAAAAAAAAAAAABpUM3WgA3AQAHXaNdLSF435uhaW440sBEPpyo6wu9yyY2dv2zPlwOkia1_Ad0YcnE3oC5V5SAQfMv9shHtgAA" aria-label="Next" data-pp="gQAPAAAAAAAAAAAAAAABpUM3WgA3AQAHXaNdLSF435uhaW440sBEPpyo6wu9yyY2dv2zPlwOkia1_Ad0YcnE3oC5V5SAQfMv9shHtgAA"
onmousedown="addPPUrlParam amp;amp;amp;amp; addPPUrlParam(this);" rel="nofollow">
<span class="pn">
<span class="np">
<svg width="24" height="24" fill="none"><path d="M10 6L8.59 7.41 13.17 12l-4.58 4.59L10 18l6-6-6-6z" fill="#2D2D2D"></path>
</svg></span>
</span>
</a>
</li>
</ul>
</div>
</nav>
Как всегда заранее спасибо
############### ОБНОВЛЕНИЕ СЕГОДНЯ, 20 МАЯ #####################
Веб-сайт действительно называется «Это версия для Великобритании», я не размещал эту ссылку, так как на нем есть только страница поиска работы, на которой нет разбивки на страницы. Эта ссылка Новая ссылка появляется, когда найдены критерии поиска, и именно на этой странице указана разбивка на страницы, поэтому я разместил ее в своем первом посте.
Спасибо, что посмотрели
################## обновление 22/5/20201 ###########################
Также опубликовано здесь, г-н Эксель
Комментарии:
1. Можем ли мы, пожалуйста, получить фактический URL-адрес?
2. QHarr, пожалуйста, ознакомьтесь с моей правкой выше в моем посте, который касается вашего вопроса
3. Я действительно застрял на этом и не могу с этим работать, я был бы признателен, если бы кто-нибудь мог посоветовать правильный класс или запрос. Как всегда заранее спасибо