#javascript #python #screen-scraping
#javascript #python #очистка экрана
Вопрос:
Итак, я пытаюсь очистить Yahoo gamechannel / startracker, чтобы я мог получать обновления для фэнтезийных команд, когда игроки получают очки, чтобы я мог составлять графики в Excel. URL-адрес веб-сайта в основном http://sports .yahoo.com/nfl/gamechannel?app=stamp;lid=60604 <— число в конце — это идентификатор лиги
я вроде как новичок в python.
Сначала я попробовал использовать beautiful soup, который сработал и дал мне код для страницы, но не для игрового канала, поскольку для этого требуется javascript.
Я получил webkit и запустил его через это, но там, где должен быть gamechannel, он говорит мне обновить мой flash player. что? он обновлен.
Что мне делать?
Комментарии:
1. сайт находится на flash, вы не сможете разобрать его с помощью beautiful soup.
2.похоже, что selenium может это сделать, стоит look.adobe.com/devnet/flash/articles/flash_selenium.html seleniumhq.org
3. вау, это выглядит действительно сложно
4. Вероятно, это также является вопиющим нарушением условий использования Yahoo, поэтому неудивительно, что они не облегчают вам задачу.
5. оххххх … не знал этого. думаю, я попробую использовать их api
Ответ №1:
Возможно, вы захотите изучить API Yahoo Fantasy Sports: http://developer .yahoo.com/fantasysports/guide/index.html
This
это те данные, которые вы можете получить.
Будет ли от этого какая-либо польза или вы пытаетесь получить информацию, недоступную через API?
PS. Вам нужно будет получить ключ API здесь: http://developer .yahoo.com/dashboard/createKey.html
Комментарии:
1. да, я думаю о том, чтобы просто использовать это
2. Хм .. когда есть выбор использования API, очистка экрана была бы немного безумной.
3. теперь мне нужно преобразовать API наследника в python.. почему это так сложно =(
4. @Acorn я думаю, это то, чего я хочу. я понятия не имею, как это сделать в python atm, хотя