Цикл URL-ссылок и сохранение в виде PDF-файлов в Python

#python-3.x #pandas #dataframe #pdfkit

#python-3.x #pandas #фрейм данных #pdfkit

Вопрос:

Учитывая df фрейм данных следующим образом:

              projectCode                                                url
0  FCZZZZCQ2021020200921  https://www.cspea.com.cn/list/c01/FCZZZZCQ2021020200921
1        GR2021BJ1000351  https://www.cspea.com.cn/list/c01/GR2021BJ1000351
2        GR2021QD1000030  https://www.cspea.com.cn/list/c01/GR2021QD1000030
3        GR2021BJ1000186  https://www.cspea.com.cn/list/c01/GR2021BJ1000186
4    FCZZCQ2020123011487  https://www.cspea.com.cn/list/c01/FCZZCQ2020123011487
 

Я хочу использовать pdfkit пакет для сохранения каждой url ссылки в виде файла PDF и использования projectCode в качестве имени файла:

 import pdfkit
import pandas as pd

data = []
urls =  df.url.tolist()
for url_link in urls:
    pdfkit.from_url(url, 'out.pdf')
 

Как я мог это сделать? Спасибо.

Комментарии:

1. вы читаете из файла PDF или csv-файла, просто хотите подтвердить

2. кроме того, как вы создали dataframe, пожалуйста, вставьте этот код, чтобы он помог быстро решить проблему

3. Я читаю из xlsx файла формата Excel @M_x

Ответ №1:

Вы должны zip использовать столбцы, чтобы использовать его:

 for a, url in zip(df['projectCode'], df['url']):
    pdfkit.from_url(url, f'{a}.pdf')