Проблема с загрузчиком файлов и именем формата

#python #web-scraping #scrapy #web-crawler #data-collection

Вопрос:

Я новичок в скрэпи

На первом этапе программа подключается к базе данных и возвращает параметр имени программы, даты и ссылки внутри фрейма данных Pandas (фрейм данных содержит более 300 строк и 3 столбца) .

Используя строку f, ссылка создается, и загрузчик начинает загрузку этих ссылок

Я хочу, чтобы столбец имени файла считывался в той же таблице внутри цикла при чтении ссылки, а файлы сохранялись с нужным именем и датой

например : Данные = фрейм данных панд включает :

Url-адреса: www.xyz.com, Имена: abc, Даты: 2020/01/01

Я хочу знать, как я могу сохранить файл как abc.2020/01/01

Код паука :

 import scrapy


from Data import connector_15


from ..items import CoscrapyItem


class FirstSpider(scrapy.Spider):
    


name = 'first'
    

start_urls = []

    def parse(self, response):
        links = []
        names = []
        item = CoscrapyItem()
        Data = connector_15()

        for i in Data["PdfUrl"]:
            links.append(f"""https://www.aaa.ir/{i}""")
        

        file_urls = links

        item['file_urls'] = file_urls

        yield item
 

Код товара :

 import scrapy


class CodalscrapyItem(scrapy.Item):


    file_urls = scrapy.Field()


    files = scrapy.Field()
 

Комментарии:

1. Привет! Добро пожаловать в SO. Я думаю, ты забыл задать вопрос?