Как мне выполнить поиск по ключевому слову на каждой странице PDF-файла, а затем добавить эти страницы в новый PDF-файл?

#python #python-2.7

#питон #python-2.7

Вопрос:

Я работаю над заданием, и мне нужно просмотреть PDF-файл и найти ключевое слово «студент» на каждой странице. Если ключевое слово существует на странице, мне нужно переместить его в новый PDF-файл. Если его нет на странице, перейдите к следующему. Часть, с которой я борюсь, заключается в том, что я не знаю, как просматривать каждую страницу строка за строкой и добавлять ее в новый PDF-файл, если есть экземпляр «студент».

Это то, что у меня есть до сих пор:

 from PyPDF2 import PdfFileReader, PdfFileWriter  pdf_file_path = 'meetingminutes.pdf' file_base_name = pdf_file_path.replace('.pdf', '')  pdf = PdfFileReader(pdf_file_path)  keyword = re.compile("student") for line in pdf_file_path:  if keyword.search(line):  print()  with open('{0}_NEW.pdf'.format(file_base_name), 'wb') as f:  pdfWriter.write(f)  f.close()  

Я думаю, что мне нужно поместить все слова с каждой страницы в открытый текст (отсюда раздел keyword.search ()), но я не знаю, как перемещать страницу за страницей и как интегрировать ее в новый PDF в конце. Однако я знаю, что это будет связано с циклом. Должна ли заключительная часть (где создается новый PDF-файл) находиться в том же цикле, что и поиск по ключевым словам?