#python #python-2.7
#питон #python-2.7
Вопрос:
Я работаю над заданием, и мне нужно просмотреть PDF-файл и найти ключевое слово «студент» на каждой странице. Если ключевое слово существует на странице, мне нужно переместить его в новый PDF-файл. Если его нет на странице, перейдите к следующему. Часть, с которой я борюсь, заключается в том, что я не знаю, как просматривать каждую страницу строка за строкой и добавлять ее в новый PDF-файл, если есть экземпляр «студент».
Это то, что у меня есть до сих пор:
from PyPDF2 import PdfFileReader, PdfFileWriter pdf_file_path = 'meetingminutes.pdf' file_base_name = pdf_file_path.replace('.pdf', '') pdf = PdfFileReader(pdf_file_path) keyword = re.compile("student") for line in pdf_file_path: if keyword.search(line): print() with open('{0}_NEW.pdf'.format(file_base_name), 'wb') as f: pdfWriter.write(f) f.close()
Я думаю, что мне нужно поместить все слова с каждой страницы в открытый текст (отсюда раздел keyword.search ()), но я не знаю, как перемещать страницу за страницей и как интегрировать ее в новый PDF в конце. Однако я знаю, что это будет связано с циклом. Должна ли заключительная часть (где создается новый PDF-файл) находиться в том же цикле, что и поиск по ключевым словам?