Хранение документов с атрибутами в MSSQL

#sql #sql-server #blob

Вопрос:

В Adobe Acrobat я могу добавлять фрагменты информации, такие как пометка некоторого текста OCRed (1 января 2021 года) как «дата» с пометкой «1/1/2021». Если мы храним документы (PDF-файлы, TIFF) в SQL Server (большой двоичный объект, а не поток файлов), могу ли я помечать/помечать/вставлять данные таким же образом? Может быть, лучше спросить, если бы я загрузил файл PDF, в котором уже есть такие теги, могу ли я каким-то образом получить к ним доступ?

Отредактировано по адресу @Panagiotis Kanavos отличный вопрос.

Комментарии:

1. Зачем вам хранить PDF-файлы в виде больших двоичных объектов в базе данных? Сохраните их в файловой системе и вместо этого поместите местоположение в базу данных. Вы можете добавлять любые столбцы атрибутов в таблицу документов.

2. @SchmitzIT вот для чего нужны капли. SQL Server действительно может хранить большие двоичные объекты в определенной папке, используя хранилище FILESTREAM. Его искатель полнотекстового поиска может извлекать атрибуты из форматов файлов PDF и TIFF

3. @KyleSouza атрибуты хранятся внутри файла, поэтому SQL Server не заботится о них. Может быть, реальный вопрос в том, можете ли вы получить к ним доступ ?

4. @PanagiotisKanavos На самом деле я никогда не использовал капли. Конечно, я не выполнял надлежащую работу DBA в течение многих лет, поэтому мои знания устарели. Спасибо, что дали мне несколько советов о том, как научиться чему-то новому 🙂