#azure #azure-cognitive-search
Вопрос:
Я использую когнитивный поиск Azure для индексирования больших двоичных объектов (pdf/xlsx/pptx/docx/видео/изображения) в хранилище Azure Data Lake Gen2. У меня также есть приложение для бизнес-пользователей, позволяющее им выполнять поиск по всем документам с использованием созданных индексов.
Теперь мне нужно разрешить бизнес-пользователям создавать настраиваемые теги для любого из извлеченных документов (т. Е. Пользователь хочет пометить документ тегом с именем project_name и установить его значение в project-lotus). Эти теги будут созданы из нашего приложения и будут храниться в коллекции Cosmos DB.
- Есть ли простой способ добавить эти теги в качестве новых полей в тот же индекс больших двоичных объектов, который я уже использую в своем приложении?
В идеале я хочу иметь индекс, построенный из 2 источников: файлов больших двоичных объектов (ADLS Gen2) и пользовательских метаданных, связанных с каждым файлом (Cosmos DB).
Комментарии:
1. Это должно быть возможно сделать. Пожалуйста, посмотрите это: docs.microsoft.com/en-us/azure/search/. … ХТХ.
Ответ №1:
Оптимизация индексирования с помощью push API или, как предлагается, индекса из нескольких источников данных Azure с использованием .NET SDK будет полезна здесь, поскольку они поддерживают индексирование данных из базы данных Azure cosmos DB и объединение данных, хранящихся в хранилище больших двоичных объектов Azure.
Ответ №2:
Для этого можно использовать сопоставления полей!
Они полезны, когда нам нужно заполнить поле индекса данными из нескольких источников данных — в моем случае ADLS Gen2 (файлы больших двоичных объектов) и Cosmos DB (метаданные файлов).
Для получения дополнительной информации ознакомьтесь с этим руководством: индексирование из нескольких источников данных с помощью .NET SDK