Как мне просмотреть данные в файле JSON, который находится в GCS?

#cdap #google-cloud-data-fusion

#cdap #google-cloud-data-fusion

Вопрос:

Я впервые играю с Google Data Fusion (он был выпущен в бета-версии около 4 часов назад), и первое, что я пытаюсь сделать, это что-то довольно тупое — прочитать содержимое файла JSON, который находится в корзине GCS. Источник GCS кажется очевидным. Я настроил его следующим образом:

введите описание изображения здесь

Если я перейду на вкладку предварительного просмотра, я увижу сообщение

Данные предварительного просмотра для этапа «Облачное хранилище Google» недоступны.

Это из-за того, что я что-то сделал неправильно или потому, что источник GCS не поддерживает предварительный просмотр данных? Я буду немного разочарован, если это последнее, предварительный просмотр данных был бы очень полезен в таком инструменте, как этот.

Ответ №1:

Вы указываете все справедливые моменты, и мы рассмотрим их и улучшим работу. Полностью понимаю, что вы говорите.

Нитин

Ответ №2:

Хорошо, я разобрался с проблемой, учетная запись службы, с которой работает экземпляр Data Fusion, нуждается в доступе к корзинам хранения. Когда я предоставил этот доступ (добавив учетную запись службы к ролям администратора хранилища и просмотра объектов хранилища), сообщение об ошибке исчезло (оно было заменено другим сообщением об ошибке, но это для другого потока).

Здесь есть ряд проблем, связанных с:

  • Я понял проблему только тогда, когда попытался запустить конвейер и увидел полезное сообщение об ошибке в журналах (« <service account> does not have storage.buckets.get access to <bucket> «). На вкладке предварительного просмотра не было сообщения об ошибке, указывающего, в чем проблема, там должно отображаться то же сообщение об ошибке.
  • Почему я не могу выбрать, какую учетную запись службы я хочу, чтобы экземпляр использовал, а не создавал ее от моего имени?