#cdap #google-cloud-data-fusion
#cdap #google-cloud-data-fusion
Вопрос:
Я впервые играю с Google Data Fusion (он был выпущен в бета-версии около 4 часов назад), и первое, что я пытаюсь сделать, это что-то довольно тупое — прочитать содержимое файла JSON, который находится в корзине GCS. Источник GCS кажется очевидным. Я настроил его следующим образом:
Если я перейду на вкладку предварительного просмотра, я увижу сообщение
Данные предварительного просмотра для этапа «Облачное хранилище Google» недоступны.
Это из-за того, что я что-то сделал неправильно или потому, что источник GCS не поддерживает предварительный просмотр данных? Я буду немного разочарован, если это последнее, предварительный просмотр данных был бы очень полезен в таком инструменте, как этот.
Ответ №1:
Вы указываете все справедливые моменты, и мы рассмотрим их и улучшим работу. Полностью понимаю, что вы говорите.
Нитин
Ответ №2:
Хорошо, я разобрался с проблемой, учетная запись службы, с которой работает экземпляр Data Fusion, нуждается в доступе к корзинам хранения. Когда я предоставил этот доступ (добавив учетную запись службы к ролям администратора хранилища и просмотра объектов хранилища), сообщение об ошибке исчезло (оно было заменено другим сообщением об ошибке, но это для другого потока).
Здесь есть ряд проблем, связанных с:
- Я понял проблему только тогда, когда попытался запустить конвейер и увидел полезное сообщение об ошибке в журналах («
<service account> does not have storage.buckets.get access to <bucket>
«). На вкладке предварительного просмотра не было сообщения об ошибке, указывающего, в чем проблема, там должно отображаться то же сообщение об ошибке. - Почему я не могу выбрать, какую учетную запись службы я хочу, чтобы экземпляр использовал, а не создавал ее от моего имени?