#google-cloud-platform #google-bigquery #translation
#google-cloud-platform #google-bigquery #перевод
Вопрос:
В моем BigQuery есть таблица, подобная следующей
article_title author
いい天気です Inoue
富士山絶景 Kojiro
... ...
Столбец заголовка статьи — это некоторые статьи на японском языке. Я хотел бы использовать GCP Translation API для перевода столбца article_title на английский и преобразования таблицы в следующий
article_title_en author
Good weather Inoue
Mt. Fuji view Kojiro
...
Как мне это сделать?
Комментарии:
1. Посмотрите эту демонстрацию из Cloud Next ’19 — Путешествие Вианта: руководство для неинженеров по BigQuery — в ней показан аналогичный вариант использования, но с использованием Vision API. Это делается с помощью Magnus — части Potens. Инструменты ввода-вывода BigQuery — они доступны на GCP Marketplace , чтобы вы могли попробовать. Очевидно, я настоятельно рекомендую посмотреть видео целиком! Вы также можете посмотреть всю документацию и видеоролики о продукте здесь . Раскрытие информации — я являюсь частью и руководителем Potens.io Команда (также указана в моем профиле SO)
2. Сколько у вас строк?
3. @guillaumeblaquiere Чуть больше 2 миллионов.
Ответ №1:
BigQuery не может вызвать внешний API. Таким образом, вы не можете использовать API перевода непосредственно из BigQuery.
Моя идея заключается в следующем
- Создайте новый Google Sheet с подключенным листом к BigQuery
- Получить все данные таблицы в Google Sheet
- Используйте возможности перевода Google Sheet (функция GOOGLETRANSLATE)
- Создайте объединенную таблицу в BigQuery для чтения в вашем Google Sheet
К сожалению, я не могу протестировать функцию подключенного листа, потому что она зарезервирована для платных пользователей, и у меня больше нет платной корпоративной учетной записи (я сменил компанию 1 месяц назад). Я не могу проверить это решение от начала до конца и помочь вам в дальнейшем.