#python #pandas #google-bigquery #google-colaboratory
#python #pandas #google-bigquery #google-colaboratory
Вопрос:
Я пытаюсь загрузить 5 файлов SQL в 5 разных таблиц в bigquery для визуализации данных в data studio.я загрузил эти файлы в раздел хранения CoLab и авторизовал проект.
datasets = [r"/file1.sql",r"/file2.sql",,r"/file3.sql",r"/file4.sql",,r"/file5.sql"]
f = open(datasets[1], "r")
data=f.read()
data = data.replace('n','')
import pandas as pd
df = pd.io.gbq.read_gbq('''data''', project_id='newproject1', dialect='standard')
df.head()
df.to_gbq('dataset1.testtable1','newproject1',chunksize=None,reauth=False,if_exists='append')
df.to_gbq('dataset1.testtable2','newproject1',chunksize=None,reauth=False,if_exists='append')
df.to_gbq('dataset1.testtable3','newproject1',chunksize=None,reauth=False,if_exists='append')
df.to_gbq('dataset1.testtable4','newproject1',chunksize=None,reauth=False,if_exists='append')
df.to_gbq('dataset1.testtable5','newproject1',chunksize=None,reauth=False,if_exists='append')
)
При запуске запроса я получаю сообщение об ошибке ниже.
The following traceback may be corrupted or invalid
The error message is: ('EOF in multi-line string', (1, 0))
---------------------------------------------------------------------------
BadRequest Traceback (most recent call last)
/usr/local/lib/python3.6/dist-packages/pandas_gbq/gbq.py in _download_results(self, query_job, max_results, progress_bar_type)
549
--> 550 query_job.result()
551 # Get the table schema, so that we can list rows.
Также я хочу знать, как изменить код python для загрузки данных в 5 уважаемых таблиц.
Комментарии:
1. В настоящее время загрузка файлов sql в BigQuery не поддерживается. Здесь вы можете найти все поддерживаемые форматы. Кроме того, в качестве альтернативы вы можете загрузить эти файлы в Cloud SQL и запросить их с помощью объединенных запросов в консоли BigQuery, как описано в документации . Будет ли это соответствовать вашим потребностям?
Ответ №1:
Я не знаю, является ли это опечаткой или это проблема, но попробуйте заменить:
df.to_gbq(dataset1.testtable1','newproject1',chunksize=None,reauth=False,if_exists='append')
df.to_gbq(dataset1.testtable2','newproject1',chunksize=None,reauth=False,if_exists='append')
df.to_gbq(dataset1.testtable3','newproject1',chunksize=None,reauth=False,if_exists='append')
df.to_gbq(dataset1.testtable4','newproject1',chunksize=None,reauth=False,if_exists='append')
df.to_gbq(dataset1.testtable5','newproject1',chunksize=None,reauth=False,if_exists='append')
с
df.to_gbq('dataset1.testtable1','newproject1',chunksize=None,reauth=False,if_exists='append')
df.to_gbq('dataset1.testtable2','newproject1',chunksize=None,reauth=False,if_exists='append')
df.to_gbq('dataset1.testtable3','newproject1',chunksize=None,reauth=False,if_exists='append')
df.to_gbq('dataset1.testtable4','newproject1',chunksize=None,reauth=False,if_exists='append')
df.to_gbq('dataset1.testtable5','newproject1',chunksize=None,reauth=False,if_exists='append')
Комментарии:
1. Извините!! это опечатка .. кавычки были включены в реальный запрос … я хочу знать, не хватает ли чего-нибудь в коде .. я думаю, если я загружу файл на Google Диск, а затем включу
from google.colab import drive drive.mount('/content/drive')
в код .. дайте мне знать, если он правильный