Преобразование запроса Excel Oracle DB в Python Pandas

#python #sql #excel #database #oracle

#python #sql #excel #База данных #Oracle

Вопрос:

У меня есть простая программа, которая устанавливает соединение с Oracle DB на Python. Мне нужны некоторые подсказки о том, как написать SQL-запрос в Python. У меня есть запрос Excel, который работает нормально, но мне нужно это на Python, и я думаю, что у меня есть то, что мне нужно в свойствах подключения к запросу Excel. Моя программа на Python выглядит следующим образом-

 import pandas as pd
import cx_Oracle
from sys import exit

conn= cx_Oracle.connect('DOMINA_CO/S#UU@ex021-orc.corp.mycompany.com:1540/domp_domi_bi')
try:
    query = '''
     SELECT * from dual
         '''
    df = pd.read_sql(con = conn, sql = query)
    finally:
conn.close()
df.head()

exit()
 

и возвращает —

 Out[2]: 
DUMMY
0     X
 

Из Excel у меня есть свойства подключения рабочего запроса, который имеет «Текст команды:», который выглядит следующим образом:

 SELECT TO_CHAR (DGE_DATOS_INSTALACIONES.FEC_LOCAL - (1/24), 'YYYY-MM') MONTH,
       REPLACE(DGE_NEGOCIOS.NOM_NEGOCIO, 'ESPAÑA', 'SPAIN') BUSINESS,
       REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(DGE_PAISES.NOM_PAIS, 'ESPAÑA', 'SPAIN'), 'ALEMANIA', 'GERMANY'), 'BRASIL', 'BRAZIL'), 'CHIPRE', 'CYPRUS'), 'FRANCIA', 'FRANCE'), 'GRECIA', 'GREECE'), 'HUNGRIA', 'HUNGARY'), 'ITALIA', 'ITALY'), 'POLONIA', 'POLAND'), 'RUMANIA', 'ROMANIA'), 'ESCOCIA', 'SCOTLAND'), 'GALES', 'WALES'), 'INGLATERRA', 'ENGLAND'), 'IRLANDA DEL NORTE', 'NORTHERN IRELAND'), 'IRLANDA', 'IRELAND'), 'ESTADOS UNIDOS', 'UNITED STATES') COUNTRY,
       DGE_REGIONES.NOM_REGION REGION,
       DGE_INSTALACIONES.NOM_INSTALACION PARK,
       ROUND(SUM(DGE_DATOS_INSTALACIONES.CAN_PRODUCIBLE_SUMA*DGE_DATOS_INSTALACIONES.COEF_PERDIDAS_MEDIA_TENSION*DGE_DATOS_INSTALACIONES.COEF_PERDIDAS_PF)/1000) "POTENTIAL_GEN_(MWH)"

FROM DOMINAGE.DGE_DATOS_INSTALACIONES DGE_DATOS_INSTALACIONES,
     DOMINAGE.DGE_NEGOCIOS DGE_NEGOCIOS,
     DOMINAGE.DGE_PAISES DGE_PAISES,
     DOMINAGE.DGE_REGIONES DGE_REGIONES,
     DOMINAGE.DGE_INSTALACIONES DGE_INSTALACIONES

WHERE DGE_DATOS_INSTALACIONES.FEC_LOCAL >= TO_DATE('01-JAN-13 01:00', 'DD-MON-YY HH24:MI')
      AND DGE_DATOS_INSTALACIONES.COD_INSTALACION = DGE_INSTALACIONES.COD_INSTALACION
      AND DGE_INSTALACIONES.COD_NEGOCIO = DGE_NEGOCIOS.COD_NEGOCIO
      AND DGE_INSTALACIONES.COD_PAIS = DGE_PAISES.COD_PAIS
      AND DGE_INSTALACIONES.COD_REGION = DGE_REGIONES.COD_REGION

GROUP BY TO_CHAR (DGE_DATOS_INSTALACIONES.FEC_LOCAL - (1/24), 'YYYY-MM'),
         DGE_NEGOCIOS.NOM_NEGOCIO,
         DGE_PAISES.NOM_PAIS,
         DGE_REGIONES.NOM_REGION,
         DGE_INSTALACIONES.NOM_INSTALACION

ORDER BY MONTH,
         REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(BUSINESS, 'UNITED STATES', '1'), 'SPAIN', '2'), 'UNITED KINGDOM', '3'), 'INTERNATIONAL', '4'), 'OFFSHORE', '5'),
         COUNTRY,
         PARK
 

Любая помощь в преобразовании этого запроса в запрос python очень ценится, поскольку я новичок в написании запросов к БД на python!!

Ответ №1:

Никакого перевода не требуется. Просто повторно запустите тот же запрос. Python и Excel VBA служат клиентскими приложениями, которые подключаются к одной и той же серверной базе данных, в данном случае Oracle. Базы данных предназначены для подключения к любому клиенту.

На самом деле, рассмотрите возможность сохранения вашего длинного SQL-запроса в текстовом .sql файле и попросите всех клиентов просто прочитать файл сценария и избегать длинных строк с кавычками или разрывами строк в любом коде.

Python

 conn= cx_Oracle.connect('...')

# READ SQL QUERY FROM FILE
with open(r'C:pathtomyquery.sql') as f:
    query = f.read().strip()

# IMPORT INTO PANDAS DATA FRAME
try:
    df = pd.read_sql(con = conn, 
                     sql = query)     # QUERY READ FROM .sql FILE
finally:
    conn.close()

df.head()
 

Excel VBA

 ' READ SQL QUERY FROM FILE
With CreateObject("Scripting.FileSystemObject")
      sql = .OpenTextFile("C:PathTomyquery.sql", 1).readall
End With

' OPEN DB CONNECTION
Set conn = New ADODB.Connection
conn.Open "..."
   
' DEFINE COMMAND OBJECT
Set cmd = New ADODB.Command
With cmd
    .ActiveConnection = conn
    .CommandType = adCmdText
    .CommandText = sql               ' QUERY READ FROM .sql FILE
    
    Set rst = cmd.Execute
End With 
 

Комментарии:

1. Спасибо. я получаю «ошибку типа» в строке sql = query. Это выглядит как «ожидание объекта string или bytes».

2. f.readlines() возвращает список с элементом для каждой строки. f.read() возвращает весь файл как один str (со встроенными символами новой строки).

Ответ №2:

Запрос будет таким же. В обоих случаях он отправляется в БД для выполнения и возврата данных. Поскольку текст содержит одинарные кавычки, вы захотите заключить его в тройные двойные кавычки («) вместо тройных одинарных кавычек, которые у вас есть вокруг SELECT * FROM DUAL .

Комментарии:

1. Хорошо, мне нужно удалить SELECT * ИЗ ДВОЙНОЙ части, вставить полный запрос выше, а затем заключить его в 6 кавычек, например (‘ ‘ ‘ ‘ ‘ ‘)?

2. Для цитирования посмотрите на такие примеры, как github.com/oracle/python-cx_Oracle/blob/master/samples /…