Как я могу ссылаться на внешнюю таблицу в подзапросе для самостоятельного левого соединения?

ProgramBox

Как я могу ссылаться на внешнюю таблицу в подзапросе для самостоятельного левого соединения?

Post author:admin
Запись опубликована:13 апреля, 2023
Post category:Вопросы по программированию

#sql #oracle #self-join #correlated-subquery

#sql #Oracle #самосоединение #коррелированный-подзапрос

Вопрос:

С помощью этой схемы:

 CREATE TABLE BAR (id INT PRIMARY KEY);
CREATE TABLE FOO (id INT PRIMARY KEY, rank INT UNIQUE, fk INT, FOREIGN KEY (fk) REFERENCES Bar(id));

INSERT INTO BAR (id) VALUES (1);
INSERT INTO BAR (id) VALUES (2);

-- sample values
INSERT INTO FOO (id, rank, fk) VALUES (1, 10, 1);
INSERT INTO FOO (id, rank, fk) VALUES (2, 3, 1);
INSERT INTO FOO (id, rank, fk) VALUES (3, 9, 2);
INSERT INTO FOO (id, rank, fk) VALUES (4, 5, 1);
INSERT INTO FOO (id, rank, fk) VALUES (5, 12, 1);
INSERT INTO FOO (id, rank, fk) VALUES (6, 14, 2);

Как я могу запросить определенные строки FOO и строки, связанные с той же строкой BAR со следующим по старшинству rank значением? То есть я хочу выполнить поиск по определенным строкам («targets»), и для каждой целевой строки я также хочу найти другую строку («secondary»), такую, чтобы у secondary был самый высокий ранг из всех строк с secondary.fk = target.fk и secondary.rank < target.rank .

Например, если я нацелен на все строки (без предложения where), я бы ожидал такого результата:

 TARGET_ID  TARGET_RANK  SECONDARY_ID  SECONDARY_RANK
---------  -----------  ------------  --------------
        1           10             4               5
        2            3          NULL            NULL
        3            9          NULL            NULL
        4            5             2               3
        5           12             1              10
        6           14             3               9

Когда целевая строка имеет id 2 или 3, вторичной строки нет, потому что ни одна строка не совпадает fk с целевой строкой и имеет меньшую rank .

Я попробовал это:

 SELECT F1.id AS TARGET_ID, F1.rank as TARGET_RANK, F2.id AS SECONDARY_ID, F2.rank AS SECONDARY_RANK
FROM FOO F1
LEFT JOIN FOO F2 ON F2.rank = (SELECT MAX(S.rank)
                               FROM FOO S
                               WHERE S.fk = F1.fk
                                 AND S.rank < F1.rank);

…но я получил ORA-01799: a column may not be outer-joined to a subquery .

Затем я попробовал это:

 SELECT F1.id AS TARGET_ID, F1.rank AS TARGET_RANK, F2.id AS SECONDARY_ID, F2.rank AS SECONDARY_RANK
FROM FOO F1
LEFT JOIN (SELECT S1.rank, S1.fk
           FROM FOO S1
           WHERE S1.rank = (SELECT MAX(S2.rank)
                            FROM FOO S2
                            WHERE S2.rank < F1.rank
                              AND S2.fk = F1.fk)
           ) F2 ON F2.fk = F1.fk;

…но я получил ORA-00904: "F1"."FK": invalid identifier .

Наверняка есть какой-то способ сделать это в одном запросе?

1. Ошибка, которую вы получаете, заключается в том, что вы ссылаетесь на f1 в подзапросе, где f1 не определен. Помните, что подзапрос — это автономный запрос, который не может ссылаться на строки, которые не включены в подзапрос. Я думаю, что могу переписать для вас, может занять немного

Ответ №1:

Ему не нравится подзапрос внутри временной таблицы. Хитрость заключается в том, чтобы соединить по левому краю все вторичные строки, rank меньшие, чем у цели rank , затем использовать предложение WHERE, чтобы отфильтровать все, кроме максимального, при этом не отфильтровывая целевые строки без дополнительных.

 select F1.id as TARGET_ID, F1.rank as TARGET_RANK, F2.id as SECOND_ID, F2.rank as SECOND_RANK
from FOO F1
left join FOO F2 on F1.fk = F2.fk and F2.rank < F1.rank
where F2.rank is null or F2.rank = (select max(S.rank)
                                    from FOO S
                                    where S.fk = F1.fk
                                      and S.rank < F1.rank);

Ответ №2:

 select f1.rank f1rank, f2.rank as f2rank
from foo f1
left join foo f2 on f1.fk = f2.fk and f1.rank > f2.rank

Это вернет строку для каждой записи foo, которая имеет другую запись в той же таблице (используя fk для определения этого) и ниже существующего ранга. Теперь вам просто нужно максимальное значение (f2.rank) оттуда. Перейдите выше в подзапрос и найдите максимальное

 Select f1rank, max(f2rank) f2rank
from
(select f1.rank f1rank, f2.rank as f2rank
from foo f1
left join foo f2 on f1.fk = f2.fk and f1.rank > f2.rank) a
group by f1rank

Извините, у меня нет времени на тестирование / устранение неполадок, но логика должна быть там.

Ответ №3:

Вам нужны аналитические функции

 select id, 
lead(rank) over (partition by fk order by rank) next_rank
lag(rank) over (partition by fk order by rank)  prev_rank
from foo

Это более эффективно, чем самостоятельные соединения.

Но если вы хотите подвергнуть пыткам свою базу данных, вы можете попробовать

 select id, 
(select min(f2.rank) from foo f2 where f2.fk = f1.fk and f2.rank >f1.rank) next_rank,
(select max(f2.rank) from foo f2 where f2.fk = f1.fk and f2.rank <f1.rank) prev_rank
from foo f1

Хорошо, я неправильно понял, что должно быть в выходных данных. Вот пример:

 select id, rank, prev_rank_id from (
select id, rank,
lag(id) over (partition by fk order by rank) prev_rank_id
from foo
)
where id in (1, 3)

Аналитические функции работают с ВЫХОДНЫМ набором данных. Вам нужно обернуть это в другой оператор select, чтобы ограничить ваш фактический вывод.

1. Хммм, раньше не использовал аналитические функции. На основе документации Oracle это звучит так, как будто это сработает, но я не совсем уверен, как применить это к конкретному случаю. Не могли бы вы привести пример, эквивалентный двум в вопросе (кроме рабочего)?

2. аналитические функции не являются специфичными для Oracle, они являются частью стандарта SQL. Это очень мощный инструмент, поэтому важно знать, как он работает. Из заметных баз данных только MySQL их не поддерживает.

3.О, я думал, что они были только Oracle. Что касается вашей правки, для id=3 это должно быть 9, NULL , потому что нет строки с fk=2 and rank<9 . Аналогично, для id=1 результата есть 10, 5 и нет 10, 12 . Мне нужна строка с тем же fk и самым высоким rank значением, что и у первой строки rank .

4. Круто, меняем опережение (следующая запись) на запаздывание (предыдущая запись)!

5. Я получаю null, когда пытаюсь сделать это с where id in (1, 3) . Я все еще не уверен, что мы говорим об одном и том же. Я снова обновил вопрос, чтобы убедиться, что нет путаницы. Я не хочу, чтобы каждая строка результата основывалась на предыдущей строке, я хочу, чтобы каждая строка результата возвращала данные из двух строк таблицы, целевой строки и дополнительной строки, которая определяется целевой строкой.