Поток данных, оставленный внешним соединением, приводит к пустому набору данных при выполнении, но не при отладке

#azure-data-factory #azure-data-flow

Вопрос:

У нас есть левое внешнее соединение, настроенное между двумя наборами данных. При выполнении соединение не показывает результатов, хотя при отладке это происходит. Оба набора данных соединения содержат данные, и условие выполнено, хотя при левом внешнем соединении я ожидал бы, по крайней мере, содержимого из первого набора данных.

введите описание изображения здесь

Конвейер потока данных содержит два похожих соединения, и в обоих случаях мы ведем себя одинаково.

Наборы данных, участвующие в объединении, содержат от 20 до 60 тысяч записей. Однако поток загружает пару наборов данных примерно в 1 миллион записей. Однако мы ожидали бы некоторой ошибки, если бы это было связано с памятью…

Комментарии:

1. Я думаю, что поведение сеанса отладки по умолчанию-это просто ВЫБОР 1000 лучших записей из исходных наборов данных. Возможно ли для вас воспроизвести поведение сеанса отладки, создав отдельные наборы данных для тестирования из 1000 лучших; выполните конвейер на новых наборах данных и посмотрите, не приведет ли это также к отсутствию результатов? (т. Е. Как поведение при использовании обычных наборов данных)

2. Не могли бы вы, пожалуйста, добавить еще несколько деталей для нашего ясного понимания. Успешен ли запуск потока ? где вы не видите результатов ? в приемнике или просто в сводке диагностики запуска конвейера ? если вы можете видеть в предварительном просмотре отладки — ваш поток работает. Из вашего снипа я вижу, что преобразование join прошло успешно с 41 столбцом . Можете ли вы проверить показатели объединения в предварительном просмотре, как вы видите здесь и здесь