таблица, отличная от запроса мощности редактора на Python

#python #pandas #powerquery

Вопрос:

Мне нужно преобразовать программу преобразования данных из запроса мощности редактора в Python. Я не очень хорошо разбираюсь в запросе мощности редактора.

У меня есть таблица с 30-ю столбцами, с такой задачей:

 = Table.Distinct(#"Previous task", {"column1"})
 

Когда я это делаю, какую строку он занимает? первый? последний? Случайный?
Как я могу перевести это на Python Pandas, чтобы убедиться, что у вас одинаковые данные?

Спасибо за ответ

Ответ №1:

По умолчанию, я полагаю Table.Distinct , сохраняется первая строка.

В Pandas вы могли бы использовать что-то вроде:

 df.drop_duplicates(keep='first', inplace=True)
 

keep Параметр указывает, какую строку вы хотите сохранить, и inplace параметр просто проверяет, что изменения внесены в сам фрейм данных, а не в копию фрейма данных.

Подробнее здесь pandas.DataFrame.drop_duplicates .

Кроме того, вот еще немного информации о Table.Distinct том, как вы можете сохранить порядок сортировки таблицы перед выполнением операции.