You are currently viewing Как импортировать файл excel в Python с помощью Pandas?

Как импортировать файл excel в Python с помощью Pandas?

Не всегда возможно получить набор данных в формате CSV. Таким образом, Pandas предоставляет нам функции для преобразования наборов данных в других форматах в фрейм данных. Файл excel имеет формат ‘xlsx.

Прежде чем мы начнем, нам нужно установить несколько библиотек.

pip install pandas
pip install xlrd

Для импорта файла Excel в Python с помощью Панд мы должны использовать pandas.read_excel().

Синтаксис: pandas.read_excel(io, sheet_name=0, header=0, names=None,….)

Возврат: DataFrame or dict of DataFrames.

Предположим, файл Excel выглядит следующим образом:

Теперь мы можем погрузиться в код.

Пример 1: Прочитайте файл Excel.

import pandas as pd
df = pd.read_excel("sample.xlsx")
print(df)

Выход:

Пример 2: Чтобы выбрать определенный столбец, мы можем передать параметр “index_col“.

import pandas as pd

# Here 0th column will be extracted
df = pd.read_excel("sample.xlsx",
				index_col = 0)

print(df)

Выход:

Пример 3. В случае, если вам не нравится начальный заголовок столбцов, вы можете изменить его на индексы, используя параметр “заголовок”.

import pandas as pd

df = pd.read_excel('sample.xlsx',
				header = None)
print(df)

Выход:

Пример 4. Если вы хотите изменить тип данных определенного столбца, вы можете сделать это с помощью параметра “dtype“.

import pandas as pd

df = pd.read_excel('sample.xlsx',
				dtype = {"Products": str,
							"Price":float})
print(df)

Выход:

Пример 5: Если у вас есть неизвестные значения, то вы можете обработать их с помощью параметра “na_values«. Он преобразует упомянутые неизвестные значения в “NaN”.

import pandas as pd
df = pd.read_excel('sample.xlsx',
				na_values =['item1',
							'item2'])
print(df)

Выход: