#python #encoding #scikit-learn #label-encoding
#python #кодирование #scikit-учиться #метка-кодирование
Вопрос:
Я делаю кодирование меток с LabelEncoder()
. Я хочу знать, какое категориальное имя соответствует закодированным значениям. Например:
import pandas as pd
from sklearn.preprocessing import LabelEncoder
from sklearn import preprocessing
le = LabelEncoder()
data = [['tom', 10], ['nick', 15], ['juli', 14]]
df = pd.DataFrame(data, columns = ['Name', 'Age'])
df['Name']= le.fit_transform(df['Name'])
df
Когда я использую это, код работает успешно. Но как я узнаю, что закодировано tom=2
или nick=1
? Это действительно большая проблема при работе с большими данными. Как мне сохранить эти закодированные категориальные сведения?
Заранее благодарю вас за ваш ответ.
Ответ №1:
Использовать LabelEncoder.inverse_transform
le.inverse_transform([1])
array(['nick'], dtype=object)