#python
Вопрос:
У меня есть большой набор данных (40000 строк) со столбцом (имена исполнителей) на разных языках. как закодировать имя столбца?
# Create a OneHotEncoder instance
enc = OneHotEncoder(sparse=False)
# Fit and transform the OneHotEncoder using the categorical variable list
artists_encode_df = pd.DataFrame(enc.fit_transform(artists_df[artists_cat]))
# Add the encoded variable names to the dataframe
artists_encode_df.columns = enc.get_feature_names(artists_cat)
artists_encode_df.head()
Я использовал приведенный выше фрагмент кода, но после слияния с исходным кадром данных он дал мне ошибку памяти.