Кодирование большого строкового столбца

#python

Вопрос:

У меня есть большой набор данных (40000 строк) со столбцом (имена исполнителей) на разных языках. как закодировать имя столбца?

 # Create a OneHotEncoder instance
enc = OneHotEncoder(sparse=False)

# Fit and transform the OneHotEncoder using the categorical variable list
artists_encode_df = pd.DataFrame(enc.fit_transform(artists_df[artists_cat]))

# Add the encoded variable names to the dataframe
artists_encode_df.columns = enc.get_feature_names(artists_cat)
artists_encode_df.head()
 

Я использовал приведенный выше фрагмент кода, но после слияния с исходным кадром данных он дал мне ошибку памяти.