python #missing-data
#python #отсутствует-данные
Вопрос:
Я использую следующий код (исходный код ** https://www.kaggle.com/amiiiney/price-prediction-regularization-stacking **)
def msv1(data, thresh=20, color='black', edgecolor='black', width=15,
height=3):
plt.figure(figsize=(width,height))
percentage=(data.isnull()[:10].mean())*100
percentage.sort_values(ascending=False).plot.bar(color=color, edgecolor=edgecolor)
plt.axhline(y=thresh, color='r', linestyle='-')
plt.title('Missing values percentage per column', fontsize=20, weight='bold' )
plt.text(len(data.isnull().sum()/len(data))/1.7, thresh 12.5, f'Columns with more than
{thresh}% missing values', fontsize=12, color='crimson',
ha='left' ,va='top')
plt.text(len(data.isnull().sum()/len(data))/1.7, thresh - 5, f'Columns
with less than {thresh}
missing values', fontsize=12, color='green',
ha='left' ,va='top')
plt.xlabel('Columns', size=15, weight='bold')
plt.ylabel('Missing values percentage')
return plt.show()
msv1(df, 30, color=sns.color_palette('Reds',15))
поскольку мой набор данных содержит 171 столбец, как я могу ограничить вывод на диаграмму столбцами, которые содержат только нулевые данные? прямо сейчас он отображает 171 столбец, в том числе без отсутствующих данных.
Как изменить код?