Почему фрейм данных pandas, содержащий несколько столбцов, говорит, что 10 имеет размерность 2?

#pandas #numpy

#pandas #numpy

Вопрос:

Ни одно из измерений не равно количеству объектов. Разве это не так? Каждая строка может быть представлена 10 значениями разных атрибутов, что делает ее 10-мерной. Правильно ли я понимаю.

Комментарии:

1. фреймы данных pandas имеют два измерения: «строки» и «столбцы». Количество столбцов не влияет на числовые измерения.

2. То, что вы упомянули, это size DF, а не его размерность. Как сказал @ScottBoston, Pandas DFS имеет два измерения.

3. Когда мы говорим о word2vector, мы говорим, что слово преобразуется в n-мерный вектор. Например. 300 измерений. Разве мы не можем сказать, что это значения 300 атрибутов? и если мы скажем, что у нас есть 10 слов, тогда у нас может быть фрейм данных размером 10 * 300, который затем будет 2-мерным. Запутался между этими двумя мыслями.

4. Вы путаете определение размера в пространстве объектов с размером фрейма данных pandas. Они определены отдельно. В то время как размеры пространства объектов определяются количеством объектов, размеры фрейма данных равны двум (строки и столбцы). Одно и то же слово, разные определения.

5. @Ehsan Итак, вы говорите, что ни один из объектов или атрибутов не равен ни одному из измерений, только когда мы говорим о пространстве объектов? Кроме этого, все эти атрибуты являются ничем иным, как столбцами, которые могут быть представлены в формате 2d-таблицы?

Ответ №1:

Я думаю, вы путаетесь с размером фрейма данных. Количество измерений можно рассматривать как количество направлений, охватываемых вашими данными.

Например, количество строк — это измерение, в котором ваши данные расширяются «вниз». Количество столбцов — это другое измерение, в котором ваши данные расширяются «вправо».

Это делает таблицу условных данных или лист Excel «2-мерным» фреймом данных. Теперь представьте, если бы мы сложили 3 из этих «2-мерных» фреймов данных друг на друга, как блины. Это дает нам 3-мерный фрейм данных, который можно идентифицировать с помощью (X, Y, Z).

X — количество строк каждого фрейма данных Y — количество объектов каждого фрейма данных Z — количество (X, Y) фреймов данных, наложенных друг на друга

и обычно так поступают данные изображения.

Здесь есть страница, которая подчеркивает различия между размером и измерениями фрейма данных.

https://www.geeksforgeeks.org/python-pandas-df-size-df-shape-and-df-ndim/