#python #numpy #counter #counting #numpy-ndarray
#python #numpy #счетчик #подсчет #numpy-ndarray
Вопрос:
У меня есть трехмерный массив numpy, который содержит элементы с повторением.
Например, встречный поток содержит такие элементы: я показал только несколько элементов:
counterTraj.shape
(13530, 1, 1
array([[[136.]],
[[129.]],
[[130.]],
...,
[[103.]],
[[102.]],
[[101.]]])
```
Мне нужно найти частоту другого элемента: Пример: 136 количество 5 (скажем), 101 количество 12 (скажем). Элементы массива не фиксированы и меняются с входными данными. Я пытаюсь следовать:
from collections import Counter
Counter(counterTraj)
Генерируется следующая ошибка:
> TypeError Traceback (most recent
call last)
<ipython-input-408-e3584b29b0bd> in <module>()
11 counterTraj=np.vstack(counterTraj)
12 counterTraj=counterTraj.reshape(len(counterTraj),1,1)
---> 13 Counter(counterTraj)
/usr/lib/python3.6/collections/__init__.py in __init__(*args,
**kwds)
533 raise TypeError('expected at most 1 arguments,
got %d' % len(args))
534 super(Counter, self).__init__()
--> 535 self.update(*args, **kwds)
536
537 def __missing__(self, key):
/usr/lib/python3.6/collections/__init__.py in update(*args,
**kwds)
620 super(Counter, self).update(iterable) #
fast path when counter is empty
621 else:
--> 622 _count_elements(self, iterable)
623 if kwds:
624 self.update(kwds)
TypeError: unhashable type: 'numpy.ndarray'
Как найти вхождение элемента с частотой и найти элемент с наивысшей частотой?
Ответ №1:
Используйте параметр numpy.unique
with return_counts=True
, который вернет количество каждого из элементов в массиве.
# sample array
In [89]: np.random.seed(23)
In [90]: arr = np.random.randint(0, 10, 20)
In [92]: a, cnts = np.unique(arr, return_counts=True)
In [94]: high_freq, high_freq_element = cnts.max(), a[cnts.argmax()]
In [95]: high_freq, high_freq_element
Out[95]: (4, 9)
Для выбора только тех элементов, которые отображаются выше определенного порога частоты, вы можете использовать:
In [96]: threshold = 2
# select elements which occur only more than 2 times
In [97]: a[cnts > threshold]
Out[97]: array([3, 5, 6, 9])
Комментарии:
1. Это сработало . Мне нужно брать элементы только с числом больше 5 (скажем). Как это сделать после вашего результата?