#dataset #conv-neural-network #artificial-intelligence
Вопрос:
Мне нужно подготовить набор данных для динамического распознавания жестов рук. Не могли бы вы сказать мне, как лучше всего подготовить такой набор данных?
- Лучше использовать сверточную нейронную сеть для распознавания жеста руки и проверки положения руки или использовать сверточную нейронную сеть 3d и использовать видео для распознавания жестов?
Если лучший вариант-cnn 3d:
- Какой длины должны быть видеоролики?
- Сколько кадров должно быть?
- Видео должно быть одинаковой длины или может отличаться?
- Каков наилучший способ хранения набора данных? В виде видео (.mp4) или кадров (.jpg, .png)?
- До какого разрешения следует изменять размер кадров/видео?
- Знаете ли вы какие-нибудь наборы данных с открытым исходным кодом для такого обучения?