#concurrency #cuda #kepler #cuda-streams
#параллелизм #cuda #кеплер #cuda-потоки
Вопрос:
Возможно ли с помощью потоков иметь несколько уникальных ядер на одном потоковом мультипроцессоре в графических процессорах Kepler 3.5? Т.е. <<<1,1024>>>
Одновременно запускать ядра размером 30 на графическом процессоре Kepler с 15 SMS?
Комментарии:
1. Какой графический процессор Kepler? Вычислительные возможности 3.0 и 3.5 имеют разные ограничения на ресурсы ядра и параллелизм.
2. Ваш вопрос мне не очень понятен. Часть «т.Е.», похоже, не имеет отношения к заданному ранее вопросу. Неясно, интересуетесь ли вы стандартным параллелизмом ядра или вам интересно запускать разные ядра на определенном многопроцессоре. В последнем случае примите во внимание, что планирование блоков скрыто для программиста CUDA.
3. @Talonmies Извините, вычислите 3.5. K40 -новейший графический процессор.
4. @JackOLantern разные ядра на одном и том же многопроцессоре одновременно.
5. Но на конкретном мультипроцессоре по вашему выбору или на любом из доступных?
Ответ №1:
На устройстве с вычислительными возможностями 3.5 это может быть возможно.
Эти устройства поддерживают до 32 одновременных ядер на GPU и 2048 потоков одноранговых многопроцессорных. При 64 КБ регистров на мультипроцессор два блока из 1024 потоков могли выполняться одновременно, если их объем регистра был меньше 16 на поток и меньше 24 КБ общей памяти на блок.
Вы можете найти все это в описании оборудования, приведенном в приложениях к руководству по программированию на CUDA.
Комментарии:
1. Слайд 19 здесь также может представлять интерес.