Пиша алгоритъм в OpenCL, в който ще имам нужда всяка работна единица да запомни справедлива част от данните, да кажем нещо между long[70]
и long[200]
или така на ядро.
Последните устройства на AMD имат 32 KiB __local
памет, което е (за дадено количество данни на ядро) достатъчно за съхраняване на информация за 20-58 работни единици. Въпреки това, от това, което разбирам от архитектурата (и особено от този чертеж), всяко шейдърно ядро също има специално количество частна памет. Но не успявам да намеря размера му.
Може ли някой да ми каже как да разбера колко частна памет има всяко ядро?
Особено съм любопитен за HD7970, тъй като смятам да купя някои от тях скоро.
Редактиране: Проблемът е решен, отговорът е тук в приложение D.