Я заметил, что задержка доступа к кешу и общей памяти одинакова в CUDA. Учитывая этот факт, чем они отличаются? Как мы используем их по-разному?
В чем разница между общей памятью и кешем L1 в графическом процессоре?
Ответы (1)
Использование разделяемой памяти CUDA явно указывается с помощью ключевого слова __shared__
. У вас есть полный контроль над ним. Кэш L1, с другой стороны, управляется аппаратно. Производительность и стратегия кэширования кэша L1 зависят от аппаратной архитектуры.
person
Florent DUGUET
schedule
19.10.2017