В чем разница между общей памятью и кешем L1 в графическом процессоре?

Я заметил, что задержка доступа к кешу и общей памяти одинакова в CUDA. Учитывая этот факт, чем они отличаются? Как мы используем их по-разному?


person user1922    schedule 16.10.2017    source источник


Ответы (1)


Использование разделяемой памяти CUDA явно указывается с помощью ключевого слова __shared__. У вас есть полный контроль над ним. Кэш L1, с другой стороны, управляется аппаратно. Производительность и стратегия кэширования кэша L1 зависят от аппаратной архитектуры.

person Florent DUGUET    schedule 19.10.2017