Публикации по теме 'gemm'
Расширенная оптимизация Nvidia Tensor Core-CUDA HGEMM
Как максимально оптимизировать CUDA HGEMM с помощью Tensor Core?
1. История
Умножение матриц GEMM (General Matrix Multiplication) — один из наиболее часто используемых и трудоемких алгоритмов в глубоком обучении, особенно в области CNN, RNN, преобразователей и других областях. В этих областях необходимо быстро вычислять и обрабатывать большое количество операций умножения матриц. Следовательно, эффективная реализация матричного умножения имеет решающее значение для производительности и..