Публикации по теме 'parallel-computing'


Расширенная оптимизация Nvidia Tensor Core-CUDA HGEMM
Как максимально оптимизировать CUDA HGEMM с помощью Tensor Core? 1. История Умножение матриц GEMM (General Matrix Multiplication) — один из наиболее часто используемых и трудоемких алгоритмов в глубоком обучении, особенно в области CNN, RNN, преобразователей и других областях. В этих областях необходимо быстро вычислять и обрабатывать большое количество операций умножения матриц. Следовательно, эффективная реализация матричного умножения имеет решающее значение для производительности и..

Решение задачи коммивояжера с помощью параллельных вычислений
ВЫСОКОПРОИЗВОДИТЕЛЬНЫЕ ТЕХНИЧЕСКИЕ ВЫЧИСЛЕНИЯ С MPI В этом техническом отчете основное внимание уделяется внедрению высокопроизводительных технических вычислений в кластере высокопроизводительных вычислений с использованием MPI для распараллеливания решения задачи коммивояжера. Литературный обзор Методология Полученные результаты Заключение В исследовании представлена ​​эффективность MPI при решении сложных задач оптимизации и подчеркивается потенциал кластера..