Вопросы по теме 'reduction'

Общие правила упрощения операторов SQL
Я ищу некоторые «правила вывода» (аналогичные установленным правилам работы или логическим правилам), которые я могу использовать для уменьшения сложности или размера SQL-запроса. Есть ли что-то подобное? Какие-нибудь бумаги, какие-нибудь...
17671 просмотров
schedule 08.12.2023

Как уменьшить размер цитирования (например, [1]), сгенерированного тегом \cite{1} в латексе
Википедия аккуратно ставит верхние индексы n, уменьшая размер всех ссылок. Есть ли способ получить его в латексе.
227 просмотров
schedule 16.05.2024

Получить фиктивные (T/F) переменные из списка, встроенного в фрейм данных
У меня есть data.frame, в котором ячейки содержат список терминов. Я хочу создать новую переменную для каждого термина, найденного в этом списке, указывающую, присутствует ли термин в данной ячейке или нет. У меня есть несколько разных таких...
166 просмотров
schedule 09.10.2022

CUDA Reduction — атомарное и однопоточное суммирование
Недавно я протестировал алгоритм сокращения с помощью CUDA (тот, который вы можете найти, например, по адресу http://www.cuvilib.com/Reduction.pdf , стр. 16). Но в конце я столкнулся с проблемой, не используя атомарность. Итак, в основном я...
1593 просмотров
schedule 24.10.2022

Попытка понять фрагмент окончательного сокращения cuda sdk по сложности и срокам выполнения
Пытаюсь разобраться в параллельной редукции в Cuda (очень интересно). В моем последнем вопросе о параллельной редукции Роберт Кровелла дал очень интуитивное и подробное объяснение, которое мне очень помогло. Очень интуитивно понятно. Теперь,...
244 просмотров
schedule 03.03.2024

Как заказать общий массив 2D/3D для параллельного сокращения по 1 измерению в CUDA/OpenCL?
Общая цель Мне нужно сделать несколько сокращений двудольного графа, представленного двумя плотными массивами для вершин и плотным массивом, указывающим, присутствует ли ребро между двумя. Скажем, два массива — это a0[] и a1[], и все ребра идут...
265 просмотров
schedule 07.11.2022

OpenCL - Метод для выполнения сокращения
Из следующего сообщения я пытаюсь реализовать уменьшение суммы массива с помощью этого кода ядра: #pragma OPENCL EXTENSION cl_khr_int64_base_atomics : enable __kernel void sumGPU ( __global const long *input, __global long...
202 просмотров
schedule 09.03.2024

Декораторы Numba CUDA `vectorize` и` reduce` медленнее, чем ожидалось
Я тестировал некоторые базовые функции CUDA, используя пакет Numba . Моя основная цель - реализовать алгоритм Ричардсона-Люси на графическом процессоре. . Алгоритм можно ускорить, и один из основных шагов при этом можно резюмировать в следующей...
1275 просмотров
schedule 19.02.2024