Вопросы по теме 'opencl'

Запуск OpenCL на оборудовании разных поставщиков
Я играл с реализацией ATI OpenCL в их бета-версии Stream 2.0. OpenCL в текущей бета-версии пока использует только ЦП, предполагается, что следующая версия будет поддерживать ядра графического процессора. Я скачал Stream, потому что на моей рабочей...
5268 просмотров
schedule 05.03.2024

Кодирование видео в реальном времени в DirectShow
Я разработал приложение для Windows, которое захватывает видео с внешнего устройства с помощью DirectShow. Разрешение изображения составляет 640x480, а видео, сохраненные без сжатия, имеют очень большие размеры (около 27 МБ в секунду). Моя цель —...
15299 просмотров
schedule 15.01.2024

проблемы с чтением из __глобальной памяти после atom_inc в OpenCL
OpenCL не имеет глобального барьера, который остановит все потоки, поэтому я пытаюсь создать обходной путь с помощью следующего кода: void barrier(__global uint* scratch) { uint nThreads = get_global_size(0); atom_inc(scratch); /* this loop...
480 просмотров
schedule 06.11.2022

Поддерживает ли opencl логические переменные?
Поддерживает ли openCL логические переменные? В настоящее время я использую JOCL (java) для написания моего кода вызова openCL, и я ничего не вижу о логических значениях.
5874 просмотров
schedule 29.11.2023

OpenCL внутри Visual Studio — можем ли мы скомпилировать один исполняемый файл, который будет использовать все возможные процессоры? OpenCL может получить все платформы, поддерживающие OpenCL?
Итак, я имею в виду компиляцию кода, например: //******************************************************************* // Demo OpenCL application to compute a simple vector addition // computation between 2 arrays on the GPU //...
3414 просмотров
schedule 01.01.2024

При написании кода openCL, как он работает на одноядерной машине без графического процессора?
Привет всем! В настоящее время я переношу трассировщик лучей с FORTRAN 77 на C для исследовательского проекта. После переноса основных компонентов возникает вопрос, как мы приступим к распараллеливанию. В лаборатории у меня есть доступ к паре...
1145 просмотров
schedule 08.05.2024

Что мы можем сделать с OpenCL?
Я читал об OpenCL и нашел эту строку: OpenCL предоставляет любому приложению доступ к графическому процессору для неграфических вычислений. Допустим, мне нужно выполнить операцию с интенсивным использованием ЦП или алгоритм на Java или...
2399 просмотров
schedule 23.09.2022

OpenCL записывает в буфер выбор
Возможный дубликат: Два способа создания объекта буфера в opencl: clCreateBuffer и clCreateBuffer + clEnqueueWriteBuffer В чем разница между копированием данных на устройство сразу после создания буфера и позже? т.е. cl_mem memObj...
1084 просмотров
schedule 25.10.2023

Ядро автокорреляции OpenCL
Я написал простую программу, которая выполняет автокорреляцию следующим образом... Я использовал директивы ускорителя pgi для переноса вычислений на GPU. //autocorrelation void autocorr(float *restrict A, float *restrict C, int N) { int i,...
1646 просмотров
schedule 06.11.2022

Количество активных деформаций в графическом процессоре (Fermi)
У меня есть небольшой вопрос об активных деформациях в графическом процессоре (я бы предпочел узнать это в Fermi). Для конкретного ядра количество активных варпов в любом цикле SM одинаково для всего времени выполнения ядра? Как я экспериментировал,...
701 просмотров
schedule 18.11.2022

Обеспечивает ли OS X Lion поддержку образов OpenCL для Radeon 5770?
В OS X Snow Leopard (10.6.8) поддержка образов OpenCL недоступна на моем Mac Pro с видеокартой Radeon 5770. Действительно, считается, что это характерно для всех карт AMD / ATI Radeon под Snow Leopard и ранее. Конкретно:...
1739 просмотров
schedule 09.12.2022

Недостатки использования кэша текстур / Image2D для 2D-массивов?
При доступе к 2D-массивам в глобальной памяти использование кэша текстур имеет много преимуществ, таких как фильтрация и отсутствие необходимости заботиться о шаблонах доступа к памяти. Руководство по программированию CUDA называет только один...
1775 просмотров
schedule 21.01.2024

Производительность OpenCL AMD и NVIDIA
Я реализовал простое ядро, которое является своего рода сверткой. Я измерил его на NVIDIA GT 240. При записи на CUDA потребовалось 70 мс, а при записи на OpenCL — 100 мс. Ладно, подумал я, компилятор NVIDIA лучше оптимизирован под CUDA (или я что-то...
3290 просмотров
schedule 05.06.2024

Запись в глобальную память в CUDA
Я хотел бы спросить об эффекте записи в глобальную память в CUDA. Известно, что чтение глобальной памяти часто сильно влияет на производительность (объединение, кэши, конфликты банков), так как может потребовать довольно много циклов ожидания...
2373 просмотров
schedule 01.06.2024

OpenCL - пустая трата вычислительной мощности хоста
Я новичок в OpenCL, скажите, пожалуйста, что хост-процессор можно использовать только для выделения памяти устройству, или мы можем использовать его как устройство openCL. (Поскольку после того, как распределение будет выполнено, центральный...
376 просмотров
schedule 01.12.2022

физическая память на устройствах AMD: локальная или частная
Я пишу алгоритм на OpenCL, в котором мне нужно, чтобы каждая рабочая единица запоминала изрядную часть данных, скажем, что-то между long[70] и long[200] или около того для каждого ядра. Последние устройства AMD имеют 32 КиБ __local памяти,...
3226 просмотров
schedule 27.10.2022

Отладка OpenCL с помощью NVIDIA Nsight 2.1 и Visual Studio 2010
Насколько я знаю, Nvidia Nsight 2.1 дает возможность отлаживать код OpenCL. Я выполнил все требования Nsight Monitor (отключить WDDM, отключить aero, установить драйверы для разработки, подключить вторую видеокарту), но я все еще не могу отлаживать...
3456 просмотров
schedule 28.12.2023

Выполнение программы занимает почти одинаковое время пользователя как на процессоре, так и на графическом процессоре?
программа для поиска простых чисел с использованием OpenCL 1.1 дала следующие результаты: Устройство: ЦП В реальном времени: прибл. 3 сек. Время использования: прибл. 32 сек Устройство: Графический процессор Реальное время - ок....
806 просмотров
schedule 10.01.2024

OpenCL — как создать отдельный математический процесс на каждом ядре
Я новичок в OpenCL и пишу приложение факторинга RSA. В идеале приложение должно работать как с NV, так и с AMD GPU, но я не нахожу простого способа определить общее количество ядер/потоковых процессов на каждом GPU. Есть ли простой способ...
484 просмотров
schedule 14.04.2024

Уникальность устройства OpenCL
Есть ли способ заставить OpenCL выдать мне список всех уникальных физических устройств, для которых доступна реализация OpenCL? Я знаю, как перебирать список платформ / устройств, но, например, в моем случае у меня есть одна платформа,...
3202 просмотров
schedule 21.09.2022