Свързани въпроси 'gpgpu'

Каква е разликата между споделена памет и L1 кеш в GPU?
Забелязах, че латентният достъп до кеша и споделената памет е еднакъв в CUDA. Като се има предвид този факт, как се различават? Как да ги използваме по различни начини?
529 изгледи
schedule 18.09.2022

Three.js Verlet Cloth Simulation на GPU: Не мога да следвам логиката си за намиране на грешка
Имам проблем с разбирането на логиката, която се опитвам да внедря с Three.js и GPUComputationRenderer от yomboprime. ( https://github.com/yomboprime/GPGPU-threejs-demos/blob/gh-pages/js/GPUComputationRenderer.js ) Искам да направя проста...
610 изгледи
schedule 21.09.2022

Как да започна с GPU voxelizer?
Четох различни статии за това как да напиша GPU voxelizer. Доколкото разбирам, процесът протича така: Проверете триъгълниците поотделно и изберете оста, която показва триъгълника по най-голям начин. Наречете това доминираща ос. Изобразете...
468 изгледи
schedule 22.09.2022

Може ли графичният процесор да използва суап пространство, когато RAM паметта му е пълна?
Правя някои gpu изчисления с помощта на OpenCL, където трябва да създам буфер с размер около 5 GB. Моят лаптоп има интегриран графичен процесор с 1,5 GB RAM. Опитах се да стартирам кода и даде грешен резултат. Така че предполагам, че това е защото...
3600 изгледи
schedule 06.10.2022

Опции за запис на OpenCL в буфера
Възможен дубликат: Два начина за създаване на буферен обект в opencl: clCreateBuffer срещу clCreateBuffer + clEnqueueWriteBuffer Каква е разликата между копирането на данни в устройството веднага след създаването на буфер и по-късно?...
1084 изгледи
schedule 25.10.2023

Брой активни деформации в GPU (Fermi)
Имам бърз въпрос относно активните деформации в GPU (предпочитам да го знам във Fermi). За конкретно ядро, броят на активните деформации във всеки цикъл в SM еднакъв ли е за цялото време на изпълнение на ядрото? Докато експериментирах, има известна...
701 изгледи
schedule 18.11.2022

OpenCL - загуба на изчислителна мощност на хоста
Нов съм в OpenCL, моля, кажете ми, че хост процесорът може да се използва само за разпределяне на памет към устройството или можем да го използваме като openCL устройство. (Тъй като след като разпределението е направено, хост процесорът ще бъде...
376 изгледи
schedule 01.12.2022

физическа памет на AMD устройства: локална срещу частна
Пиша алгоритъм в OpenCL, в който ще имам нужда всяка работна единица да запомни справедлива част от данните, да кажем нещо между long[70] и long[200] или така на ядро. Последните устройства на AMD имат 32 KiB __local памет, което е (за дадено...
3226 изгледи
schedule 27.10.2022

GPU 2D споделена динамична памет
Наясно съм с динамичното разпределение, когато се използват 1D масиви, но как може да се направи, когато се използват 2D масиви? myKernel<<<blocks, threads,sizeofSharedMemoryinBytes>>>(); .... __global__ void...
4033 изгледи
schedule 27.10.2023

OpenCL ядрото се изпълнява по-бавно от единична нишка
Всичко, написах много просто OpenCL ядро, което трансформира RGB изображение в сива скала, използвайки просто осредняване. Малко предистория: Изображението се съхранява в картографирана памет като 24-битов, неподплатен блок памет Изходният...
1845 изгледи
schedule 21.10.2022

Как да избегнем конструкцията по подразбиране на елементи в thrust::device_vector?
Изглежда, когато създавате нов вектор на тласък, всички елементи са 0 по подразбиране - просто искам да потвърдя, че това винаги ще бъде така. Ако е така, има ли също начин за заобикаляне на конструктора , отговорен за това поведение, за...
793 изгледи
schedule 06.11.2023

OpenCL void pointer аритметика - странно поведение
Написах OpenCL ядро, което използва оперативната съвместимост opencl-opengl за четене на върхове и индекси, но вероятно това дори не е важно, защото просто правя просто добавяне на указател, за да получа конкретен връх по индекс. uint pos = (index...
1047 изгледи
schedule 10.11.2023

В GLSL фрагментен шейдър, как да получите достъп до texel на конкретно ниво на mipmap?
Използвам OpenGL, за да направя някои GPGPU изчисления чрез комбинацията от един вертексен шейдър и един фрагментен шейдър. Трябва да направя изчисления върху изображение в различен мащаб. Бих искал да използвам mipmaps, тъй като тяхното генериране...
5144 изгледи
schedule 17.12.2023

Спестете време, необходимо за cudaHostAlloc
Опитвам се да разбера дали има смисъл да копирам данни в фиксирана памет, преди да ги прехвърля към устройството, тъй като нямам влияние върху разпределението на моите входни данни (това е библиотека). std::vector<int> idata(WORK_SIZE); int...
2486 изгледи
schedule 22.12.2023

Възможно ли е да използвате gpu карта за gpgpu, докато играете игра?
Започнах да уча хетерогенно паралелно програмиране с помощта на CUDA (ще се използва десктоп, в случай че има значение) и имам въпрос, на който все още не мога да намеря отговор. Може ли gpu картата да се използва за gpgpu, докато играете 3D игра?...
405 изгледи
schedule 20.10.2022

Разходи за използване на множество цели за изобразяване
Използвам glsl като рамка за GPGPU за обработка на изображения в реално време. В момента се опитвам да „избръсна“ още няколко милисекунди, за да направя приложението си в реално време. Ето основната настройка: Взимам входно изображение,...
2233 изгледи
schedule 31.01.2024

GPU Context Switch
Имам програма, която изобразява първо текстура, след това предава текстурата на изчислителния шейдър за обработка, след което изобразява изходния резултат на екрана чрез текстуриран четворен екран на цял екран. Прочетох в ръководството за...
1525 изгледи
schedule 08.02.2024

Добър алгоритъм за компресия без загуби за малко количество данни?
Търся добър алгоритъм за компресиране без загуби, който може много бързо да компресира/декомпресира малки количества данни, като например 256 плаващи числа, които са между 0 и 1. Знам RLE, но може би има нещо по-добро. Предисторията е, че работя...
372 изгледи
schedule 11.02.2024

GPU изчисления на Mac OSX Marvericks с Intel Iris Pro 1024 MB
Имам Mac OS X Marvericks с Intel Iris Pro 1024 MB и върша малко графика/симулация в Processing. Сблъсках се с проблеми с производителността с вградената функция за обработка на шума на Perlin. Планирам да използвам GPU за изчисляване на шума на...
1335 изгледи
schedule 01.03.2024

Изпълнение на OpenCL на хардуер от смесени доставчици
Играх си с внедряването на ATI OpenCL в техния Stream 2.0 beta. OpenCL в текущата бета версия засега използва само CPU, следващата версия трябва да поддържа GPU ядра. Изтеглих Stream, защото имам ATI GPU в работната си машина. Пиша софтуер, който...
5268 изгледи
schedule 05.03.2024