Свързани въпроси 'cpu-cache'

Какво ниво на кеша извлича PREFETCHT2?
Документацията за PREFETCHT2 , която е предварително извличане с подсказка T2, гласи (акцентът е мой): T0 (временни данни) — предварително извличане на данни във всички нива на йерархията на кеша. T1 (временни данни по отношение на...
192 изгледи

Задаване на асоциативен кеш: Изчисляване на размера на етикета?
Затруднявам се да реша този въпрос, огледах се, но всички подобни въпроси са по-напреднали от моя, като се използват регистрационни файлове, това е по-напреднало, отколкото сме правили в нашия клас. Ето го въпроса: Да предположим, че имате...
34198 изгледи
schedule 03.12.2023

Оптимизиране на преобразуването на цветовете Cortex-A8 с помощта на NEON
В момента правя процедура за преобразуване на цветовете, за да конвертирам от YUY2 в NV12. Имам функция, която е доста бърза, но не толкова бърза, колкото бих очаквал, главно поради пропуски в кеша. void convert_hd(uint8_t *orig, uint8_t *result)...
426 изгледи
schedule 21.12.2023

Най-бързото използване на набор от данни от малко над 64 байта?
Структура: Имам 8 64-битови цели числа (512 бита = 64 байта, предполагаемата ширина на реда на кеша), които бих искал да сравня с друго, единично 64-битово цяло число, на свой ред, без пропуски в кеша . Наборът от данни, за съжаление, е абсолютно...
70 изгледи
schedule 07.11.2023

Как се синхронизира кешът на инструкциите x86?
Харесвам примери, така че написах малко самопроменящ се код в c... #include <stdio.h> #include <sys/mman.h> // linux int main(void) { unsigned char *c = mmap(NULL, 7, PROT_READ|PROT_WRITE|PROT_EXEC, MAP_PRIVATE|...
6150 изгледи

Как профилирате .net приложение, като вземете предвид ефекта от кеша на процесора?
Всички .net профайлери, които познавам, не вземат под внимание ефекта от кеша на процесора. Като се има предвид, че четенето на поле от кеша на процесора може да бъде 100 по-бързо от четенето му от основната памет, това може да бъде голям фактор....
136 изгледи
schedule 01.05.2024

mmap проблеми с четенето на споделен буфер
Имам модул на ядрото, който разпределя голям буфер от памет, този буфер след това е mmap-ed в потребителското пространство. Модулът получава някои данни от хардуера и след това поставя новите данни в буфера с флаг пред него . (паметта се...
611 изгледи
schedule 29.04.2024

Измервания на процесора (кеш пропуски/удари), които нямат смисъл
Използвам Intel PCM за фини измервания на процесора. В моя код се опитвам да измеря ефективността на кеша. По принцип първо поставям малък масив в L1 кеша (като го обхождам много пъти), след това задействам таймера, преминавам през масива още...
1312 изгледи