Трябва да оптимизирам своето матрично умножение, като използвам SIMD/Intel SSE. Даденият примерен код изглежда така:
*x = (float*)memalign(16, size * sizeof(float));
Въпреки това използвам C++ и [found that][1]
I вместо malloc
(преди да направя SIMD), трябва да използвам new
. Сега оптимизирам допълнително чрез SIMD/SSE, така че имам нужда от подравнена памет, така че въпросът е: имам ли нужда от memalign
/_aligned_malloc
или моят масив е деклариран като
static float m1[SIZE][SIZE];
вече подравнен? (SIZE
е int)