Вопросы по теме 'neon'

Соглашение о вызовах с ARM на C, NEON регистрирует для сохранения
Существует аналогичное сообщение , посвященное обычным регистрам. Насчет НЕОНОВЫХ регистров. Насколько я помню, при вызове функций необходимо сохранять верхнюю или нижнюю половину регистров. Я нигде не могу найти эту информацию, может кто-нибудь...
5638 просмотров
schedule 22.05.2024

Включите NEON на Cortex A8 с fpu, установленным либо на SoftVFP, либо на none.
Я пытаюсь создать исполняемый файл для Cortex A8, используя RVDS 4.0. В моем коде используется NEON, но я хочу установить для параметра fpu значение none или SoftVFP. На веб-сайте ARM упоминается, что NEON отключается, когда для fpu установлено...
922 просмотров
schedule 13.01.2024

ARM Neon Assembler — странная проблема с конвейером
Я пытаюсь увеличить производительность кода, написанного на ARM Assembler, используя инструкции Neon. Для тестирования и расчета я использую этот калькулятор: http://pulsar.webshaker.net/ccc/sample-706454b3 Я заметил, что в строке «n.34-0 1c...
1441 просмотров
schedule 17.04.2024

Использование VFP/Neon для приложения Visual Studio 2008
Я пытаюсь указать тесты ARM Cortex-A8 под управлением Windows Compact 7. Я хочу сравнить производительность с использованием VFP, NEON и ни одного из них. Я видел параметр "-mfpu=xxx" для компиляторов GCC, но какие параметры компиляции требуются в...
558 просмотров
schedule 25.11.2023

Поддержка ARM NEON в Qemu
Эмулятор Android, поставляемый с Android SDK, поддерживает эмуляцию набора инструкций NEON (сам проверял). И он основан на QEMU. Недавно я попытался создать пользовательскую виртуальную машину с QEMU (эмулируя Cortex-A9) и установил какой-то...
3362 просмотров
schedule 03.01.2024

Оптимизация преобразования цветов Cortex-A8 с использованием NEON
В настоящее время я выполняю процедуру преобразования цвета, чтобы преобразовать YUY2 в NV12. У меня есть функция, которая работает довольно быстро, но не так быстро, как я ожидал, в основном из-за промахов кеша. void convert_hd(uint8_t *orig,...
426 просмотров
schedule 21.12.2023

Ассемблерный код для встроенной версии Neon
Я новичок в программировании Neon Assembly, я разработал Neon Intrinsic версию алгоритма обнаружения границ видео, что привело к увеличению производительности в 2 раза. Теперь я хотел бы попробовать сборку Neon — я хотел бы просмотреть код сборки,...
1736 просмотров
schedule 11.11.2023

Загрузка вектора на границу массива в ARM NEON
Я пытаюсь оптимизировать некоторые алгоритмы обработки изображений для ARM с помощью встроенных функций NEON. Для некоторых фильтров необходимо загружать элементы в окрестности точки. Например, чтобы отфильтровать изображение в пикселях p[x] , мне...
607 просмотров
schedule 06.02.2024

Измените размер 8-битного изображения на 6x6 с помощью ARM NEON
Я пытаюсь изменить размер (уменьшить) серое 8-битное изображение с коэффициентом 36 = 6x6. Я хочу использовать инструкции ARM NEON. Мой код выглядит следующим образом: //I deinterlace 3 8-pixel on the first line (named line0) and //I add them....
187 просмотров
schedule 19.03.2024

Перестановка векторов ARMv8 NEON
Рассмотрим память, расположенную так, что восемь последовательных 4-байтовых блоков читаются как [abcdefgh] . Я загружаю их в два регистра v0.4s и v1.4s , поэтому я получаю v0.4s = [abcd] и v1.4s = [efgh] , где каждый символ представляет собой...
396 просмотров
schedule 05.11.2022

Эффективно накапливать знаковые биты в ручном неоне
У меня есть цикл, который выполняет некоторые вычисления, а затем сохраняет знаковые биты в вектор: uint16x8_t rotate(const uint16_t* x); void compute(const uint16_t* src, uint16_t* dst) { uint16x8_t sign0 = vmovq_n_u16(0); uint16x8_t...
814 просмотров
schedule 10.10.2022

Ошибка компиляции кода NEON под ARM
Я пытаюсь перенести код, оптимизированный для SSE4, в оптимизированный для NEON следующий заголовок: https://github.com/jratcliff63367/sse2neon/blob/master/SSE2NEON.h Получил ошибку компиляции при компиляции на ODROID-xu4 этого кода:...
1313 просмотров
schedule 03.03.2024

Что такое спецификатор расположения (.16b, .8b) в инструкциях на языке ассемблера ARM?
Я хочу узнать, что именно указано в инструкции по сборке кронштейна. Я прошел через ARM TRM, и я думаю, что размер регистра Neon будет использоваться для вычислений например, для TBL Vd.Ta, {Vn.16B, Vn + 1.16B}, Vm.Ta Это взято из...
280 просмотров
schedule 20.03.2024