Полный справочник оборудования
Полную документацию по графическому контроллеру Intel можно найти по адресу 01.org:
Спецификация оборудования — PRM Опубликовано: Paul Parenteau Последнее изменение: 15 июня 2020 г.
Ответ на вопрос 2: да, существуют отдельные инструкции по сборке, разработанные ниже (от Введение в сборку GEN)
Общая форма сборки графического процессора Intel
Обычно все инструкции имеют следующий вид:
[(pred)] opcode (exec-size|exec-offset) dst src0 [src1] [src2]
(pred)
— необязательный предикат. Мы собираемся пропустить это сейчас.
opcode
— это символ инструкции, такой как add или mov (у нас есть полная таблица кодов операций ниже.
exec-size
— ширина SIMD-инструкции, которая в нашей архитектуре может быть равна 1, 2, 4, 8 или 16. При компиляции SIMD32 обычно две инструкции размером выполнения 8 или 16 группируются в одну.
exec-offset
— это часть, которая сообщает ЕС, из какой части регистров ARF следует читать или записывать, например. (8|M24) обращается к битам 24-31 маски выполнения. При генерировании кода SIMD16 или SIMD32, как показано ниже:
mov (8|M0) r11.0<1>:q r5.0<8;8,1>:d // id:1
mov (8|M8) r13.0<1>:q r6.0<8;8,1>:d // id:1
mov (8|M16) r15.0<1>:q r9.0<8;8,1>:d // id:1
mov (8|M24) r17.0<1>:q r10.0<8;8,1>:d // id:1
(мов инструкция по сборке SIMD32)
компилятор должен выдать четыре операции шириной 8 из-за ограничения количества байтов, доступных для каждого операнда в GRF.
dst
- регистр назначения
src0
— исходный регистр
src1
— необязательный исходный регистр. Обратите внимание, что это также может быть непосредственное значение, например 0x3F000000:f (0,5) или 0x2A:ud (42).
src2
— необязательный исходный регистр.
Общий регистровый файл (GRF) Регистры
Каждый поток имеет выделенное пространство из 128 регистров, от r0 до r127. Каждый регистр имеет размер 256 бит или 32 байта.
Файл регистров архитектуры (ARF) Регистры
В ассемблерном коде выше мы видели только один из этих специальных регистров, нулевой регистр, который обычно используется в качестве места назначения для инструкций отправки, используемых для записи и указания конца потока. Вот полная таблица регистров других архитектур:
Доступные GEN (общие) инструкции по сборке
person
Soleil
schedule
19.01.2021