Я новичок в OpenCL и пишу приложение факторинга RSA. В идеале приложение должно работать как с NV, так и с AMD GPU, но я не нахожу простого способа определить общее количество ядер/потоковых процессов на каждом GPU.
Есть ли простой способ определить, сколько всего ядер/потоковых процессов имеется на любой аппаратной платформе, а затем создать поток факторинга на каждом доступном ядре? Целевой модуль RSA будет находиться в разделяемой памяти, и каждый поток факторинга будет использовать Rho-факторинговую атаку против модуля.
Кроме того, есть идеи, поддерживает ли OpenCL математические библиотеки с множественной точностью, подобные GNU MP, для хранения больших полупростых чисел?
заранее спасибо