Calculate GFLOPs

Calculate GFLOPs


In Intel Vtune Amplifier profiler, there is no counter for how many instructions execute on Integrated GPUs.

Instead, the profiler provide three metrics indicating the ratio of EU in state active, stall and idle.

So if my kernel (written in OpenCL) is highly divergent and the divergence is input dependent, it is difficult to measure  the GFLOPS,

any ideas?

2 posts / novo 0
Último post
Para obter mais informações sobre otimizações de compiladores, consulte Aviso sobre otimizações.

Unfortunately this is not possible in the current version of Vtune. I have forwarding this info to the Vtune team and they will consider this for future.



Deixar um comentário

Faça login para adicionar um comentário. Não é membro? Inscreva-se hoje mesmo!