Многопоточность и анализ задач в Intel® VTune™ Amplifier XE 2013

Один из методов улучшения эффективности распараллеливания алгоритмов определенного класса – конвейеризация фаз исполнения, как последовательных, так и параллельных. Библиотека Intel TBB может помочь сократить усилия и время, необходимые на реализацию конвееризированных алгоритмов, беря на себя заботу о управлении задачами и распределении нагрузки между потоками в системе. Однако, формулирование и  формирование задач, составляющих фазы алгоритма, может быть нетривиальной проблемой, в зависимости от сложности алгоритма, что в реальных приложениях чаще всего и бывает. Контролировать выполнение задач может оказаться еще сложнее, если сам алгоритм не содержит средства для контроля. Инструментарий анализа вычислительных задач в Intel® VTuneAmplifier помогает разработчикам представлять структуру исполнения в многопоточной среде в удобном графическом виде, увеличивая эффективность анализа и значительно сокращая время разработки приложений. В данной статье мы рассмотрим простой пример конвейеризированной задачи, и шаг за шагом распараллелим ее, используя конвейерный класс TBB, проанализируем с помощью VTune Amplifier и улучшим производительность реализации на основе результатов анализа. 
Дальше читаем на Хабре

Para obter informações mais completas sobre otimizações do compilador, consulte nosso aviso de otimização.