Elaborazione parallela

7 новых возможностей Intel® VTune Amplifier XE

VTune Amplifier XE давно известен пользователям своими возможностями глубокого анализа производительности ПО, как на уровне приложения, так и на микроархитектурном уровне.

Инструмент не стоит на месте и активно развивается, улучшаясь и обрастая новым функционалом. В этом посте приведён краткий обзор новых «фич», появившихся как в вышедшем в сентябре VTune Amplifier XE 2013, так и совсем недавно, в последующих обновлениях:

OpenMP Tasks + Offload possible?

Hi,

when I offload a parallel region, my OpenMP tasks are not executed, is this intended?

The example below gives no output as it is, it seems the tasks are created but not executed. If I omit the offload or the task pragma, I get the expected result. Any idea what I am doing wrong?

Regards,

Dirk

Example:

int main(){

#pragma offload target(mic)

#pragma omp parallel

{

#pragma omp task  

printf("Hello World!\n");

}  

return 0;

}

 

Any details about the physical address and cache line mappings?

Some of the Xeon Phi documentation mentions that physical addresses are distributed among the memory controllers using a hashing function, and that cache line tags are distributed among the per-core portions of the distributed tag directory via a (presumably different) hashing function.

Problem with ijg80b library

Hello everybody.

I'm trying to develop an application that compress fastly images from raw format to JPEG and then sends them over the network to a particular destination server.I've tried the library ijg80b provided with IPP examples. My problem is the fact that while the function to save images to a file works fine, the use of a memory destination does not work correctly and the risulting JPEG image is not correct (some bytes are added inside the image). I'm using IPP 7.1 with an Intel ATOM N270 processor.

Is there a way to have an update of the library? Is it manteined?

Некоторые выводы из закона Густавсона-Барсиса

Статья является косметически измененным переводом этой записи

По счастливой случайности мне представилась возможность лично встретить Джона Густавсона, во время его посещени Остина в 2009 году. Заметка ниже -- некоторые мои мысли, возникшие после общения с ним.

draft

Accelerate Your Code 2012 - алгоритм.

Конкурс подходит к концу, и сейчас уже можно безбоязненно рассказывать о своих идеях решения, чем мы (команда из Санкт-Петербургского Академического университета - Евгений Краско и Сергей Лазарев) и займемся. Простите нас за рисунки в пэйнте; надеюсь, на ясность изложения их наличие не повлияет. 

Optimize Financial Applications using Intel® Math Kernel Library

Intel® Math Kernel Library (Intel® MKL) contains a wealth of highly optimized math functions that are fundamental to a wide variety of Financial Applications. Intel MKL uses Industry Standard interfaces and can be easily integrated into your current application framework. The Webinar provides an overview of Intel MKL to accelerate financial applications. Topics include:

  • Sviluppatori
  • Apple OS X*
  • Linux*
  • Microsoft Windows* (XP, Vista, 7)
  • Microsoft Windows* 8
  • C/C++
  • Fortran
  • Principiante
  • Intermedio
  • Compilatore C++ Intel®
  • Intel® C++ Composer XE
  • Compilatore Fortran Intel®
  • Intel® Fortran Composer XE
  • Intel® Math Kernel Library
  • Learning Lab
  • FSI
  • Financial Services
  • Intel MKL Training
  • performance optimization
  • Strumenti di sviluppo
  • Settore dei servizi finanziari
  • Ottimizzazione
  • Elaborazione parallela
  • Iscriversi a Elaborazione parallela