Параллельное программирование

Создать новую статью



Название Тег(и) Дата изменения
Использование неблокирующих методов синхронизации
Неблокирующие вызовы позволяют потокам незамедлительно возвращаться к работе после приема/передачи сообщения, что позволяет значительно сократить время простоя вычислительной мощности.
Тип: Технические статьи
03.04.2012
Учебный курс "Параллельные численные методы"
В курсе рассматриваются подходы к распараллеливанию некоторых известных численных алгоритмов с иллюстрацией применения как на модельных, так и на прикладных задачах. При выполнении работ активно используются инструменты пакета Intel Parallel Studio XE.
Тип: Технические статьи
24.02.2012
Исправляем дисбаланс нагрузки с помощью Intel® Parallel Amplifier
Одним из критических факторов, отрицательно влияющих на производительность многопоточных приложений, является дисбаланс нагрузки потоков. Его корректировка – важнейший элемент отладки.
Тип: Технические статьи
concurrency scheduling parallel amplifier threading scalability hotspot utilization vcsource_type_techarticle PPGuide vcsource_domain_embedded vcsource_type_casestudy 10.01.2012
Написание первой параллельной программы с Intel Cilk+
Участвуя в конкурсе Acceler8, я столкнулся с проблемой распараллеливания. Начав изучение данного вопроса, я нашёл набор дополнительных инструментов для среды разработки Microsoft* Visual Studio и расширение для языка C++, Intel Cilk Plus.
Автор: yunihiko
Тип: Технические статьи
Intel Parallel Studio Cilk Plus Intel VTune Amplifier XE Acceler8 22.12.2011
Ищем подматрицу с максимальной суммой элементов? - Найдем и распараллелим!
В статье приводится алгоритм решения задачи поиска подматрицы с максимальной суммой элементов. Решение предоставлено в рамках конкурса Acceler8. Основная идея конкурса – получить минимальное время работы программы и хорошую масштабируемость.
Автор: udjin123
Тип: Технические статьи
параллельное программирование конкурс Acceler8 алгоритм кадане 09.12.2011
Шаблон проектирования Producer-Consumer
Шаблон проектирования Producer-Consumer - один из самых распостраненных шаблонов для параллельных и распределенных вычислений. Простая схема обеспечивает высокую надежность и эффективное управление ресурсами.
Автор: Nikolay Kuznetsov
Тип: Технические статьи
08.12.2011
Поиск подматрицы с наибольшей суммой: прикладные задачи
В посте приводятся прикладные задачи, сводящиеся к нахождению подматрицы с наибольшей суммой элементов. Задача оптимизации приложения поиска "максимальной" подматрицы решалась в рамках конкурса Acceler8.
Автор: isurmin
Тип: Технические статьи
конкурс Acceler8 матрицы 30.11.2011
Моделирование большого количества игровых юнитов с системой избежания столкновений
Современная игровая индустрия не может позволить задействовать большое количество юнитов в играх-стратегиях из-за повышения издержек на их обработку. На примере Colony мы покажем, как минимизировать издержки с помощью многопоточной обработки на CPU.
Тип: Технические статьи
vcsource_type_techarticle vcsource_domain_graphics vcsource_techsample_colony vcsource_techsample_gamecoderesourcedisk vcsource_index vcsource_product_colony 23.11.2011
Обзор алгоритмов поиска максимальной подматрицы
В этой статье рассмотрены наиболее известные и эффективные алгоритмы для решения задач поиска максимальной подматрицы.
Тип: Технические статьи
конкурс Acceler8 обзор алгоритмов время работы 15.11.2011
Выбор примитивов синхронизации для минимизации издержек
Choosing Appropriate Synchronization Primitives to Minimize Overhead [Eng., PDF 237KB] Аннотация Когда потоки ожидают своей очереди в точке синхронизации, они не выполняют никакой полезной работы. К ...
Тип: Технические статьи
atomic operations synchronization threading Win32 threads system overhead mutual exclusion PPGuide 04.11.2011
Use Synchronization Routines Provided by the Threading API Rather than Hand-Coded Synchronization
Очень часто при разработке приложения программист предпочитает самостоятельно дописывать некоторые средства синхронизации потоков. В данной статье описываются плюсы и минусы такого решения.
Тип: Технические статьи
Hyper-Threading OpenMP synchronization threading Pthreads Win32 threads spin-wait PPGuide 04.11.2011
Устранение конфликта блокировок: размер критических секций
В данной статье рассматривается проблема определения размера критических секций и их влияние на общую производительность приложения.
Тип: Технические статьи
04.11.2011
Использование параллелизма в упорядоченных потоках данных
В данной статье рассказывается о некоторых сложностях параллельной обработки упорядоченных наборов данных.
Тип: Технические статьи
data parallelism I/O threading order dependence PPGuide 04.11.2011
Баланс нагрузки и производительность в параллельном режиме
Баланс нагрузки - критичный фактор в повышении производительности приложения. Основная цель данной статьи - показать как можно минимизировать время простоя потоков.
Тип: Технические статьи
04.11.2011
Модификация циклов для повышения производительности параллельной обработки данных
Обычно в приложениях с параллельной обработкой данных основной объем вычислений приходится на циклы, поэтому оптимизация циклов оказывает непосредственное влияние на общую производительность приложения.
Тип: Технические статьи
04.11.2011
Оптимизация структур данных и моделей доступа к памяти для улучшения локальности данных
Мы постараемся минимизировать число «непопаданий» в кэш, посредством разработки алгоритмов и структур данных, использующих локальность данных.
Тип: Технические статьи
02.11.2011
Оптимизация приложений под архитектуру NUMA
Optimizing Applications for NUMA [Eng., PDF 225KB] Аннотация NUMA (Non-Uniform Memory Access) – это архитектура совместного доступа к памяти в многопроцессорных системах, в которой время доступа к уч ...
Тип: Технические статьи
NUMA PPGuide 02.11.2011
Ответы на часто задаваемые вопросы по конкурсу Acceler8
Что нужно делать? Всё написано на официальной странице конкурса. Как получить доступ к многопроцессорной системе Intel® Manycore Testing Lab (MTL)? Для получения доступа необходимо зарегистрироватьс ...
Автор: mbait
Тип: Технические статьи
FAQ конкурс MTL Acceler8 PBS 31.10.2011
Свёртки в Intel® Cilk Plus
Допустим нам зачем-то нужно найти сумму элементов массива. Мы можем разбить массив на две части, просуммировать каждую часть отдельно и сложить результаты. При этом суммировать эти части можно параллел ...
Автор: Matvej Kotov
Тип: Технические статьи
12.09.2011
Цикл лабораторных работ по программированию на многоядерных вычислительных системах
Цикл лабораторных работ по программированию на многоядерных вычислительных системах. Материал каждой лабораторной работы включает описание, постановку задачи, шаблоны и примеры, а так же краткие комментарии к лабораторной работе для преподавателей.
Автор: Sergei Nemnyugin
Тип: Технические статьи
10.08.2011
Как уменьшить вероятность ошибки на этапе написания кода. Заметка N2.
Это вторая статья о том, как можно избежать ряда ошибок еще на этапе написания кода.
Автор: Andrey Karpov
Тип: Технические статьи
статический анализ 22.04.2011
Особенности оптимизации вычислений в прикладных программах на языке С на примере оценивания опционов европейского типа
С.И. Бастраков, Р.В. Донченко, И.Б. Мееров, А.Н. Половинкин Нижегородский государственный университет им. Н.И. Лобачевского Статья опубликована в журнале "Научно-технический вестник Санкт-Петербургск ...
Автор: Iosif Meyerov
Тип: Технические статьи
11.02.2011
Intel® Parallel Composer – расширение для отладки параллельных программ
В статье будет сделан обзор нового инструмента для создания параллельных приложений Intel® Parallel Composer в части расширения отладчика параллельных программ, являющегося одной из компонент пакета продуктов Intel® Parallel Studio.
Тип: Технические статьи
Intel Parallel Composer 30.01.2011
Intel® Parallel Amplifier – профилировщик многопоточных приложений
Обзор нового инструмента профилировки параллельных программ Intel® Parallel Amplifier, являющего частью пакета продуктов для разработки многопоточных приложений Intel® Parallel Studio.
Тип: Технические статьи
Intel Parallel Amplifier 30.01.2011
Параллельный алгоритм моделирования цифровых устройств с неисправностями для многоядерных систем с общей памятью
Предлагается новый алгоритм параллельного моделирования цифровых схем с неисправностями для многоядерных рабочих станций
Автор: Dr. Dmitry Ivanov
Тип: Технические статьи
parallel fault simulation digital circuits fault grouping and partitioning 05.12.2010