Конференция Intel® для разработчиков высокопроизводительных систем 2017

Высокоэффективные языки программирования

Stalk the Interactive Terabyte with R

Обработка интерактивных терабайтов данных с помощью R

Проект программирования для обработки больших объемов данных в среде R (pbdR) позволяет использовать оригинальные расширяемые и высокопроизводительные библиотеки для анализа данных с помощью языка R в больших системах. Сюда относится распределенная линейная алгебра с высокой плотностью вычислений, функции распределения данных для исключения недостоверной информации и высокоуровневое использование коллекций интерфейса передачи сообщений (MPI).

Джордж Остроухов (George Ostrouchov), Дрю Шмидт (Drew Schmidt) и Майкл Мэтисон (Michael Matheson), Oak Ridge National Laboratory

Презентация (PDF)


High-Performance Computing with Python* and Anaconda*

Высокопроизводительные вычисления с использованием Python* и Anaconda*

Сообщество пользователей Python уже много лет работает над тем, чтобы инженеры, использующие Python, могли в полной мере пользоваться преимуществами параллельных аппаратных средств, как на одной системной плате, так и на компьютерах в кластере и облаке. Данное выступление посвящено технологиям Anaconda*, которые помогают реализовать это уже сегодня, включая возможности Conda*, Numba* и dask, а также продемонстрировать их связь с другими решениями. В нем также излагается мотивация для новой исследовательской работы, Plures, предназначенной для обеспечения эффективного языкового взаимодействия.

Трэвис Олифант (Travis Oliphant), Anaconda

Презентация (PDF)


Harness the Power of High-Performance Computing for R

Средства реализации высокопроизводительных вычислений для среды R

Мы обсуждаем современные вычислительные платформы и среды программирования, доступные для приложений R, а также представляем методы и навыки, необходимые для решения масштабных и сложных проблем, которые могут возникать при использовании R.

Чжиюн Чжан (Zhiyong Zhang), Стэнфордский университет

Презентация (PDF)


Accelerate Scientific Python with Optimizations from Intel

Ускорение разработки с помощью Python для научных исследований и оптимизаций от Intel
(26 мин)

Получите обзор комплекта Intel® Distribution for Python*, который содержит оптимизации для основных вычислительных пакетов, таких как NumPy, SciPy, scikit-learn и Numba. Эта оптимизация позволяет некоторым обычным процессам Python работать с оригинальной производительность кода на ряде процессоров Intel®.

Олександр Павляк (Oleksandr Pavlyk), Intel

Презентация (PDF)


Parallel Computing with Python and the Numba* Compiler

Параллельные вычисления с помощью Python и компилятора Numba*
(24 мин)

Узнайте, как повысить производительность приложений Python в многоядерных системах с помощью Numba (компилятор для числовых функций Python) и познакомьтесь с его различными функциями, включая выпуск Global Interpreter Lock, автоматическую многопоточную обработку, а также совместимость с dask* и Apache Spark*.

Стэнли Сейберт (Stanley Seibert), Anaconda

Презентация (PDF)


Manage Data Science at Scale

Управление обработкой данных c перспективой
(24 мин)

Прогнозируемая аналитика и искусственный интеллект становятся важнейшими конкурентными преимуществами. Однако пока ИТ-подразделения испытывают трудности во время оказания поддержки группам исследовательской обработки данных. Узнайте, как ведущие банки, страховые компании, фармацевтические предприятия и другие организации управляют и наращивают обработку данных.

Альберт Чоу (Albert Chow), Domino Data Labs

Презентация (PDF)


Mixed-Language Debugging

Отладка в среде с несколькими языками (Python, C и C++ с TotalView*)

Отладка сценариев Python вместе с C и C++ может оказаться затруднительной. Здесь поясняется, как система TotalView* упрощает работу с отладчиком в смешанной языковой среде и дает наглядное представление обоих языков на одной платформе.

Джасмит Сингх (Jasmit Singh), Rogue Wave Software

Презентация (PDF)


Python Applications in the NERSC Exascale

Приложения Python в программе научных приложений NERSC Exascale для обработки данных

Здесь рассматриваются существующие проблемы и опыт, полученный при адаптации кода для обработки действительных научных данных с использованием Python на процессорах Intel® Xeon Phi™.

Роллин Томас (Rollin Thomas), Национальный энергетический научно-исследовательский вычислительный центр (NERSC)

Презентация (PDF)


HyperLoom: A Platform for Defining and Executing Scientific Pipelines in Distributed Environments

HyperLoom: Платформа для определения и выполнения научных процессов в распределенных средах

Существующие приложения зачастую используют сквозные процессы обработки данных, состоящие из большого количества взаимосвязанных вычислительных задач с различной степенью детализации. Представляем HyperLoom, платформу для определения и выполнения таких процессов в распределенных средах с использованием прикладного программного интерфейса Python.

Войтек Сима (Vojtech Cima), IT4Innovations National Supercomputing Center

Презентация (PDF)