Intel® HPC Developer Conference 2017

Lenguajes de alta productividad

Stalk the Interactive Terabyte with R

Acose al terabyte interactivo con R

El proyecto Programación con Big Data en R (pbdR) posibilita el uso nativo y de bajo costo de bibliotecas escalables de informática de alto desempeño (HPC) en análisis de datos en lenguaje R en sistemas grandes. Esto incluye álgebra lineal densa distribuida, funciones de distribución y redistribución de datos para transformación (wrangling) de datos y uso de alto nivel de colectivos de interfaz de traspaso de mensajes (MPI).

George Ostrouchov, Drew Schmidt y Michael Matheson, Oak Ridge National Laboratory

Presentación (PDF)


High-Performance Computing with Python* and Anaconda*

Informática de alto desempeño con Python* y Anaconda*

La comunidad de Python ha estado trabajando durante muchos años para garantizar que los ingenieros que utilizan Python puedan aprovechar plenamente su hardware concurrente, tanto en una sola motherboard como en distintas máquinas en un clúster y en la nube. En esta charla se destacan las tecnologías de Anaconda* que ayudan a hacer esto posible en la práctica hoy, lo que incluye Conda*, Numba* y dask, y se muestra cómo se relacionan con otras soluciones. También se explican los motivos para realizar un nuevo esfuerzo de investigación llamado Plures con el fin de posibilitar una mejor interoperabilidad entre idiomas.

Travis Oliphant, Anaconda

Presentación (PDF)


Harness the Power of High-Performance Computing for R

Cómo aprovechar la potencia de la informática de alto desempeño para R

Analizamos las plataformas de informática moderna y el entorno de programación disponible para las aplicaciones R, y presentamos técnicas y habilidades necesarias para resolver problemas complejos y a gran escala con R.

Zhiyong Zhang, Stanford University

Presentación (PDF)


Accelerate Scientific Python with Optimizations from Intel

Acelerar Scientific Python con optimizaciones de Intel
(26 min.)

Acceda a una descripción general de Intel® Distribution for Python*, que contiene optimizaciones para paquetes de computación como NumPy, SciPy, scikit-learn y Numba. Esta optimización permite que ciertos flujos de trabajo de Python comunes se ejecuten con un desempeño de código casi de nivel nativo en una variedad de procesadores Intel®.

Oleksandr Pavlyk, Intel

Presentación (PDF)


Parallel Computing with Python and the Numba* Compiler

Computación en paralelo con Python y Numba* Compiler
(24 min.)

Vea cómo obtener un desempeño más alto en Python en sistemas multicore utilizando Numba (un compilador para funciones de Python numéricas) y explore sus diversas características, incluyendo el lanzamiento de Global Interpreter Lock, multithreading automático y compatibilidad con dask* y Apache Spark*.

Stanley Seibert, Anaconda

Presentación (PDF)


Manage Data Science at Scale

Administrar la ciencia de datos a escala
(24 min.)

El análisis predictivo y la inteligencia artificial se han vuelto capacidades competitivas fundamentales. Sin embargo los equipos de TI tienen dificultades para ofrecer la asistencia que necesitan los equipos de científicos de datos para alcanzar el éxito. Descubra cómo los bancos líderes, las compañías farmacéuticas y de seguros y otros administran la ciencia de datos a escala.

Albert Chow, Domino Data Labs

Presentación (PDF)


Mixed-Language Debugging

Depuración en lenguajes mixtos (Python, C y C++ con TotalView*)

La depuración de Python con C y C++ puede ser difícil. En esta charla se explica cómo TotalView* la simplifica con un depurador de lenguaje mixto y le brinda una vista de ambos lenguajes en la misma plataforma.

Jasmit Singh, Rogue Wave Software

Presentación (PDF)


Python Applications in the NERSC Exascale

Aplicaciones de Python en el Programa de aplicaciones de ciencia a exaescala NERSC para datos

En esta charla se analizan las dificultades que se presentan y las lecciones tempranas aprendidas al llevar códigos científicos con carga intensiva de datos reales utilizando Python a procesadores Intel® Xeon Phi™.

Rollin Thomas, National Energy Research Scientific Computing Center (NERSC)

Presentación (PDF)


HyperLoom: A Platform for Defining and Executing Scientific Pipelines in Distributed Environments

HyperLoom: Una plataforma para definir y ejecutar vías científicas en entornos distribuidos

Las aplicaciones del mundo real suelen abarcar vías de procesamiento de datos de extremo a extremo compuestas por una gran cantidad de tareas informáticas interconectadas de diversos niveles de granularidad. Presentamos HyperLoom: una plataforma para definir y ejecutar esas vías en entornos distribuidos utilizando una API de Python.

Vojtech Cima, IT4Innovations National Supercomputing Center

Presentación (PDF)