Tecnología para creación de redes neuronales y aprendizaje profundo

NVIDIA muestra su poder en cómputo grafico durante el GPU Technology Conference 2015

Del 17 al 20 de Marzo NVIDIA Corp presentó su Conferencia GTC 2015 en San Jose , California, un evento que reunió a los interesados en el uso y explotación de computo gráfico, donde la compañía informo sobre nuevos desarrollos, hablo de tecnología para autos autónomos y el impacto del cómputo en el aprendizaje profundo. 3DCadPortal te presenta aquí lo que ahí sucedió.

 

NVIDIA GTC15 Jen-Hsun Huang

 

El crecimiento del cómputo gráfico de alto desempeño ha crecido 10 veces en procesadores colocados en el mercado en los últimos años, también hay crecimientos asociados que se reportan desde Universidades, sobre desarrollos en el lenguaje de programación gráfico de NVIDIA llamado CUDA

 

NVIDIA GTC15

 

NVIDIA presento durante el GTC15 el TITAN X, el GPU más rápido del mundo con 8 billones de transistores, 7 TeraFlops de capacidad de cómputo gráfico y 12 GB de memoria. Puede procesar foto realismos en tiempo real a muy alta calidad. Este GPU permite el aprendizaje profundo o “Deep learning” de computadoras también a muy alta velocidad.  Muchas empresas de clase mundial están aplicando el aprendizaje profundo para analizar grandes cantidades de información y generar resultados, que antes tomarían mucho tiempo en lograr, tales como detección de células con cáncer, predecir la toxicidad de nuevas medicinas, etc.

 

NVIDIA GTC15

 

El sistema DIGITS (Sistema de entrenamiento basado en aprendizaje profundo para científicos) en combinación con DEVBox, es un nuevo sistema de cómputo grafico más rápido que estará disponible en Mayo de 2015 a un precio de USD 15,000. El sistema es la computadora donde se espera hacer estos desarrollos de redes neuronales

 

NVIDIA GTC15

 

En la trayectoria de desarrollo de GPU´s se anunció Pascal, el sucesor de la GPU Maxwell, estará disponible para el 2016 y pronto viene la generación Volta para 2018. El primer GPU de alto desempeño de NVIDIA fue Tesla en 2008, seguido por Fermi en 2010, Kepler en 2012. En este sentido, Pascal es diez veces más poderoso que Maxwell.

 

NVIDIA GTC15

 

En cuanto al avances en los sistemas ADAS (Sistema Avanzado de Asistencia al Conductor) de aplicaciones en autos autónomos, se tienen buenos registros de avance que alertan y frenan el auto, la siguiente generación va a dirigir y acelerar también. Con una red neuronal de aprendizaje profundo, los autos van a aprender a manejarse en ambientes cada vez más difíciles por medio de miles de imágenes y van a aprender a reconocer el terreno y decidir si pueden avanzar.  El producto que está disponible es NVIDIA DRIVE PX que es una computadora especializada para autos manejados por sí solos. La semana pasada ya arranco un auto que atravesara los EU sin conductor.

 

NVIDIA GTC15

 

Elon Musk, presidente de TELSA Motors comentó durante su intervención en el evento de NVIDIA, que su empresa está aplicando  los avances de las GPU´s en los tableros de los autos Tesla que son de 17 pulgadas,  van a colaborar con NVIDIA en la aplicación de aprendizaje profundo para facilitar el manejo de los autos siempre de forma segura.


Jeff Dean de Google hablo del aprendizaje profundo a gran escala. Cómo construir sistemas computacionales más inteligentes para crear redes neuronales que ayuden a percibir y a entender mejor el mundo? Lograr capacidades de visión y de voz, entendimiento del lenguaje, predicción de comportamientos, la habilidad de interactuar con el ambiente. Se tienen trillones de palabras, miles de millones de imágenes y videos, miles de horas de audio por día, de los cuales se puede aprender. Dean  de Google, menciono los retos de la ingeniería para el siglo 21 tales como, mejores medicinas, mejorar y restaurar la infraestructura urbana, realizar ingeniería de reversa al cerebro, mejorar la realidad virtual, avanzar el aprendizaje personalizado, diseñar herramientas para el descubrimiento científico. Explico cómo el aprendizaje profundo con redes neuronales puede enseñar a un sistema computacional a entrenarse y lograr reconocimientos de imágenes y de voz que cambien la forma de comunicarse entre computadoras y dispositivos, entendimiento del lenguaje, traducción en tiempo real, publicidad, etc. 

 

Andrew Ng de Baidu Research, presento 3 de las principales aplicaciones del aprendizaje profundo que considera son imágenes, voz y comportamiento. Explico que el aprendizaje profundo está en etapa de despegue, esta disciplina tiene como motor (grandes redes neuronales) y el combustible es (grandes cantidades de información).

 

NVIDIA GTC15

 

Las GPU´s conectadas pueden llegar a 100 mil millones de conexiones entre las redes neuronales,  lo cual era impensable con CPU´s en la nube en el 2011 con “solamente” mil millones de conexiones. Estos sistemas avanzados pueden reconocer caras con solamente 9 errores en una muestra de 6,000 fotos.  Las aplicaciones más promisorias de la visión de computadora son imágenes médicas, venta y búsquedas de ropa, autos que se manejan por sí solos, seguridad en casa por medio de cámaras, cuidado a gente de la tercera edad, computadoras que se ponen como el Ojo Baidu. 

 

En cuanto a reconocimiento de voz, comenta que va a transformar la Internet de las Cosas, los autos, dispositivos y computadoras que se pueden poner tales como lentes y relojes van a reconocer comandos de voz. Las aplicaciones de comportamiento son búsquedas por internet, Administración de Centros de Datos y Seguridad de la información.

 

Dassault Systemes estuvo presente con un stand y una presentación a cargo de Pierre-Maheut y Xavier-Melkonian sobre visualización del diseño. Para el diseño del producto se apoya con foto realismo en tiempo real de muy alto nivel. Para validación del diseño utiliza trazado de rayos interactivo e iluminación global y la experiencia de producto con gráficos avanzados que hacen “sentir” el modelo. Utiliza una tarjeta NVIDIA K6000 con 12 GB de RAM para crear una imagen de foto realismo de un avión de forma interactiva.

 

Siemens PLM realizó una presentación a cargo de Jeremy Bennett y Michael Carter, sobre el desempeño logrado a través del uso de las librerías gráficas OpenGL modernas en el motor de foto realismo DirectModel de Siemens. Inició como un desarrollo entre EAI y HP como un visualizador de grandes modelos en 1997 y ahora es el motor gráfico de todos los productos de visualización de Teamcenter, la solución de PLM de Siemens. Sus prioridades de diseño son flexibilidad, alto desempeño y mantenimiento.

 

Respecto a Relidad Virtual y Realidad Aumentada. Nathan Reed de NVIDIA comenta sobre VR Direct, una nueva tecnología para acelerar el tiempo de respuesta de un sistema de realidad virtual como los lentes Oculus, tales como la respuesta al movimiento del usuario al girar la vista y visualizar un lado de la escena.  Estos lentes nos dan la impresión de profundidad al mandar escenas diferentes a cada ojo. Rob Manson de buildAR, presento la idea de llevar la Realidad Aumentada a la red a través de los navegadores y cámaras de profundidad, para tener una experiencia interactiva que sobrepone información digital a su visión del mundo real.

 

Por: Enviado especial de 3DCadPortal 

Additional information