Previo a la apertura del Keynote de Intel Computex, la empresa presentó ayer productos que ofrecen un aumento significativo en el rendimiento de la carga de trabajo en el mundo real, que incluye un adelanto del nuevo procesador móvil de la marca de 10 nm (con el nombre en código "Ice Lake"), y la edición especial del procesador Intel® Core™ i9-9900KS de 9na Generación, ambos distribuidos este año.
La compañía habló cómo se definirá el liderazgo de desempeño en la nueva era de la computación centrada en los datos más allá del conteo y la frecuencia del núcleo tradicional. A través de la potencia del software, la arquitectura Intel® está diseñada para brindar el mejor liderazgo en rendimiento en las cargas de trabajo del mundo real que se adaptan a las experiencias informáticas de hoy y mañana.
Intel está a la cabeza de este liderazgo en rendimiento con su modelo redefinido de innovación de productos, ofreciendo productos optimizados para las cargas de trabajo mediante la combinación de innovaciones técnicas en seis pilares: proceso y empaquetado, arquitectura, memoria, interconexión, seguridad y software.
"Para cada orden de magnitud potencial de rendimiento de una nueva arquitectura de hardware, existen dos órdenes de magnitud de rendimiento habilitadas por el software. Intel tiene más de 15,000 ingenieros de software trabajando para poder optimizar las cargas de trabajo y desbloquear el rendimiento de los procesadores Intel", dijo Raja Koduri, arquitecto jefe y vicepresidente senior de Arquitectura, software y gráficos de Intel.
A continuación, se incluyen ejemplos del aumento del rendimiento en las cargas de trabajo del mundo real para la nueva era centrada en los datos:
Ice Lake ofrece una mejora en los gráficos móviles: como se presentó a principios de este mes durante la Asamblea de Inversionistas de Intel, la compañía comenzará a comercializar en junio su primer procesador de 10nm, un producto de PC móvil con el nombre de "Ice Lake". El nuevo motor de gráficos Gen11 de Intel en Ice Lake está permitiendo que la primera GPU integrada de la industria, incorpore la capacidad de sombreado de tasa variable, aplicando potencia de procesamiento variable a diferentes áreas de la escena para mejorar el rendimiento de renderizado. Además, en una serie de juegos populares, como CS: Go *, Rainbow 6 Siege * y Three Kingdoms *, se espera que los gráficos Gen11 casi dupliquen1 el rendimiento en comparación con los gráficos Intel Gen9 para obtener experiencias visuales asombrosas sobre la marcha.
Las arquitecturas de computación heterogéneas brindan un desempeño inteligente: Intel se está dando cuenta de los beneficios de la computación heterogénea tanto para el cliente como para el centro de datos en los productos actuales a través de su diseño de arquitectura e innovaciones de I/O. Ice Lake es una nueva plataforma altamente integrada para computadoras portátiles, que combina la nueva arquitectura de núcleo “Sunny Cove” y la nueva arquitectura de gráficos Gen11 con Thunderbolt ™ 3 e Intel Wi-Fi 6 (Gig +) integradas por primera vez, brindando la mejor conectividad en su clase. Este también será el primer procesador de Intel diseñado para habilitar inteligencia artificial (AI por sus siglas en inglés) para PC, el creador de Intel® Deep Learning Boost (DL Boost) en la CPU, así como instrucciones de AI en la GPU y aceleradores de bajo consumo, iniciando una nueva era de rendimiento inteligente para PC. Además de mostrar a Ice Lake acelerando las cargas de trabajo que realizan las personas todos los días, como los videos de imagen y estilizado de imágenes, la compañía también demostró cómo Intel DL Boost puede ofrecer hasta 8.8 veces2 mayor inferencia en AI que otros productos similares en el mercado, según lo medido por AIXPRt.
Para las plataformas centradas en datos, los procesadores escalables Intel Xeon de 2da Generación son los únicos procesadores con aceleradores integrados Intel DL Boost AI, que combinan instrucciones de redes neuronales vectoriales y optimizaciones de software de aprendizaje profundo. Con Intel DL Boost, los procesadores escalables Intel Xeon de 2da Generación aceleran las cargas de trabajo de inferencia AI, incluyendo el reconocimiento de imágenes, la detección de objetos y la segmentación de imágenes hasta 14 veces4 en comparación con el procesador escalable Intel Xeon de la generación anterior.
En comparación con una de las GPU más utilizadas en el mercado ahora, la 2da generación del procesador escalable Intel Xeon brinda 2.4 veces el rendimiento3 en un sistema de recomendación, una de las cargas de trabajo de AI más populares en la nube hoy en día que representa más del 60% de la inferencia en el centro de datos. Con Intel DL Boost, Intel Xeon escalable puede alcanzar un rendimiento adicional 2 veces mayor.
Nuevo procesador gaming de escritorio de edición especial: Intel presentó una vista previa del procesador de edición especial Intel® Core ™ i9-9900KS de novena generación, el primero en presentar los 8 núcleos que funcionan a una frecuencia turbo de 5.0 GHz, lo que hace que el mejor procesador gaming de Intel sea aún mejor.
Intel también mostró cómo la compañía está optimizando el mejor desempeño del mundo real en los juegos más populares que se ejecutan en procesadores Intel con innovaciones de hardware y software. A través de los años, Intel ha optimizado cientos de juegos, trabajando con más de 300,000 desarrolladores de juegos.
Más ejemplos de desempeño destacados en el evento de apertura de Intel Computex: Gregory Bryant, Vicepresidente Senior y Gerente General de Client Computing Group de Intel, brindará más detalles sobre el liderazgo en el desempeño de Intel y las nuevas experiencias durante su discurso de apertura de COMPUTEX 2019 el 28 de mayo. Más detalles, incluyendo una transmisión en vivo de la conferencia magistral, estarán disponibles en el Newsroom de Intel.
Acerca de Intel:
Intel (NASDAQ: INTC), líder de la industria de semiconductores, está formando el futuro basado en datos, con tecnología de computación y de comunicaciones, que es el fundamento de las innovaciones de todo el mundo. La experiencia en ingeniería de la compañía está ayudando a abordar los desafíos más grandes del mundo, así como también a proteger, alimentar y conectar miles de millones de dispositivos y la infraestructura del mundo inteligente y conectado – desde la nube hasta la red, al cómputo perimetral y todo lo que hay en medio. Conoce más sobre Intel visitando newsroom.intel.la e intel.la.
Intel y el logotipo de Intel son marcas registradas de Intel Corporation en los Estados Unidos y otros países. *Otros nombres y marcas pueden ser propiedad de otros.
El software y las cargas de trabajo utilizadas en las pruebas de rendimiento pueden haberse optimizado para el rendimiento solo en los microprocesadores Intel. Las pruebas de rendimiento, como SYSmark y MobileMark, se miden utilizando sistemas informáticos, componentes, software, operaciones y funciones específicos. Cualquier cambio en cualquiera de esos factores puede hacer que los resultados varíen. Debe consultar otra información y pruebas de rendimiento para ayudarlo a evaluar completamente sus compras contempladas, incluido el rendimiento de ese producto cuando se combina con otros productos. Para obtener más información, visite www.intel.com/benchmarks.
Los resultados de rendimiento se basan en las pruebas a la fecha especificada en la Declaración de configuración y pueden no reflejar todas las actualizaciones de seguridad disponibles públicamente. Vea la descripción de la configuración para más detalles. Ningún producto o componente puede ser absolutamente seguro.
Aviso de optimización: los compiladores de Intel pueden o no optimizar al mismo grado para microprocesadores que no sean de Intel para optimizaciones que no son exclusivas de los microprocesadores Intel. Estas optimizaciones incluyen conjuntos de instrucciones SSE2, SSE3 y SSSE3 y otras optimizaciones. Intel no garantiza la disponibilidad, funcionalidad o efectividad de ninguna optimización en microprocesadores no fabricados por Intel. Las optimizaciones dependientes del microprocesador en este producto están diseñadas para su uso con los microprocesadores Intel. Ciertas optimizaciones no específicas de la microarquitectura Intel están reservadas para los microprocesadores Intel. Consulte las Guías de usuario y referencia del producto correspondientes para obtener más información sobre los conjuntos de instrucciones específicos cubiertos por este aviso.
Las características y beneficios de las tecnologías Intel dependen de la configuración del sistema y pueden requerir la activación de hardware, software o servicio habilitado. El rendimiento varía según la configuración del sistema. Consulte con el fabricante o distribuidor de su sistema u obtenga más información en intel.com.
1Rendimiento de juego de Ice Lake: Three Kingdoms 2.08X, Rainbow 6 Siege 1.82X, CS: GO 1.72X: basado en el rendimiento de juego en aquellos títulos con los siguientes ajustes: Three Kingdoms: escenarios de referencia “Battle” y “Dynasty V2” a una resolución de 1920x1080 - Pantalla completa, V-Sync: apagado, Preajuste de baja calidad, Resolución de escala: 100%, Rainbow Six: Siege - Y4S1: 5 minutos de juego en situación de "Extracción suburbana" a una resolución de 1920x1080 en pantalla completa, Vsync: apagado, Preset de calidad media , Medido con: PresentMon, 300Segundos; Counter-Strike: Global Offensive - 1.36.9.5: 5 minutos de juego contra bots del mapa Dust II a una resolución de 1920x1080 - pantalla completa, ajustes preestablecidos de calidad media, procesamiento multinúcleo: habilitado, FXAA: desactivado, modo de filtrado de textura: anisotrópico 4X, Vsync: Apagado. comparando Intel PreProduction ICL U 15W. Configuración: Procesador: Intel® Core ™ i7 (ICL-U 4 + 2) PL1 = 15W TDP, 4C / 8T, Gráficos Intel Gen 11, Controlador de preproducción, Memoria: 8GB LPDDR4X-3733, Almacenamiento: Intel SSD Pro 7600P 256GB, OS : Windows * 10 RS5 Build 475 vs. Intel PreProduction WHL U. Configuración: Procesador: Intel® Core ™ i7 8565U 1.8GHz, hasta 4.6GHz Turbo PL1 = 20W TDP, 4C / 8T, Intel UHD Graphics 620, controlador de gráficos: 26.20.100.6709, memoria: 16GB DDR4-2400, almacenamiento: Intel SSD 760P 512GB, SO: Windows * 10 RS5, versión de compilación 475, medido por Intel en mayo de 2019
2Ice Lake AI Performance en IAXPRT: Carga de trabajo: 7.6X más imágenes por segundo usando AIXPRT Community Preview 2 con precisión Int8 en ResNet-50 y 8.8X mayor rendimiento de inferencia AI superior usando AIXPRT Community Preview 2 en ResNet-50 Configuración: Sistema de preproducción de Intel ICL-U, PL1 15w, 4C / 8T, Intel Gen11 Graphics, preproducción del controlador GFX, memoria 8GB LPDDR4X-3733, almacenamiento Intel SSD Pro 760P 256GB, SO Microsoft Windows 10, RS5 Build 475, preprod bios. Vs. Sistema OEM disponible comercialmente con AMD * Ryzen 7 3700U 2.3GHz Turbo hasta 4GHz 4C / 8T, AMD * Radeon * Gráficos Vega 10, controlador Gfx Adrenalin 2019 19.4.3, memoria 8GB DDR4-2400, almacenamiento SK Hynix BC501 256GB, OS - Microsoft Windows 10 RS5 Build 475 Bios F.07. Medido por Intel en mayo de 2019
3 Hasta 2.41x de ventaja en el rendimiento con respecto a las GPU Nvidia * V100: procesador Intel® Xeon® Platinum 8268 de 2 zócalos, 24 cores HT en Turbo ON Memoria total 384 GB (12 ranuras / 32GB / 2933 MHz), BIOS: SE5C620.86B.0D. 01.0286.011120190816 (código: 0x4000013), CentOS 7.6, Kernel 4.19.5-1.el7.elrepo.x86_64, SSD 1x INTEL SSDSC2KG96 960GB, Marco de aprendizaje profundo: MXNet https://github.com/apache/incubator-mxnet.git cometer f1de8e51999ce3acaa95538d21a91fe43a0286ec aplicando https://github.com/intel/optimized-models/blob/v1.0.2/mxnet/wide_deep_criteo/patch.diff, compilador: gcc 6.3.1, MKL DNN versión: cometer: 08bd90cca77683dd5d1c98068cea8b92ed05784, Ancho y Profundo: https://github.com/intel/optimized-models/tree/v1.0.2/mxnet/wide_deep_criteo cometer: c3e7cbde4209c3657ecb6c9a142f71c3672654a5,
Conjunto de datos: Criteo Display Advertisement Challenge, tamaño de lote = 512, 2 instancia / 2 socket, tipo de datos: FP32; Con resultados de recomendación: 678,000 registros / segundos. Sistema host vs. 2 procesadores Intel® Xeon® Platinum 8180 (28 cores), HT ON, memoria total 128 GB (16 ranuras / 8 GB / 2666 MHz), Ubuntu 18.04.2 LTS Acelerador: Nvidia * Acelerador de GPU Turing V100 , 32GB HBM2, 32GB / seg. BW de interconexión, interfaz del sistema x16 PCIe Gen3, Driver versión 410.78, CUDA versión 10.0.130, CUDNN versión 7.5, CUDA CUBLAS 10.0.130 Carga de trabajo de aprendizaje profundo: MxNet 1.4.0https://pypi.org/project/mxnet-cu92/, Tipo de datos: FP32, Tamaño de lote = 512, Ejecución de 2 instancias Modelo: Amplio y profundo: https://github.com/intel/optimized-models/blob/master/mxnet/wide_deep_criteo/model.py El ID de confirmación para el estado actual es c3e7cbde4209c3657ecb6c9a142f71c3672654a5 Conjunto de datos de entrenamiento (8,000,000 muestras):wget https://storage.googleapis.com/dataset-uploader/criteo-kaggle/large_version/train.csv Evaluación dataset (2,000,000 samples): wget https://storage.googleapis.com/dataset-uploader/criteo-kaggle/large_version/eval.csv python3 inference.py --batch-size $bs --num-batches 10000 >> $outdir/bs$bs-$runid.2xbgout 2>&1 & python3 inference.py --batch-size $bs --num-batches 10000 >> $outdir/bs$bs-$runid.2xfgout 2>&1. Resultados recomendados: 281,211 registros / segundo. Probado por Intel a partir del 3/26/2019.
4 Hasta 1.9x de ganancias generacionales promedio en Intel Xeon Gold mainstream CPUs: 2 procesadores Intel® Xeon® Platinum 8268, 24 cores HT en Turbo ON Memoria total 384 GB (12 ranuras / 32GB / 2933 MHz), BIOS: SE5C620.86B. 0D.01.0286.011120190816 (código: 0x4000013), CentOS 7.6, Kernel 4.19.5-1.el7.elrepo.x86_64, SSD 1x INTEL SSDSC2KG96 960GB, Deep Learning Framework: MXNet https://github.com/apache/incubator-mxnet.git cometer f1de8e51999ce3acaa95538d21a91fe43a0286ec aplicandohttps://github.com/intel/optimized-models/blob/v1.0.2/mxnet/wide_deep_criteo/patch.diff,
Compilador: gcc 6.3.1, versión MKL DNN: commit: 08bd90cca77683dd5d1c98068cea8b92ed05784, Ancho y profundo:https://github.com/intel/optimized-models/tree/v1.0.2/mxnet/wide_deep_criteo cometer: c3e7cbde4209c3657ecb6c9a142f71c3672654a5, Conjunto de datos: Criteo Display Advertisement Challenge, tamaño de lote = 512, 2 instancia / 2 socket, tipo de datos: Int8, con 1,299,000 registros / segundo frente a procesador, 24 cores HT en Turbo ON Memoria total 384 GB (12 ranuras / 32GB / 2933 MHz) , BIOS: SE5C620.86B.0D.01.0286.011120190816 (ucode: 0x4000013), CentOS 7.6, Kernel 4.19.5-1.el7.elrepo.x86_64, SSD 1x INTEL SSDSC2KG96 960GB, Marco de aprendizaje profundo: MXNet https://github.com/apache/incubator-mxnet.git commit f1de8e51999ce3acaa95538d21a91fe43a0286ec applying https://github.com/intel/optimized-models/blob/v1.0.2/mxnet/wide_deep_criteo/patch.diff, Compilador: gcc 6.3.1, MKL DNN version: cometer: 08bd90cca77683dd5d1c98068cea8b92ed05784, ancho y profundo: https://github.com/intel/optimized-models/tree/v1.0.2/mxnet/wide_deep_criteocometer: c3e7cbde4209c3657ecb6c9a142f71c3672654a5,
Conjunto de datos: Criteo Display Advertisement Challenge, Tamaño de lote = 512, 2 instancia / 2 socket, Tipo de datos: FP32, con 678,000 registros / segundo. Probado por Intel a partir del 3/26/2019