Microsoft alcanzó el dominio durante los años 80 y 90 gracias al éxito de su sistema operativo Windows que se ejecutaba en los procesadores de Intel, una relación acogedora apodada “Wintel”.
Ahora, Microsoft espera que otra combinación de hardware y software lo ayude a recuperar ese éxito y alcanzar a sus rivales Amazon y Google en la carrera para proporcionar inteligencia artificial de vanguardia a través de la nube.
Microsoft espera extender la popularidad de su plataforma en la nube Azure con un nuevo tipo de chip de computadora diseñado para la era de la IA. A partir de hoy, Microsoft brinda a los clientes de Azure acceso a chips fabricados por la startup británica Graphcore.
Graphcore, fundada en Bristol, Reino Unido, en 2023, ha atraído una atención considerable entre los investigadores de IA, y ha invertido varios cientos de millones de dólares, con la promesa de que sus chips acelerarán los cálculos necesarios para que la IA funcione. Hasta ahora, no ha puesto a disposición del público los chips ni ha mostrado los resultados de las pruebas con los primeros probadores.
Microsoft, que invirtió su propio dinero en Graphcore en diciembre pasado como parte de una ronda de financiación de 200 millones de dólares, está interesada en encontrar hardware que haga que sus servicios en la nube sean más atractivos para el creciente número de clientes de aplicaciones de IA.
A diferencia de la mayoría de los chips utilizados para la IA, los procesadores de Graphcore se diseñaron desde cero para respaldar los cálculos que ayudan a las máquinas a reconocer rostros, comprender el habla, analizar el lenguaje, conducir automóviles y entrenar robots. Graphcore espera que atraiga a las empresas que ejecutan operaciones críticas para el negocio en IA, como nuevas empresas de automóviles autónomos, empresas comerciales y operaciones que procesan grandes cantidades de video y audio. Aquellos que trabajan en algoritmos de inteligencia artificial de próxima generación también pueden estar interesados en explorar las ventajas de la plataforma.
Microsoft y Graphcore publicaron hoy puntos de referencia que sugieren que el chip iguala o supera el rendimiento de los principales chips de IA de Nvidia y Google utilizando algoritmos escritos para esas plataformas rivales. El código escrito específicamente para el hardware de Graphcore puede ser aún más eficiente.
Las empresas afirman que ciertas tareas de procesamiento de imágenes funcionan muchas veces más rápido en los chips de Graphcore, por ejemplo, que en sus rivales que utilizan el código existente. También dicen que pudieron entrenar un modelo de IA popular para el procesamiento del lenguaje, llamado BERT, a tasas que igualan las de cualquier otro hardware existente.
BERT se ha vuelto muy importante para las aplicaciones de inteligencia artificial relacionadas con el lenguaje. Google dijo recientemente que está utilizando BERT para impulsar su negocio principal de búsqueda. Microsoft dice que ahora está usando los chips de Graphcore para proyectos internos de investigación de IA que involucran procesamiento de lenguaje natural.
Karl Freund, que realiza un seguimiento del mercado de chips de IA en Moor Insights, dice que los resultados muestran que el chip es de vanguardia pero aún flexible. Un chip altamente especializado podría superar a uno de Nvidia o Google, pero no sería lo suficientemente programable para que los ingenieros desarrollen nuevas aplicaciones. “Han hecho un buen trabajo haciéndolo programable”, dice. “El buen desempeño tanto en el entrenamiento como en la inferencia es algo que siempre han dicho que harían, pero es muy, muy difícil”.
Freund agrega que el acuerdo con Microsoft es crucial para el negocio de Graphcore, porque proporciona una vía de acceso para que los clientes prueben el nuevo hardware. El chip bien puede ser superior al hardware existente para algunas aplicaciones, pero se necesita mucho esfuerzo para volver a desarrollar el código de IA para una nueva plataforma. Con un par de excepciones, dice Freund, los puntos de referencia del chip no son lo suficientemente llamativos como para alejar a las empresas e investigadores del hardware y el software que ya se sienten cómodos usando.
Graphcore ha creado un marco de software llamado Poplar, que permite que los programas de IA existentes se transfieran a su hardware. Sin embargo, muchos de los algoritmos existentes aún pueden ser más adecuados para el software que se ejecuta sobre el hardware rival. El marco de software de IA Tensorflow de Google se ha convertido en el estándar de facto para los programas de IA en los últimos años, y fue escrito específicamente para los chips de Nvidia y Google. También se espera que Nvidia lance un nuevo chip de IA el próximo año, que probablemente tenga un mejor rendimiento.
Nigel Toon, cofundador y director ejecutivo de Graphcore, dice que las empresas comenzaron a trabajar juntas un año después del lanzamiento de su empresa, a través de Microsoft Research Cambridge en el Reino Unido. Los chips de su compañía son especialmente adecuados para tareas que involucran modelos de IA muy grandes o datos temporales, dice. Un cliente en finanzas supuestamente vio un aumento de rendimiento de 26 veces en un algoritmo utilizado para analizar datos de mercado gracias al hardware de Graphcore.
Un puñado de otras empresas más pequeñas también anunciaron hoy que están trabajando con chips Graphcore a través de Azure. Esto incluye Citadel, que usará los chips para analizar datos financieros, y Qwant, un motor de búsqueda europeo que quiere que el hardware ejecute un algoritmo de reconocimiento de imágenes conocido como ResNext.
El auge de la IA ya ha sacudido el mercado de los chips informáticos en los últimos años. Los mejores algoritmos realizan cálculos matemáticos paralelos, que se pueden realizar de manera más efectiva en chips gráficos (o GPU) que tienen cientos de núcleos de procesamiento simples en comparación con los chips convencionales (CPU) que tienen algunos núcleos de procesamiento complejos.
El fabricante de GPU, Nvidia, se ha subido a la ola de la inteligencia artificial hacia la riqueza, y Google anunció en 2023 que desarrollaría su propio chip, la Unidad de procesamiento de tensor, que tiene una arquitectura similar a una GPU pero está optimizada para Tensorflow.
Los chips de Graphcore, a los que llama unidades de procesamiento de inteligencia (IPU), tienen muchos más núcleos que GPU o TPU. También cuentan con memoria en el propio chip, lo que elimina un cuello de botella que surge al mover datos a un chip para procesarlos y apagarlos nuevamente.
Facebook también está trabajando en sus propios chips de IA. Microsoft ha promocionado previamente chips reconfigurables fabricados por Intel y personalizados por sus ingenieros para aplicaciones de IA. Hace un año, Amazon reveló que también estaba incursionando en la fabricación de chips, pero con un procesador de uso más general optimizado para los servicios en la nube de Amazon.
Más recientemente, el auge de la IA ha provocado una oleada de empresas de hardware emergentes para desarrollar chips más especializados. Algunos de estos están optimizados para aplicaciones específicas como la conducción autónoma o las cámaras de vigilancia. Graphcore y algunos otros ofrecen chips mucho más flexibles, que son cruciales para desarrollar aplicaciones de IA pero también mucho más difíciles de producir. La última ronda de inversión de la compañía le dio a la empresa una valoración de $ 1.7 mil millones.
Los chips de Graphcore podrían primero encontrar tracción con los mejores expertos en inteligencia artificial que pueden escribir el código necesario para explotar sus beneficios. Varios investigadores destacados de IA han invertido en Graphcore, incluidos Demis Hassabis, cofundador de DeepMind, Zoubin Ghahramani, profesor de la Universidad de Cambridge y director del laboratorio de IA de Uber, y Peiter Abbeel, profesor de UC Berkeley que se especializa en IA y robótica. . En una entrevista con WIRED en diciembre pasado, el visionario de IA Geoffrey Hinton habló sobre el potencial de los chips Graphcore para avanzar en la investigación fundamental.
En poco tiempo, las empresas también pueden verse tentadas a probar lo último. Como dice el CEO de Graphcore, Toon, “Todos están tratando de innovar, tratando de encontrar una ventaja”.
Esta historia apareció originalmente en wired.com.
Imagen de listado por Graphcore