Mistral AI, con sede en París, busca convertirse en un referente europeo de la inteligencia artificial y competir a la par de los gigantes tecnológicos estadounidenses. Foto archivo
Mistral AI, con sede en París, busca convertirse en un referente europeo de la inteligencia artificial y competir a la par de los gigantes tecnológicos estadounidenses. Foto archivo

París, 21 de mar. (Dow Jones) -- Hace un año por estas fechas, Arthur Mensch tenía 30 años. Todavía trabajaba en una división de Google aquí cuando la inteligencia artificial (IA) recién había empezado a despegar en la conciencia pública como algo más que ciencia ficción.

     Desde entonces, la llamada IA generativa que puede conversar y, aparentemente, razonar como los humanos se ha convertido en el avance tecnológico del que más se ha hablado en décadas.

     La startup que Mensch lanzó tras dejar Google, ahora con nueve meses de vida, está valorada en poco más de dos mil millones de dólares. La valuación refleja el frenesí y el miedo que rodea los esfuerzos para construir y comercializar sistemas avanzados de IA.

     La empresa, llamada Mistral AI, está desafiando la sabiduría convencional de que los ganadores en la carrera de la IA surgirán de entre los gigantes estadounidenses de la industria tecnológica. Mensch, quien fundó la empresa con dos amigos de la escuela de ingeniería, no cree que una escala enorme sea esencial, ni que Estados Unidos domine necesariamente esta industria.

     “Siempre he lamentado que no haya grandes tecnológicas en Europa”, dijo Mensch, de 31 años, en la oficina de Mistral AI en París. “Creo que esta es nuestra oportunidad de convertirnos en una”.

     La compañía de Mensch, que ha recaudado poco más de 500 millones de dólares de inversionistas como Andreessen Horowitz, sigue siendo pequeña en comparación con los Goliat de la industria. OpenAI, respaldada por Microsoft, y Google, de Alphabet, están invirtiendo miles de millones de dólares en el entrenamiento de los últimos sistemas de inteligencia artificial, aprovechando su acceso a los chips de computadora especializados necesarios para construir tales sistemas y los balances necesarios para pagar la electricidad que consumen esos chips.

     Mistral, llamado así por un fuerte viento que sopla desde Francia, se basa en parte en la idea de que mucho de ese dinero se está desperdiciando.

     Mensch, que comenzó en el mundo académico, ha pasado gran parte de su vida descubriendo cómo hacer que los sistemas de IA y aprendizaje automático sean más eficientes. A principios del año pasado, unió fuerzas con los cofundadores Timothée Lacroix, de 32 años, y Guillaume Lample, de 33, quienes entonces estaban en el laboratorio de inteligencia artificial de Meta Platforms en París.

     Juntos, están apostando a que su pequeño equipo pueda superar a los titanes de Silicon Valley al encontrar formas más eficientes de construir e implementar sistemas de IA. Y quieren hacerlo, en parte, regalando muchos de sus sistemas de IA como software de código abierto.

     “Queremos ser la empresa más eficiente en términos de capital en el mundo de la IA”, dijo Mensch. “Esa es la razón por la que existimos”.

     Hace unos días, Mistral dio a conocer un nuevo modelo de IA llamado Mistral Large que, de acuerdo con Mensch, puede realizar algunas tareas de razonamiento de forma comparable con GPT-4, el modelo de lenguaje más avanzado de OpenAI hasta la fecha, y Gemini Ultra, el nuevo modelo de Google.

     Mensch dijo que entrenar su nuevo modelo costó menos de 20 millones de euros, o unos 22 millones de dólares. Por el contrario, el director ejecutivo de OpenAI, Sam Altman, dijo que entrenar a los modelos más grandes de su compañía costaba “mucho más” de 50 a 100 millones de dólares, después del lanzamiento de GPT-4 el año pasado.

     La industria está tomando nota. Mistral ha atraído el interés de clientes corporativos e inversores, incluido Microsoft, quien dijo que está agregando el nuevo modelo de Mistral como una opción para los desarrolladores en su servicio en la nube Azure. Como parte del acuerdo multianual, Microsoft tomará una pequeña participación en la compañía.

     Mistral también se ha asociado y vendido pequeñas participaciones a otras empresas, incluidas las firmas de software empresarial Salesforce y Nvidia, fabricante de las unidades de procesamiento gráfico (GPU, por sus siglas en inglés) más potentes, utilizadas para construir sistemas de IA como el de Mistral.

     Brave Software hizo que un modelo gratuito y de código abierto de Mistral fuera el predeterminado para impulsar su chatbot de navegador web, dijo Brian Bondy, cofundador y director de tecnología de Brave. Agregó que la compañía encuentra la calidad comparable con la de modelos propietarios, y el enfoque de código abierto de Mistral también permite a Brave controlar el modelo localmente.

     Eric Boyd, vicepresidente corporativo de la plataforma de IA de Microsoft, dijo que Mistral presenta una prueba intrigante de hasta qué punto la ingeniería inteligente puede impulsar los sistemas de IA. “Entonces, ¿a dónde más puedes ir?”, preguntó. “Eso está por verse”.

     Alto, con una espesa mata de pelo oscuro, Mensch no se ve ni actúa como un director ejecutivo geek de la tecnología. Sus amigos y colegas dicen que es rápido para las bromas con una cerveza. También atleta, terminó el maratón de París en menos de tres horas y media meses antes de concluir su tesis doctoral en 2018.

     Mensch ha estado durante mucho tiempo entre las actividades académicas y las empresariales. Creció en los suburbios al oeste de París, hijo de una madre profesora de física y un padre con un pequeño negocio de tecnología.

     El futuro CEO asistió a algunas de las mejores escuelas de matemáticas y aprendizaje automático de Francia. Sus asesores describieron a un estudiante que se lanzaba con entusiasmo a los proyectos y los dominaba, incluso si tenía poca experiencia.

      “Me gustan las nuevas experiencias”, dijo Mensch. “Me aburro muy rápido”.

     Una línea de paso ha estado tratando de hacer las cosas más eficientes. Para su doctorado, Mensch trabajó en formas de ampliar el software para analizar imágenes cerebrales tridimensionales de un sistema funcional de imágenes de resonancia magnética para que pudiera ingerir millones de imágenes, mapeando las redes del cerebro responsables de cosas como las matemáticas y las caras.

     Mensch se unió a la unidad de IA de Google, entonces llamada DeepMind, a finales de 2020, donde trabajó en el equipo de creación de los llamados grandes modelos de lenguaje, el tipo de sistema de IA que más tarde impulsaría ChatGPT. En 2022, fue uno de los autores principales de un artículo sobre un nuevo modelo de IA llamado Chinchilla, que cambió la comprensión del campo sobre la relación entre el tamaño de un modelo de IA, la cantidad de datos que se utilizan para construirlo y su rendimiento, lo que se conoce como leyes de escalado de IA.

      “Quién mejor para desafiar la comprensión del mundo de las leyes de escalamiento que una de las personas que ayudaron a definirlas”, dijo Sarah Guo, una de las primeras inversionistas en Mistral a través de su firma de capital de riesgo, Conviction.

     A medida que la carrera de la IA se calentaba en 2022, Mensch dijo que estaba decepcionado de que los grandes laboratorios privados de IA comenzaran a publicar menos artículos sobre grandes modelos de lenguaje, compartiendo menos con la comunidad de investigación en general. Una vez que se lanzó ChatGPT, hubo una carrera dentro de Google para igualarlo. Mensch dijo que pasó de trabajar en un equipo de 10 personas a 30, y luego a 70.

      “Creo que me fui justo antes de que se volviera muy burocrático para mí”, dijo Mensch. “No quería construir tecnología opaca desde dentro de las grandes tecnológicas”.

 

 


Fecha de publicación: 21/03/2024

Etiquetas: tecnología IA generativa startup Mistral Microsoft Google empresas