“Los desarrolladores pueden pedir a Claude que use las computadoras de la misma manera que lo hacen las personas”. Esta es la grandilocuente promesa de Anthropic, compañía especializada en inteligencia artificial generativa que acaba de anunciar el despliegue de un nuevo modelo, con funciones avanzadas que parecen salidas de un cuento de ciencia ficción.
Claude 3.5 Sonnet, tal es el nombre de la novedad, es una actualización del modelo generativo de Anthropic. Su principal mejora consiste en la capacidad para controlar aquello que ocurre en la computadora. Según explicó la empresa en un comunicado, el sistema analiza la información que aparece en la pantalla y puede mover el cursor, hacer clics o usar el teclado, entre otras tareas.
Claude 3.5 Sonnet de Anthropic: los detalles del nuevo modelo de IA que controla la computadora
Esta primicia de Anthropic —firma que se consolida como un competidor de fuste para OpenAI, Google y Meta— se lanza en una beta pública. Es decir, es una versión experimental que está abierta para todos los usuarios. El hecho de que sea una prueba se traduce en que los resultados pueden ser “propensos a errores”, según dijeron desde la compañía estadounidense.
“Estamos lanzando (este modelo) de manera anticipada para recibir comentarios de los desarrolladores y esperamos que mejore rápidamente”, comentaron al respecto. La estrategia es usual en el mundo del software, donde los responsables de los programas ponen a prueba funciones antes del lanzamiento de las versiones finales, con el propósito de recibir feedback y realizar los ajustes que sean necesarios.
“Uso de la computadora”, así define Anthropic a esta actualización de Claude, su modelo de IA generativa. El carácter diferencial de 3.5 Sonnet es, como señalamos, su capacidad para controlar aquello que ocurre en la computadora, sin intervención directa del usuario.
En la práctica, esta IA puede interpretar lo que está en la pantalla y ejecutar comandos como si fuera un usuario de carne y hueso. En las demostraciones, el modelo programó un sitio web, ejecutar, depuró errores y realizó múltiples acciones en simultáneo. También puede realizar búsquedas en bases de datos, extraer información de planillas de cálculo y rellenar formularos.
Eso sí: hay algunas limitaciones. Por ejemplo, no puede hacer zoom con el mouse o arrastrar elementos.
Además, la firma —que por cierto fue fundada por exintegrantes de OpenAI— reconoció que las habilidades avanzadas de este modelo derivan en riesgos que deben ser considerados. Al respecto, indicaron: “Debido a que (esta versión de Claude) puede proporcionar un nuevo vector para amenazas más conocidas, como correo no deseado, desinformación o fraude, estamos adoptando un enfoque proactivo para promover su implementación segura. Desarrollamos nuevos clasificadores que pueden identificar cuándo se está utilizando la computadora y si se está produciendo algún daño”.
Tal como observa el sitio Genbeta, los dones de 3.5 Sonnet podrían “revolucionar la automatización de tareas digitales”. Resta saber cuál será el real desempeño de esta actualización en manos de los usuarios y, además, cuáles son las ideas que barajan sus competidores —los mencionados gigantes de la IA— para no quedar relegados en esta carrera.