doElude 3.7 sonetoEl nuevo modelo del razonamiento de Anthrope está tratando de cumplir el sueño que varias generaciones han perseguido en todo el mundo: convertirse en el mejor entrenador de Pokémon. Para hacer esto, está jugando videojuego rojo de Pokémon de Game Boy y su aventura se está transmitiendo en vivo En el canal Twitch «ClaudePlaspokemon».
Esta es una forma creativa de probar el soneto de Claude 3.7 para Resolver problemas a través del razonamientosin haber sido entrenado previamente para jugar este videojuego.
Cómo han convertido el soneto Claude 3.7 en Pokemon Coach
Para que el soneto Claude 3.7 pueda jugar Pokémon Red, Anthrope lo ha equipado con ciertas capacidades y herramientas especiales:
- Interfaz de juego: Una interfaz personalizada que permite a AI controlar el juego presionando los botones virtuales.
- Análisis de captura de pantalla: AI puede «ver» e interpretar lo que está sucediendo en el juego gracias a las capturas de pantalla.
- Base de conocimiento: IA mantiene un conjunto dinámico de notas sobre el mundo del juego, registrando información sobre ubicaciones, estado de su Pokémon y mecánica del juego.
- Sistema de navegación: Gracias a una herramienta de búsqueda de ruta, AI puede encontrar rutas hacia un punto específico en la pantalla.
- Lector de memoria: IA obtiene algunos fragmentos de información del juego del juego (su ubicación actual o el grupo al que pertenece), de modo que las posibilidades de confundirse se reducen si la pantalla se malinterpreta.
Del mismo modo, la retransmisión de Twitch muestra un pantalla doble para que la audiencia pueda comprender mejor cómo funciona Claude 3.7 Sonnet. En vista del izquierda Podemos ver en tiempo real el IA Proceso de pensamiento de pasos y cómo resuelve problemas en un entorno interactivo. Mientras que el de la bien muestra Tu avance en el juego en tiempo real.
Algunos investigadores de Anthrope tienen, durante el año pasado, a la obsesión a tiempo parcial con un problema peculiar.
¿Puede Claude interpretar a Pokémon?
Para el hilo: pic.twitter.com/k8sknxcxyj
– Anthrope (@anthrópica) 25 de febrero de 2025
Fortalezas y limitaciones
A pesar de no haber sido entrenado para jugar Pokémon, Claude 3.7 Sonnet puede avanzar en el videojuego gracias a sus capacidades de razonamiento. Estos te permiten Analizar el contextoejecutar uno Planificación estratégica En la lucha ya durante todo el juego Aprender geografía de ese mundo virtual, Recuerda tus metas y adaptada Cuando sus estrategias iniciales fallan.
Sin embargo, este modelo está lejos de ser perfecto. A veces Está confundido con la navegación compleja y a veces Le lleva durante mucho tiempo averiguar qué está pasando exactamente en la pantalla. Como Anthrope explica en la descripción de su canal Twitch: «Claude puede ser un poco tonto a veces«.
Pero debemos recordar que, a pesar de A veces puede parecer Claude 3.7 El soneto avanza a través de la aventura como un Pokémon que han atacado con un rayo confusoLa verdad es que la AI Use un gran esfuerzo para razonar Todos sus pasos.
Otras versiones anteriores
El modelo 3.7 no ha sido el único en la familia Claude Sonnet con la que Anthrope ha tratado de gastar Pokémon rojo, sino el que ha obtenido los mejores resultados hasta la fecha. La versión Soneto Claude 3.0Por ejemplo, Ni siquiera salió de la casa en Pueblo Paleta.
En junio de 2024, antrópico Testó Soneto Claude 3.5 Con este videojuego, pero la IA Repetidamente trató de huir de las batallas obligatorias Contra los entrenadores cuando lo desafiaron. En otra ocasión, este modelo Fue atrapado en una esquina yAl no poder irse, concluyó que el fallo era del juego y escribió una solicitud formal para reiniciarlo.
Posteriormente, probaron con el Nueva versión de Claude 3.5 soneto Presentado en octubre de ese año. Los resultados fueron más satisfactorios y la IA Logró su primera victoria contra un rival y salió de la paleta de la ciudad.. Aunque, finalmente, terminó estancando nuevamente.
En este momento, Claude 3.7 soneto Es el modelo que ha llegado más lejos, siendo su mayor hito para obtener el Surge la medalla del gimnasio del tenienteEste es el tercer líder del gimnasio que derrota.
¿Claude conseguirá a todos?
Foto: Twitch Channel «ClaudePlaspokemon»
Versión Completa Claude 3.7 Sonnet está jugando a Pokemon Rojo en Twitch





