YEn los últimos meses, hemos asistido a una proliferación de razonamiento, capaz de dividir las tareas en pasos y ejecutar un proceso de pensamiento que culmine en respuestas más refinadas. La última de estas herramientas es Claude 3.7 sonetoel modelo más avanzado del desarrollador Antrópico. Sin embargo, esta es una particularidad: es un Modelo de razonamiento híbrido.
Esto significa que, a diferencia de otro razonamiento, Claude 3.7 soneto permite al usuario activar o no estas capacidades de pensamiento avanzado. De esta manera, cuando desee la IA de una respuesta rápida y simple, solo tendrá que solicitarla y lo mismo cuando necesite reflexiones profundas para tareas complejas. «Creemos que El razonamiento debe ser una capacidad integrada de los modelos de avant. en lugar de un modelo completamente separado», Explique por antrópico.
Además de esta novedad, Anthrope también ha presentado Claude CodeUna herramienta de codificación de agentes que está en fase preliminar. Con el código Claude, los desarrolladores y desarrolladores pueden delegar tareas de ingeniería complejas para Claude directamente desde su terminal.
Introducción Claude 3.7 Sonnet: nuestro modelo más inteligente hasta la fecha. Es un modelo de razonamiento híbrido, que produce respuestas de respuestas casi instantes, pensamiento paso a paso.
Un modelo, dos formas de pensar.
También estamos lanzando una herramienta de codificación de agente: Claude Code. pic.twitter.com/jt7qmfwuc
– Anthrope (@anthrópica) 24 de febrero de 2025
Cómo funciona Claude 3.7 Sonnet, el razonamiento híbrido ai
Claude 3.7 soneto es el Evolución del soneto Claude 3.5 (De hecho, 3.6) han sido omitidos y es el primer razonamiento AI desarrollado por antrópico. Además, él presenta capacidades mejoradas En matemáticas, física, instrucción o monitoreo de codificación, entre otras áreas.
Siendo un modelo híbridointegra tanto las capacidades de un LLM común como un razonamiento. El usuario o el usuario solo tendrán que implementar el Botón «Claude 3.7 soneto» Ubicado en el cajón de texto AI y seleccione la opción «Normal» o «extendido»dependiendo de si necesita o no sus capacidades de razonamiento.
Esta característica La diferencia de otros modelos de razonamiento como O3 de OpenAiEso solo permite ejecutar procesos de pensamiento complejos y pasos para responder a las consultas. Lo que implica que el usuario o el usuario deben seleccionar un modelo diferente de acuerdo con la complejidad de la tarea. De hecho, Opadai recientemente informó su Planes para eliminar el selector de modelos de chatgpt y desarrollar una herramienta capaz de aplicar el modelo más apropiado en cada contexto, buscando simplificar y mejorar la experiencia del usuario.
Este También es el objetivo de antrópico. El laboratorio de IA creado por los ex empleados de Operai desea avanzar hacia un modelo capaz de decidir cuánto «pensar» o «razonar» una tarea, eliminando el paso intermedio que obliga a los usuarios y usuarios a seleccionar el «modo normal» o «extendido o» o » extender «.
Optimizado para el mundo real
En el panel de chat en sí, El soneto de Claude 3.7 mostrará el proceso de razonamiento interno que funciona hasta llegar a la respuesta final Y marcará el tiempo que ha tomado Al llegar a su conclusión. Por supuesto, desde antrópico señalan que no siempre revelará todos sus «pensamientos», ya que algunos pueden ser censurados por razones de seguridad.
El desarrollador ha optimizado las formas de pensar en esta inteligencia artificial para realizar tareas del mundo real Eso refleja cómo las empresas usan esta tecnología para mejorar su productividad, como los problemas de codificación o las tareas de la agencia.
Del mismo modo, Claude 3.7 Sonnet ha mejorado su capacidad para identificar aplicaciones dañinas y diferenciarlas de las que no lo son. Versión 3.7 ha reducido la tasa de rechazos innecesarios en un 45% en comparación con su predecesor 3.5.
Acerca de actuación de este nuevo modelo, en el Prueba de bancos swe (tareas de codificación) reveló un 62.3% de precisiónmientras que el O3-Mini de OpenAI obtuvo 49.3%. Y, en el Prueba de bancos tauque mide la capacidad de un modelo de IA para interactuar con usuarios simulados y API externos, Claude 3.7 Sonnet logró un 81.2%en comparación con OpenAi O1, que obtuvo 73.5%.

Un entrenamiento de gimnasio de Pokémon
Como detalle curioso, vale la pena mencionar que Anthrope no solo usa estas pruebas oficiales para Pon a prueba tu nueva IApero también recurrió a otras formas como Juega en el videojuego de Pokémon Rojo de Game Boy.
Para hacer esto, como se explicó, «Equipamos a Claude con memoria básica, entrada de píxeles en la pantalla y llamadas de función para presionar los botones y navegar por la pantalla, lo que le permitió jugar Pokémon continuamente más allá de sus límites de contexto habituales, manteniendo el juego a qué longitud de decenas de miles de interacciones».
Claude 3.7 Sonnet logró derrotar a tres líderes del gimnasio y ganar sus medallas. Este ha sido el mejor resultado obtenido por un modelo de la familia Claude Sonnet, cuya primera versión de Claude 3.0 sonnet ni siquiera salió de la casa en la ciudad de Paleta.

«Pokémon es una forma divertida de apreciar el soneto Claude 3.7, pero esperamos que estas capacidades tengan un impacto en el mundo real mucho más allá de los juegos. La capacidad del modelo para mantener la concentración y lograr objetivos abiertos Ayudará a los desarrolladores a crear una amplia gama de agentes de IA de última generación.», Señala el desarrollador.
La capacidad de razonamiento solo está disponible en planes premium
Anthrope ha dado un soneto Claude 3.7 a todos sus usuarios y usuarios, sin embargo, no todos los planes dan acceso a su versión completa. La capacidad de razonamiento del modo «extendido» solo estará disponible para aquellos que tienen contratado Un plan de pago (Pro, equipo o empresa). Por su parte, el plan gratuito ofrecerá las capacidades mejoradas de Claude 3.7 Sonnet como modelo LLM, pero sin la función de razonamiento.
También es posible usar el soneto Claude 3.7 y sus capacidades de razonamiento en API antrópica, Bedrock de Amazon y Verex AI de Google Cloud.
Al usar este modelo A través de la API«Los usuarios también pueden controlar el presupuesto para pensar: Pueden indicar a Claude que piensas en No N Tokens, para cualquier valor de N hasta que su límite de salida de 128k tokens. Esto les permite equilibrar la velocidad (y el costo) para la calidad de la respuesta».
Claude Code, un agente activo para las tareas de codificación
La otra novedad presentada por Anthrope es Claude Code, Su primer agente activo especializado en tareas de codificación. Este modelo puede «Buscar y leer código, editar archivos, escribir y ejecutar pruebas, confirmar y enviar código a GitHub y usar herramientas de línea de comandos, manteniéndolo informado en cada paso».
Por el momento, Claude Code está en un Vista previa de la investigación limitadaPero sus habilidades ya han revelado grandes resultados. Del desarrollador explican que este modelo logró completar las tareas en un solo pase quenormalmente, Tomarían más de 45 minutos de trabajo manual.
Anthrope ha informado que planea Implementar mejoras continuas que dependan de la experiencia de uso. Específicamente contemplan: «Mejorar la fiabilidad de las llamadas de herramientas, agregar soporte para comandos de ejecución prolongados, mejorar la representación en la aplicación y expandir la propia comprensión de Claude sobre sus capacidades».
https://www.youtube.com/watch?v=ajpk3yttkz4
Ya es posible solicitar acceso a la versión preliminar del código Claude señalando su lista de espera.
Foto: antrópico
Versión Completa Claude 3.7 Sonnet, la primera IA con razonamiento híbrido







