IA está apareciendo aparentemente en todos los rincones de la vida moderna, desde la música y los medios hasta los negocios y la productividad, incluso las citas. Hay tantas cosas que puede ser difícil mantenerse al día, así que siga leyendo para averiguarlo todo, desde los últimos grandes desarrollos hasta los términos y las empresas que necesita saber para mantenerse al día en este campo de rápido movimiento.
Para empezar, asegurémonos de que todos estemos en la misma sintonía: ¿qué es ¿AI?
La inteligencia artificial, también llamada aprendizaje automático, es un tipo de sistema de software basado en redes neuronales, una técnica que en realidad fue pionera hace décadas pero que ha florecido recientemente gracias a nuevos y poderosos recursos informáticos. AI ha permitido un reconocimiento efectivo de voz e imagen, así como la capacidad de generar imágenes y voz sintéticas. Y los investigadores están trabajando arduamente para hacer posible que una IA navegue por la web, reserve boletos, modifique recetas y más.
Oh, pero si estás preocupado por un aumento de las máquinas tipo Matrix, no lo estés. ¡Hablaremos de eso más tarde!
Nuestra guía de IA tiene tres partes principales, cada una de las cuales actualizamos regularmente y se puede leer en cualquier orden:
- Primerolos conceptos más fundamentales que necesita saber, así como los más importantes recientemente.
- Próximouna descripción general de los principales actores de la IA y por qué son importantes.
- Y últimauna lista seleccionada de los titulares y desarrollos recientes que debe tener en cuenta.
Al final de este artículo, estará tan actualizado como cualquiera puede esperar estar en estos días. También lo actualizaremos y expandiremos a medida que avancemos en la era de la IA.
IA 101
Créditos de imagen: Andrii Shyp / Getty Images
Una de las cosas interesantes de la IA es que, aunque los conceptos básicos datan de hace más de 50 años, pocos de ellos eran familiares incluso para los expertos en tecnología antes de hace muy poco tiempo. Entonces, si te sientes perdido, no te preocupes, todos lo están.
Y una cosa que queremos dejar en claro desde el principio: aunque se llama «inteligencia artificial», ese término es un poco engañoso. No existe una definición única de inteligencia, pero lo que hacen estos sistemas está definitivamente más cerca de las calculadoras que del cerebro. La entrada y salida de esta calculadora es mucho más flexible. Puede pensar en la inteligencia artificial como el coco artificial: es imitación inteligencia.
Dicho esto, estos son los términos básicos que encontrará en cualquier discusión sobre IA.
red neuronal
Nuestros cerebros están hechos en gran parte de células interconectadas llamadas neuronas, que se unen para formar redes complejas que realizan tareas y almacenan información. Se ha intentado recrear este increíble sistema en software desde los años 60, pero la potencia de procesamiento requerida no estuvo ampliamente disponible hasta hace 15 o 20 años, cuando las GPU permitieron definir digitalmente Redes neuronales florecer. En el fondo, son solo muchos puntos y líneas: los puntos son datos y las líneas son relaciones estadísticas entre esos valores. Al igual que en el cerebro, esto puede crear un sistema versátil que rápidamente toma una entrada, la pasa a través de la red y produce una salida. Este sistema se llama un modelo.
Modelo
El modelo es la colección real de código que acepta entradas y devuelve salidas. La similitud en la terminología con un modelo estadístico o un sistema de modelado que simula un proceso natural complejo no es accidental. En IA, el modelo puede referirse a un sistema completo como ChatGPT, o prácticamente cualquier construcción de IA o aprendizaje automático, independientemente de lo que haga o produzca. Los modelos vienen en varios tamaños, lo que significa tanto la cantidad de espacio de almacenamiento que ocupan como la potencia computacional que necesitan para ejecutarse. Y estos dependen de cómo sea el modelo. entrenado.
Capacitación
Para crear un modelo de IA, las redes neuronales que forman la base del sistema están expuestas a una gran cantidad de información en lo que se denomina un conjunto de datos o cuerpo. Al hacerlo, estas redes gigantes crean una representación estadística de esos datos. Este capacitación El proceso es la parte más intensiva en computación, lo que significa que lleva semanas o meses (puede durar todo el tiempo que quiera) en enormes bancos de computadoras de alta potencia. La razón de esto es que no solo las redes son complejas, sino que los conjuntos de datos pueden ser extremadamente grandes: miles de millones de palabras o imágenes que deben analizarse y representarse en el modelo estadístico gigante. Por otro lado, una vez que el modelo termina de cocinarse, puede ser mucho más pequeño y menos exigente cuando se usa, un proceso llamado inferencia.

Créditos de imagen: Google
Inferencia
Cuando el modelo realmente está haciendo su trabajo, lo llamamos inferencia, muy parecido al sentido tradicional de la palabra: establecer una conclusión razonando sobre la evidencia disponible. Por supuesto, no es exactamente un «razonamiento», sino conectar estadísticamente los puntos en los datos que ha ingerido y, de hecho, predecir el siguiente punto. Por ejemplo, diciendo “Completa la siguiente secuencia: rojo, naranja, amarillo…” encontraría que estas palabras corresponden al comienzo de una lista que ha ingerido, los colores del arcoíris, e infiere el siguiente elemento hasta que ha producido el resto de esa lista. La inferencia es generalmente mucho menos costosa desde el punto de vista computacional que el entrenamiento: piense en ello como mirar un catálogo de tarjetas en lugar de ensamblarlo. Los modelos grandes aún deben ejecutarse en supercomputadoras y GPU, pero los más pequeños pueden ejecutarse en un teléfono inteligente o algo aún más simple.
IA generativa
Todo el mundo habla de IA generativa, y este término amplio solo significa un modelo de IA que produce un resultado original, como una imagen o un texto. Algunas IA resumen, algunas reorganizan, algunas identifican, etc., pero una IA que realmente genera algo (ya sea que «crea» o no es discutible) es especialmente popular en este momento. ¡Solo recuerda que el hecho de que una IA haya generado algo no significa que sea correcto, ni siquiera que refleje la realidad en absoluto! Sólo que no existía antes de que lo pidieras, como un cuento o un cuadro.
Los mejores términos de hoy
Más allá de lo básico, estos son los términos de IA que son más relevantes aquí a mediados de 2023.
Modelo de lenguaje grande
La forma de IA más influyente y versátil disponible en la actualidad, los grandes modelos de lenguaje se entrenan en casi todo el texto que compone la web y gran parte de la literatura en inglés. Ingerir todo esto da como resultado un modelo de base (sigue leyendo) de enorme tamaño. Los LLM pueden conversar y responder preguntas en lenguaje natural e imitar una variedad de estilos y tipos de documentos escritos, como lo demuestran ChatGPT, Claude y LLaMa. Si bien estos modelos son innegablemente impresionantes, se debe tener en cuenta que siguen siendo motores de reconocimiento de patrones, y cuando responden, es un intento de completar un patrón que ha identificado, ya sea que ese patrón refleje o no la realidad. LLM con frecuencia alucinar en sus respuestas, a las que llegaremos en breve.
Si desea obtener más información sobre LLM y ChatGPT, ¡tenemos un artículo completo por separado sobre eso!
modelo de fundación
Entrenar un modelo enorme desde cero en grandes conjuntos de datos es costoso y complejo, por lo que no querrá tener que hacerlo más de lo necesario. Modelos de cimentación son los grandes desde cero que necesitan supercomputadoras para funcionar, pero se pueden recortar para que quepan en contenedores más pequeños, generalmente reduciendo la cantidad de parámetros. Puede pensar en ellos como el total de puntos con los que el modelo tiene que trabajar, y en estos días puede ser de millones, miles de millones o incluso billones.
Sintonia FINA
Un modelo básico como GPT-4 es inteligente, pero también es generalista por diseño: absorbió todo, desde Dickens hasta Wittgenstein y las reglas de Dungeons & Dragons, pero nada de eso es útil si desea que lo ayude a escribir una carta de presentación para tu currículum. Afortunadamente, los modelos pueden ser afinado dándoles un poco de capacitación adicional utilizando un conjunto de datos especializado, por ejemplo, unas miles de solicitudes de empleo que están por ahí. Esto le da al modelo una idea mucho mejor de cómo ayudarlo en ese dominio sin desechar el conocimiento general que ha recopilado del resto de sus datos de entrenamiento.
Aprendizaje por refuerzo a partir de la retroalimentación humana, o RLHF, es un tipo especial de ajuste fino del que escuchará mucho: utiliza datos de humanos que interactúan con el LLM para mejorar sus habilidades de comunicación.
Difusión

A partir de un artículo sobre una técnica avanzada de posdifusión, puede ver cómo se puede reproducir una imagen incluso a partir de datos con mucho ruido.
La generación de imágenes se puede hacer de muchas maneras, pero, con mucho, la más exitosa hasta el momento es la difusión, que es la técnica en el corazón de Stable Diffusion, Midjourney y otras IA generativas populares. Modelos de difusión se entrenan mostrándoles imágenes que se van degradando poco a poco añadiendo ruido digital hasta que no queda nada del original. Al observar esto, los modelos de difusión también aprenden a hacer el proceso a la inversa, agregando gradualmente detalles al ruido puro para formar una imagen definida arbitrariamente. Ya estamos comenzando a ir más allá de esto para las imágenes, pero la técnica es confiable y relativamente bien entendida, así que no espere que desaparezca pronto.
Alucinación
Originalmente, esto era un problema de ciertas imágenes en el entrenamiento que se deslizaban hacia una salida no relacionada, como edificios que parecían estar hechos de perros debido a una sobreprevalencia de perros en el set de entrenamiento. Ahora se dice que una IA está alucinando cuando, debido a que tiene datos insuficientes o contradictorios en su conjunto de entrenamiento, simplemente inventa algo.
Esto puede ser un activo o un pasivo; una IA a la que se le pide que cree arte original o incluso derivado está alucinando con su resultado; Se le puede pedir a un LLM que escriba un poema de amor al estilo de Yogi Berra, y lo hará felizmente, a pesar de que tal cosa no existe en ninguna parte de su conjunto de datos. Pero puede ser un problema cuando se desea una respuesta fáctica; los modelos presentarán con confianza una respuesta que es mitad real, mitad alucinación. En la actualidad, no existe una manera fácil de saber cuál es cuál, excepto comprobarlo usted mismo, porque el modelo en sí mismo no sabe qué es «verdadero» o «falso», solo está tratando de completar un patrón lo mejor que puede.
AGI o IA fuerte
La Inteligencia General Artificial, o IA fuerte, no es realmente un concepto bien definido, pero la explicación más simple es que es una inteligencia que es lo suficientemente poderosa no solo para hacer lo que hace la gente, sino también aprender y mejorarse como nosotros A algunos les preocupa que este ciclo de aprendizaje, integración de esas ideas y luego aprendizaje y crecimiento más rápido se perpetúe a sí mismo y dé como resultado un sistema superinteligente que es imposible de restringir o controlar. Algunos incluso han propuesto retrasar o limitar la investigación para prevenir esta posibilidad.
Es una idea aterradora, claro, y películas como The Matrix y Terminator han explorado lo que podría suceder si la IA se sale de control e intenta eliminar o esclavizar a la humanidad. Pero estas historias no se basan en la realidad. La apariencia de inteligencia que vemos en cosas como ChatGPT es un acto impresionante, pero tiene poco en común con el razonamiento abstracto y la actividad dinámica de múltiples dominios que asociamos con la inteligencia «real». Si bien es casi imposible predecir cómo progresarán las cosas, puede ser útil pensar en AGI como algo así como un viaje espacial interestelar: todos entendemos el concepto y aparentemente estamos trabajando para lograrlo, pero al mismo tiempo estamos increíblemente lejos de lograr algo parecido. Y debido a los inmensos recursos y los avances científicos fundamentales necesarios, ¡nadie lo logrará repentinamente por accidente!
Es interesante pensar en AGI, pero no tiene sentido tomar prestados problemas cuando, como señalan los comentaristas, AI ya presenta amenazas reales y consecuentes hoy a pesar de sus limitaciones y, de hecho, en gran parte debido a ellas. Nadie quiere Skynet, pero no se necesita una superinteligencia armada con armas nucleares para causar un daño real: la gente está perdiendo sus trabajos y cayendo en engaños hoy. Si no podemos resolver esos problemas, ¿qué posibilidades tenemos contra un T-1000?
Los mejores jugadores en IA
IA abierta

Créditos de imagen: Leon Neal / Getty Images
Si hay un nombre familiar en AI, es este. OpenAI comenzó como su nombre indica, una organización con la intención de…
Continuar leyendo: La era de la IA: todo lo que necesitas saber sobre la inteligencia artificial