Sarah Nagy es una ex astrofísica y científica de datos con una maestría en Finanzas de Princeton. Ahora es cofundadora y directora ejecutiva de Seek AI, una plataforma que utiliza IA generativa para ayudar a los usuarios empresariales a consultar conjuntos de datos empresariales, liberando a los científicos de datos para un trabajo más creativo.
Hablamos sobre una variedad de temas de IA, con un enfoque particular en la búsqueda. La entrevista se produjo poco después de que comenzaran a circular rumores sobre el lanzamiento de un motor de búsqueda por parte de OpenAI. (Entrevista editada para mayor claridad y extensión).
P: ¿Será la IA generativa una fuerza disruptiva en las búsquedas, como lo fueron Uber y Airbnb en sus espacios?
A: Definitivamente lo creo. Los motores de búsqueda han sido más o menos iguales durante mucho tiempo y hay mucho más valor que puedes desbloquear agregando IA generativa. Hace gran parte del trabajo por usted; puede encontrar cosas en las páginas que está buscando y mostrárselas. ¿Creo necesariamente que los motores de búsqueda tradicionales van a desaparecer? Probablemente no. Ahora mismo, la velocidad es mayor con los buscadores tradicionales; la gente no necesariamente quiere esperar a que se genere el texto todo el tiempo. Pero a medida que la latencia de los modelos disminuya, eso probablemente hará que la gente cambie cada vez más a motores de búsqueda de IA generativa.
P: Al utilizar un motor de búsqueda genAI como Perplexity, en lugar de obtener un resumen seguido de enlaces, obtengo un texto generado con un puñado de citas. Eso nos lleva a la posición en la que la IA, de hecho, elige un número limitado de resultados de búsqueda por mí. ¿Seguramente eso debe ser preocupante para las marcas y los editores?
A: No es necesariamente tan diferente de un motor de búsqueda tradicional. Pase lo que pase, siempre se le mostrarán resultados limitados. En Google, el incentivo proviene de los anuncios; Perplexity aún no tiene anuncios, por lo que los resultados se eligen en función de lo que será más útil para el usuario, no de quién paga.
P: ¿Alguna idea sobre los rumores que circulan en torno a ChatGPT? ¿Sería una sorpresa si se pusieran a buscar?
A: No creo que sea una sorpresa, pero al mismo tiempo está Bing y algunas de las complicaciones que surgen cuando piensas en cómo Bing se relaciona con ChatGPT; esa podría ser una razón por la que no lanzaron un motor de búsqueda. Pero el modelo se está mejorando. Hace un año, sus conocimientos estaban muy anticuados; Creo que era 2023 y su conocimiento finalizó en 2021, si mal no recuerdo. Ese ya no es el caso, por lo que ChatGPT podría seguir estando más actualizado sin ser un motor de búsqueda.
P: Algunas personas hablan de que ChatGPT podrá informar las noticias. ¿Se están acercando los LLM a ser en tiempo real?
A: Mas y mas cerca. Eso definitivamente ha ido mejorando. Nunca digas nunca. Tenemos muchos años por delante como especie. Algo que aprendimos en Seek es que cualquier tipo de datos, incluidas las noticias, deben recopilarse de manera eficiente y que la recopilación de datos en este momento es muy difícil de realizar sin humanos. Los periodistas deben estar en el terreno, informando. ¿Cómo vas a automatizar eso con IA?
P: Esto se relaciona con las afirmaciones de que algún día la IA será tan inteligente que ya no nos necesitará. Pero si es así de inteligente, se dará cuenta de que necesita hardware; Armar hardware y obtener materiales para el hardware es en gran medida una tarea humana.
A: Estoy totalmente de acuerdo. El hardware es más difícil de entender que el software. Pero el aspecto del hardware está avanzando bastante. Se están destinando fondos a la IA incorporada, a los robots humanoides. Está progresando.
P: Ver las capacidades de conversación del nuevo ChatGPT-4o me recordó la prueba de Turing. La IA conversacional ahora podría pasar la Prueba de Turing con gran éxito, pero seguramente eso solo apunta a las limitaciones de la Prueba de Turing porque la IA realmente solo responde basándose en análisis de datos y predicciones, no en inteligencia real.
A: Hay diferentes escuelas de pensamiento al respecto. ¿Es la prueba de Turing un buen punto de referencia? Nuestro equipo de aprendizaje automático en Seek dirá que no lo es y que existen otras formas de medir la inteligencia. Una alternativa se llama punto de referencia Arc. Mide el razonamiento visual. Yo diría que los LLM han pasado la prueba de Turing incluso antes que ChatGPT.
Existe la escuela de pensamiento de los loros estocásticos de que estos modelos son en realidad solo predictores de la siguiente palabra, que simplemente producen estadísticamente la siguiente palabra. Luego está la escuela de pensamiento OpenAI; Toda la maquinaria que produce la siguiente palabra pasa por una simulación de la realidad para llegar a la siguiente palabra. Uno es más pesimista, el otro es más optimista, pero yo diría que ambos dicen lo mismo. Para mí, personalmente, no hay duda de que los modelos son predictores de la siguiente palabra, pero hay muchas cosas que no sabemos sobre lo que sucede debajo de la superficie. ¿Somos los humanos realmente tan mágicos que desafiamos el mundo físico y no hay manera de que un modelo de lenguaje grande pueda estar a la altura de lo divinos que somos? Yo tampoco sé si creo eso.
P: Todavía no entendemos completamente cómo los humanos hacen lo que hacen, lo que hace difícil decir si algún día una máquina podrá hacerlo.
A: Exactamente. Hay muchas cosas que no sabemos sobre los LLM y tampoco sabemos muchas cosas sobre el cerebro humano.
P: Para concluir, ¿qué haces en Seek AI?
A: Somos una interfaz de lenguaje natural para que cualquier persona dentro de una organización pueda hacer preguntas sobre grandes conjuntos de datos y obtener respuestas precisas. Es un campo emergente al que llamo “IA cuantitativa” porque la IA procesa números y obtiene resultados numéricos o basados en datos. Nuestro objetivo principal es que las empresas consulten sus propios datos de manera más eficiente, pero también tenemos asociaciones con empresas de datos para brindarles a sus clientes formas más eficientes de consultar sus datos.
Por ejemplo, nos asociamos con Prodigy para crear Prodigy Plus; ese es el motor Seek AI más los datos de marketing patentados de Prodigy. Los clientes de Prodigy pueden hacer preguntas en lenguaje natural, como «¿Cuánto más gasté en el Super Bowl de este año que en el año pasado?»
P: ¿Entonces estás excluyendo a los científicos de datos de ese proceso?
A: Empecé Seek porque solía ser un científico de datos y estaba destinado a poder realizar esas tareas de bajo nivel que nadie realmente quiere hacer. A menudo implican escribir código que era demasiado complejo para automatizarlo con métodos tradicionales, pero no lo suficientemente complejo como para ser interesante o que valga la pena para un ser humano.
Versión en Inglés Sarah Nagy sobre la búsqueda impulsada por IA: mirando hacia el futuro con IA