En un martes lluvioso en San Francisco, los ejecutivos de Apple subieron al escenario de un auditorio repleto para presentar la quinta generación del iPhone. El teléfono, que se veía idéntico a la versión anterior, tenía una nueva característica que el público no tardó en comentar: Siri, un asistente virtual.
Scott Forstall, entonces director de software de Apple, presionó un botón en el iPhone para llamar a Siri e hizo preguntas. A pedido suyo, Siri verificó la hora en París («8:16 p. m.», respondió Siri), definió la palabra «mitosis(«División celular en la que el núcleo se divide en núcleos que contienen el mismo número de cromosomas», dijo) y sacó una lista de 14 restaurantes griegos muy valorados, cinco de ellos en Palo Alto, California.
“Llevo mucho tiempo en el campo de la inteligencia artificial y esto sigue sorprendiéndome”, dice Forstall.
Eso fue hace 12 años. Desde entonces, Siri y los asistentes de inteligencia artificial de la competencia, como Alexa de Amazon y Google Assistant, no han dejado a nadie indiferente. La tecnología se ha estancado en gran medida, y los asistentes que hablan se han convertido en el blanco de las bromas, incluso en un boceto de «Saturday Night Live» de 2018 que presentaba un altavoz inteligente para personas mayores.
El mundo de la tecnología ahora está entusiasmado con un tipo diferente de asistente virtual: chatbots.
Estos bots basados en IA, como ChatGPT y el nuevo ChatGPT Plus de la empresa OpenAI con sede en San Francisco, pueden improvisar rápidamente respuestas a preguntas escritas en un cuadro de chat. La gente ha usado ChatGPT para realizar tareas complejas como software de codificación, escribir propuestas de negocios y escribir ficción.
Y ChatGPT, que usa inteligencia artificial para adivinar qué palabra viene a continuación, está mejorando rápidamente. Hace unos meses no era capaz de escribir un haiku; ahora lo hace con gusto. El martes, OpenAI presentó su motor de inteligencia artificial de próxima generación, GPT-4, que utiliza ChatGPT.
El triunfo de ChatGPT, la caída de asistentes
El entusiasmo en torno a los chatbots ilustra cómo Siri, Alexa y otros asistentes de voz, que alguna vez despertaron un entusiasmo similar, han desperdició su ventaja en la carrera de la inteligencia artificial.
En la última década, los productos se han topado con obstáculos. Siri se topó con dificultades tecnológicas, incluido un código torpe que tardó semanas en actualizarse con funciones básicas, según John Burkey, un ex ingeniero de Apple que trabajó en el asistente.
Amazon y Google calcularon mal cómo se usarían los asistentes de voz, lo que los llevó a invertir en áreas con la tecnología que rara vez valió la pena, dijeron ex empleados. Cuando esos experimentos fallaron, el entusiasmo por la tecnología se desvaneció en las empresas, dijeron.
Los asistentes de voz son «tontos como una roca», dijo Satya Nadella, director ejecutivo de Microsoft, en una entrevista este mes con The Financial Times, declarando que la inteligencia artificial más reciente marcaría el camino. Microsoft ha trabajado de cerca con OpenAI, invirtiendo $13 mil millones en la puesta en marcha e incorporando su tecnología al motor de búsqueda Bing, así como otros productos.
Google y Apple: qué harán con sus asistentes
Apple se negó a comentar sobre Siri. Google prometió ofrecer un excelente asistente virtual para ayudar a las personas en sus teléfonos y dentro de sus hogares y automóviles; la compañía está probando por separado un chatbot llamado Bard. Amazon dijo que vio un aumento en 30 por ciento en el compromiso del cliente a nivel mundial con Alexa en el último año y se mostró optimista sobre su misión de construir inteligencia artificial de clase mundial.
Los asistentes y chatbots se basan en diferentes tipos de Inteligencia Artificial. Los chatbots funcionan con lo que se conoce como grandes modelos lingüísticos, que son sistemas entrenados para reconocer y generar texto. de enormes conjuntos de datos extraídos de la web. Luego pueden sugerir palabras para completar una oración.
En cambio, Siri, Alexa y Google Assistant son esencialmente lo que se conoce como sistemas de comando y control. Pueden comprender una lista finita de preguntas y solicitudes como «¿Cómo es el tiempo en Nueva York?o «Enciende las luces del dormitorio». Si un usuario le pide al asistente virtual que haga algo que no está en su código, el bot simplemente dice que no puede ayudarlo.
Siri también tenía un diseño engorroso que requería mucho tiempo para agregar nuevas funciones, dijo Burkey, a quien se le asignó el trabajo de mejorar Siri en 2014. La base de datos de Siri contiene una lista gigantesca de palabrasincluyendo los nombres de artistas musicales y lugares como restaurantes, en casi dos docenas de idiomas.
Eso lo convirtió en «una gran bola de nieve», dijo. Si alguien quiere agregar una palabra a la base de datos de Siri, agregó, «va a terminar en un montón».
Entonces, las actualizaciones aparentemente simples, como agregar algunas frases nuevas al conjunto de datos, requerirían reconstruir toda la base de datos, lo que podría llevar hasta seis semanas, dijo Burkey. Añadir funciones más complejas, como las nuevas herramientas de búsqueda, podría llevar casi un año. Eso significaba que no había forma de que Siri se convirtiera en una asistente creativa como ChatGPT, dijo.
Alexa y el Asistente de Google se basaron en una tecnología similar a Siri, pero las empresas lucharon por generar ingresos significativos de los asistentes, dijeron exgerentes de Amazon y Google. (En cambio, Apple usó con éxito a Siri para atraer compradores a sus iPhones).
amazon alexa
Después de que Amazon lanzara Echo, un altavoz inteligente con tecnología de Alexa, en 2014, la empresa esperaba que el producto le ayudara a aumentar las ventas en su tienda en línea al permitir que los consumidores hablar con Alexa para hacer pedidosdijo un exlíder de Amazon involucrado con Alexa.
Pero mientras la gente se divertía jugando con la capacidad de Alexa para responder a las indicaciones meteorológicas y configurar alarmas, pocos le pidieron a Alexa que ordenara artículos, agregó.
Es posible que Amazon haya invertido demasiado en la fabricación de nuevos tipos de hardware, como despertadores ahora descontinuados y microondas que funcionan con Alexa, que se vendían por costo o menosdijo el ex ejecutivo.
La compañía también invirtió poco en la creación de un ecosistema para que las personas amplíen fácilmente las capacidades de Alexa, de la misma manera que lo hizo Apple con su App Store, lo que ayudó a impulsar el interés en el iPhone, dijo la persona.
Aunque Amazon ofreció una tienda de «habilidades«Para que Alexa controlara accesorios de terceros, como interruptores de luz, a las personas les resultaba difícil encontrar y configurar habilidades de altavoz, a diferencia de la experiencia fluida de descargar aplicaciones móviles de las tiendas de aplicaciones.
«Nunca tuvimos ese momento de App Store para los asistentes», dice Carolina Milanesi, analista de tecnología de consumo de la firma de investigación Creative Strategies que fue consultora de Amazon.
A finales del año pasado, la división de Amazon que trabajaba en Alexa era uno de los principales objetivos de los 18.000 despidos de la empresa, y varios altos ejecutivos de Alexa han dejado la empresa.
Kinley Pearsall, portavoz de Amazon, dijo que Alexa era mucho más que un asistente de voz y «Somos tan optimistas sobre esa misión como siempre».
Las fallas de Amazon con Alexa pueden haber llevado a Google por mal camino, dice un ex ejecutivo que trabajó en Google Assistant. Los ingenieros de Google pasaron años experimentando con su asistente para imitar lo que podía hacer Alexa, incluido el diseño de altavoces inteligentes controlados por voz y pantallas de tabletas para controlar accesorios para el hogar como termostatos e interruptores de luz.
Más tarde, la empresa integró anuncios en esos productos para el hogarque no se convirtió en una fuente importante de ingresos.
Con el tiempo, Google se dio cuenta de que la mayoría de la gente usaba el asistente de voz solo para una cantidad limitada de tareas simples, como configurar temporizadores y poner música, explicó el ex gerente.
En 2020, cuando Prabhakar Raghavan, un ejecutivo de Google, se hizo cargo de Google Assistant, su grupo volvió a enfocar al compañero virtual como una característica destacada para los teléfonos inteligentes Android.
En enero, cuando la empresa matriz de Google despidió 12.000 empleadosel equipo que trabajaba en sistemas operativos para dispositivos domésticos perdió el 16 % de sus ingenieros.
Muchas de las grandes empresas tecnológicas ahora se apresuran a responder a ChatGPT. En la sede de Apple, la compañía celebró el mes pasado su AI Summit anual, un evento interno para que los empleados aprendan sobre su gran modelo de lenguaje y otras herramientas de IA, dijeron dos personas informadas sobre el programa.
Muchos ingenierosincluidos los miembros del equipo de Siri, han estado probando conceptos de generación de lenguaje cada semana, dijeron las personas.
El martes, Google también dijo que pronto lanzaría herramientas de inteligencia artificial generativa para ayudar a las empresas, los gobiernos y los desarrolladores de software a crear aplicaciones con chatbots integrados y incorporar la tecnología subyacente en sus sistemas.
Según los expertos en IA, las tecnologías de chatbots y asistentes de voz convergerán en el futuro. Eso significa que las personas podrán controlar los chatbots con el habla y aquellos que usan productos de Apple, Amazon y Google podrán pedirles a los asistentes virtuales que los ayuden con sus trabajos, no solo con tareas como verificar el clima.
«Estos productos nunca funcionaron en el pasado porque nunca tuvimos capacidades de diálogo a nivel humano», dijo Aravind Srinivas, fundador de Perplexity, una empresa emergente de inteligencia artificial que ofrece un motor de búsqueda impulsado por chatbot. «Ahora lo hacemos».
Los New York Times