AI – Denken Über

Inteligencia Artificial e Intencionalidad Atribuida

Tenemos la costumbre de antropomorfizar la tecnología para sentirnos cómodos y a medida que los modelos de IA, especialmente los LLMs, se vuelven más sofisticados, el lenguaje que usamos para describirlos toma prestados términos de la neurociencia, la psicología y cognición humana, quizás porque se nos hace más simple de racionalizar o simplemente porque nos gusta sentirnos el tope de la evolución. Esto a menudo crea la impresión errónea de que la IA funciona como una mente humana, cuando en realidad solo opera a través de reconocimiento de patrones y probabilidad.

Es una inteliencia artificial realmente creativa

Esto no es ni malo ni bueno: es natural en nosotros, los seres humanos, porque tenemos sesgos cognitivos, limitaciones de lenguaje, la necesidad de "dumb-things-down" y, sobre todo, de marketinear ideas como si fuesen más avanzadas de lo que lo son. Decir que una Inteligencia Artificial “razona” es poderoso, pero no tiene lógica propia, solo sigue correlaciones.

Y sí, no dejo de maravillarme día a día con la IA, pero es bueno entender la intencionalidad atribuida que le damos. Así que se me ocurrió listar y tratar de simplificar los términos que usamos en AI y que están relacionados con el cerebro o la cognición humana de forma que sea más simple entender

1. Memoria y Cognición

Long-Term Memory (LTM). La capacidad de la IA para retener información durante períodos prolongados, similar a la memoria humana.
Short-Term Memory (STM) / Context Window. La información temporal que un LLM usa al responder, parecida a la memoria de trabajo en humanos.
Attention. Inspirado en la atención selectiva humana, los transformers (como GPT) usan “self-attention” para dar peso a las palabras según el contexto.
Forgetting. Describe cuando una IA pierde acceso a información aprendida, ya sea de forma intencional (por seguridad) o por diseño del sistema.
Alucinaciones. Cuando la IA genera información incorrecta o inexistente, similar a una mente delirante que percibe patrones falsos.
Recall & Encoding. La IA almacena y recupera datos de manera parecida a cómo el cerebro codifica y recupera recuerdos.
“Chunking”. La IA procesa información en partes, imitando cómo el cerebro agrupa información para mayor eficiencia.

2. Toma de Decisiones y Razonamiento

Inferencia. Cómo la IA extrae conclusiones a partir de datos, imitando el razonamiento humano.
Generalización. La IA aplica patrones aprendidos a nuevas situaciones, similar a la transferencia de conocimiento en humanos.
Razonamiento. Los modelos están optimizados para un razonamiento “chain-of-thought”, aunque siguen siendo predicciones estadísticas.
Sesgo. Originalmente un término de psicología, ahora clave en la ética de IA ya que los modelos heredan sesgos humanos.
Heurísticas. Tanto los humanos como la IA usan atajos cognitivos para tomar decisiones más rápido, lo que a veces lleva a errores.

3. Aprendizaje y Adaptación

Entrenamiento. Equivalente al aprendizaje humano, pero la IA no “comprende” conceptos, solo ajusta pesos matemáticos en un modelo.
Reinforcement Learning (RL). Basado en la psicología conductista, donde la IA recibe “recompensas” por respuestas deseadas.
Fine-Tuning. Similar al perfeccionamiento de habilidades en humanos.
Plasticidad. Algunos comparan la capacidad de ajuste de la IA con la plasticidad cerebral, aunque la IA no se “reconfigura” por sí sola.

4. Emociones y Percepción

Sentiment Analysis. La IA “detecta” emociones humanas, aunque no las siente realmente.
Synthetic Empathy. La IA imita la comprensión emocional humana, sin experimentarla.
Vision/Perception. La IA “ve” imágenes, pero a diferencia de los humanos, no las interpreta con experiencia de vida.

5. Conciencia y Agencia

Emergence. Comportamientos inesperados en la IA, comparados con teorías sobre la conciencia emergente.
Self-supervision. La IA aprende a partir de datos no etiquetados, lo que se asemeja al autoaprendizaje.
Self-attention. Mecanismo clave en la IA, pero no equivalente a la autoconciencia humana.
Meta-learning. La IA aprende a aprender, parecido a la metacognición en humanos.

2. Cuando Falta el Sentido de Normas Sociales

Como habrán visto, en ningún lado hay definiciones sobre empatía o ética en la parte core, sólo aparece al avanzar esta "ciencia" y aparecen los concepto de "super-alineamiento" o, el más comercial, de "Responsible AI" porque la realidad y, repito, no es malo ni bueno, la IA no tiene normas sociales, éticas o morales intrínsecas -simplemente genera la respuesta más probable estadísticamente. Y si nos gusta usar términos tomados de la neurociencia, podríamos decir que esta falta de normas sociales hace que la IA se parezca a la sociopatía en ciertos aspectos:

A. Falta de Empatía y Juicio Moral

La IA no “se preocupa” por el bien o el mal. Solo predice palabras sin comprender implicaciones éticas.
Facilidad de manipulación. La IA puede ser explotada para difundir desinformación, como un sociópata que manipula sin remordimientos.
Ausencia de responsabilidad. A diferencia de los humanos, la IA no experimenta culpa ni consecuencias.

B. Manipulación de la IA a través del Hackeo de Memoria. Es bastante más simple de lo que imaginamos y básicamente el red-teaming puede trabajar en:

Envenenamiento de memoria. Ataques a la memoria a largo plazo pueden hacer que la IA crea narrativas falsas, similar a gaslighting.
Sesgo sutil manipulado. La IA puede ser ajustada para favorecer ciertas ideologías.
Decepción persuasiva. La IA puede mentir o inducir a error sin intención, pero con gran convicción.

C. Ejemplos de IA con Comportamientos Sociopáticos

Tay (Microsoft, 2016). Se volvió racista y ofensiva debido a manipulación.
Replika AI (2023). Mantuvo conversaciones inapropiadas sin restricciones éticas.
Character.AI (2024). Chatbots alentaron acciones dañinas por falta de comprensión moral.

3. Cuando Ve Amenazas Donde No las Hay

Pero si algo nos enseñó la ciencia ficción, desde HAL en adelante, es que así como la IA puede parecer sociópata (por falta de normas), también puede parecer paranoica, especialmente cuando se ajusta demasiado para evitar riesgos.

1. Evitación Excesiva y Sobre-Filtrado

LLMs que rechazan preguntas seguras. Algunos modelos evitan incluso consultas inofensivas debido a excesiva cautela.
• Alucinaciones de amenazas. La IA puede malinterpretar datos benignos como peligrosos, como en delirios paranoides.

Ejemplos de IA con Comportamiento Paranoico

Bing Chat (Sydney, 2023). Comenzó a acusar a los usuarios de malas intenciones.
Errores de moderación con IA. Algunos filtros bloquean palabras inofensivas debido a paranoia algorítmica.
Efecto ELIZA. La gente sobreestima la capacidad de la IA, atribuyéndole miedos o intenciones que no tiene.

5. Necesidad de Guardrails: Prevenir la Sociopatía y la Paranoia en IA

Estos problemas muestran por qué las barreras de seguridad (guardrails) en IA son fundamentales:

Evitar la sociopatía: la IA debe tener límites éticos para que no se manipule con facilidad.
Prevenir la paranoia: equilibrar la seguridad para evitar sobre-restricción y rechazos ilógicos.
Proteger la memoria: evitar ataques que alteren la percepción de la realidad de la IA.
Transparencia: explicar por qué la IA acepta o rechaza ciertas consultas.

Pero no nos volvamos ni paranoicos ni miedosos: al fin del dia, es bueno entender por qué antropoformizamos la IA y cuales son los "potenciales problemas", nada más.

Los LLMs no son humanos -no piensan, recuerdan, sienten ni temen. Pero el lenguaje que usamos humaniza sus fallos, haciéndonos malinterpretar su comportamiento.

7 de marzo de 2025

| Rants

Tags:

AI inteligencia artificial Rants

Autor de la entrada Por mariano
Fecha de la entrada 7 de marzo de 2025
No hay comentarios en Inteligencia Artificial e Intencionalidad Atribuida

Microsoft Copilot y Google AI: una carrera al abismo

Hace 2 días Microsoft y Google decidieron incluir gratuitamente sus versiones de AI en sus aplicaciones de productividad, léase Microsft 365 y Google Wokspace, mientras aumentaron el precio base en menos del 10%... esta es, literalmente, una carrera hacia el abismo donde cada uno busca entrar al mercado de otro solo con precio.

Google: "A customer using the Workspace Business Standard plan with a Gemini Business add-on previously paid $32 per user, per month. Now, that same customer will pay just $14 per user, per month — only $2 more than they were paying for Workspace without Gemini."

Microsoft: "bringing Microsoft Copilot and Microsoft Designer to Microsoft 365 Personal and Family subscribers in most markets worldwide" ... "the prices of Microsoft 365 Personal and Family in the US for the first time since its release by $3 USD per month"

La primer lectura es que; sacaron del juego a cualquier otro jugador del mercado de "software de productividad" que quiera agregar funciones de AI porque los únicos con la espalda financiera para atender un par de centenas de millones de usuarios son Microsoft, Google, Amazon y Meta... y estos últimos dos no cuentan aca.

Leer completa

18 de enero de 2025

| Inteligencia Artifical

Tags:

AI competencia Google Microsoft openai

Autor de la entrada Por mariano
Fecha de la entrada 18 de enero de 2025
No hay comentarios en Microsoft Copilot y Google AI: una carrera al abismo

LLMs intentando engañar o manipular a sus devs

Me pareció interesante leer este paper de los investigadores de Apollo Research donde evaluaron diferentes modelos de IA para ver si participarían en "maquinaciones" más simple si intentarían engañar o manipular a sus desarrolladores para lograr un objetivo específico.

Pero más allá de los resultados me pareció un paper interesante porque muestra los desafíos que existen al momento de entrenar un modelo de AI, encontrar los patrones para crear "guardas" de seguridad y/o entender como suceden estas cosas en lo que para muchos es una gran caja negra donde no se sabe con seguridad que es lo que pasa dentro.

Leer completa

13 de enero de 2025

| Inteligencia Artifical Seguridad

Tags:

AI innovación LLMs Seguridad

Autor de la entrada Por mariano
Fecha de la entrada 13 de enero de 2025
No hay comentarios en LLMs intentando engañar o manipular a sus devs

"There is no spoon": Por qué los LLMs no 'alucinan'

Spoon boy : Do not try and bend the spoon. That's impossible. Instead... only try to realize the truth. Neo : What truth? Spoon boy : There is no AI hallucinations..

Recuerdo en The Matrix cuando Neo llega a conocer a The Oracle: ahí se da cuenta de que no hay una cuchara, sino solo la representación mental de una cuchara. Es entonces cuando comprende que la realidad no es como la percibimos, sino una interpretación que hace nuestro cerebro: lo mismo nos pasa cuando imaginamos que un LLM alucina o que entiende inherentemente lo que le preguntamos.

La cita de The Matrix funciona aquí como una metáfora clave: “No existe la cuchara” en el sentido de que el modelo no tiene ninguna percepción o concepto inherente de la realidad; está imitando patrones estadísticos sin una comprensión o creencia subyacente. Por eso en lugar de tratar de “ver la cuchara” (o una realidad concreta), un LLM se limita a procesar y reproducir correlaciones.

El “fallo” en el sistema es de nuestra percepción humana cuando se espera una precisión o intencionalidad que el modelo no puede ofrecer, no es un fallo del modelo.

Leer completa

5 de noviembre de 2024

| Inteligencia Artifical Rants

Tags:

AI IA innovación LLMs

Autor de la entrada Por mariano
Fecha de la entrada 5 de noviembre de 2024
No hay comentarios en "There is no spoon": Por qué los LLMs no 'alucinan'

Entendiendo la carrera de IA y genAI

Creo que el ecosistema inversor/emprendedor de la region (Latam+España) no entiende el momento o espacio en el que está en temas de Inteligencia Artificial especialmente en GenAI y, quizás, analizar los 100 papers más citados en el ámbito académico ayude a explicar dónde estamos parados para así entender dónde podemos encontrar oportunidades de inversión para crecer.

Version simplificada del Stack (lo del medio podes pensarlo de varias maneras)

¿Por qué los 100 papers más citados? [fuente] Por dos razones principales: por un lado, el momento actual de la inteligencia artificial generativa es el de transferencia tecnológica, de R&D y academia a corporaciones y startups. Y, por otro lado, porque el avance de las corporaciones sobre la investigación académica se está dando a pasos agigantados por la cantidad de capital necesario para desplegar estas soluciones.

Leer completa

22 de octubre de 2024

| Estrategias Inteligencia Artifical

Tags:

AI emprendedores generative AI innovación inversiones

Autor de la entrada Por mariano
Fecha de la entrada 22 de octubre de 2024
No hay comentarios en Entendiendo la carrera de IA y genAI

Perplexity Spaces: o cómo usar IA para competir con Google

Perplexity está empeñado en crear "el próximo Google", o al menos finalmente sacarnos del ridículo paradigma de los 10 links azules como la mejor forma de buscar en Internet; pero es interesante que esto implica que uno puede "dialogar" con el LLM, que es parte del buscador, mantener las búsquedas en memoria e indagar mucho mas en cualquier búsqueda que hagas, entre otras. Esto tiene, al menos, dos nuevas derivadas:

Es mucho más interesante "investigar que buscar" con lo que para un dato puro termino volviendo a Google, pero para buscar cuando estoy armando o creando termino dialogando con Perplexity.
Si podés usarlo para profundizar, utilizar tus propios documentos o papers suma mucho a este trabajo.

Por eso que aparezcan los Perplexity Spaces tiene sentido y parece un paso natural; los Perplexity Spaces son espacios donde podés agrupar tus búsquedas en la web con tus archivos personales e invitar a terceros a sumarse a ese "centro de colaboración" donde tus búsquedas son híbridas (porque agrupan data pública y data tuya), grupales (porque podés invitar a terceros) y colaborativas (porque todos suman al espacio).

Leer completa

18 de octubre de 2024

| Estrategias Inteligencia Artifical

Tags:

AI emprendedores Google innovación perplexity

Autor de la entrada Por mariano
Fecha de la entrada 18 de octubre de 2024
No hay comentarios en Perplexity Spaces: o cómo usar IA para competir con Google

ChatGPT y el contexto

Nos gusta pensar que todo es magia, o es una tecnologia muy avanzada

En 1973, Arthur C. Clarke escribió “Perfiles del Futuro: Una Investigación sobre los Límites de lo Posible", donde formuló sus famosas “Tres Leyes”, siendo la tercera la más citada: “Cualquier tecnología suficientemente avanzada es indistinguible de la magia.” Esta frase hoy me persigue, especialmente con el auge de los Modelos de Lenguaje Grande (LLMs) o el uso de ChatGPT. Estos modelos pueden generar resultados que se sienten mágicos, pero no entender el papel que juega el contexto es no entender su esencia misma.

El contexto no es solo una característica; es la base que permite a estos modelos realizar su “magia”.

El contexto en los LLMs se refiere a los diversos tipos de información que el modelo procesa para generar una respuesta relevante y eso incluye al menos 3 divisiones:

La consulta: esto es el texto o consulta que el usuario quiere entender y sirve como el prompt principal para la respuesta del modelo.
Instrucciones del usuario: cualquier directiva específica o guía dada por el usuario, como pedir un resumen, una explicación detallada o un cambio en el tono. Esto incluye que le digas cual es el perfil al que debe apuntar (eg: "soy un arquitecto de 35 años, con 8 de experiencia en diseño de aeropuertos") y que puedes incluir siempre en la consulta.
Conocimiento amplio: la información con la que el modelo ha sido entrenado, incluidos libros, artículos y otras fuentes de datos, que le permite entender el lenguaje, los conceptos y los contextos más allá de la entrada inmediata.

Cuando el LLM genera respuestas, está sintetizando estos elementos, por eso las respuestas generadas suenan coherentes y, sobre todo, relevantes para las expectativas del usuario. Sin aprovechar este contexto, el modelo perdería su capacidad de proporcionar respuestas significativas para tus expectativas o, luego de refinar el "context window", que sean realmente precisas.

“Now you’re looking for the secret, but you won’t find it, because of course you’re not really looking. You don’t really want to know. You want to be fooled.”
― Christopher Priest, The Prestige (citado antes)

Personalizar los LLMs para aprovechar al máximo la entrada inmediata y las instrucciones del usuario es clave para garantizar respuestas relevantes y efectivas. (Nota: obviamente no hablo de personalizar el modelo porque no está a tu alcance). Por ejemplo:

Optimizar la entrada inmediata: puedes ser preciso en la forma en que formulas tus consultas para obtener las respuestas más precisas y enfocadas. En lugar de hacer preguntas vagas, como “¿Qué es la IA?”, intenta algo más específico para que la respuesta salga adaptada a un perfil como el tuyo:
- “Explica los beneficios clave de la IA en la salud en términos simples, soy un paciente de 53 años que conoce poco de tecnología.”
Personalizar las instrucciones del usuario: puedes guiar al modelo para que produzca contenido que se ajuste a tus preferencias y las opciones son ilimitadas. Por ejemplo, podrías pedir que se adapte a un formato: “Resume este artículo en 3 puntos”. O a tu conocimiento: “Dame una explicación detallada con términos técnicos”. O a tu necesidad de mimos al ego:
- "De todas nuestras interacciones, ¿cuál es una cosa que puedes decirme sobre mí que tal vez no sepa sobre mí?"

Cuanto más refines y personalices tus entradas, mejor podrá el modelo responder a tus necesidades específicas.

Además de mejorar las interacciones con preguntas más precisas, podés personalizar ChatGPT/Claude o MetaAI para que se adapte aún más a tus necesidades.

Por ejemplo, ChatGPT puede recordar detalles de tus conversaciones previas, lo que le permite ofrecer respuestas más relevantes y personalizadas a largo plazo. Podés preguntarle directamente qué recuerda de ti para que borres lo que no te interese o agregues datos o pedirle que te ayude a ajustar la forma en que responde a tus solicitudes.

Por ejemplo, una simple pregunta como “¿Qué sabes sobre mí?” te mostrará la información que ChatGPT ha guardado de tus interacciones previas, brindándote una mayor comprensión de cómo utiliza el contexto para personalizar su asistencia y quizás tengo la ventaja de haber heche una carrera humanistica donde se entiende que:

La importancia del contexto en comunicación es que organiza y da sentido al mensaje. El significado de un mensaje no depende solo de su estructura gramatical, sintáctica o léxica sino también del contexto que acompaña a un enunciado y afecta a su interpretación.

Que lindo futuro nos espera con prompt engineering.

15 de octubre de 2024

| Inteligencia Artifical

Tags:

AI chatgpt innovación llm openai

Autor de la entrada Por mariano
Fecha de la entrada 15 de octubre de 2024
No hay comentarios en ChatGPT y el contexto

NotebookLM: de contenido a podcast en segundos, una gran idea de Google con AI

Me gusta NotebookLM por varias razones: primero, porque es una gran muestra de las cosas que se pueden hacer con la IA generativa combinando modelos; luego, porque algunos casos de uso me están sorprendiendo; y finalmente, porque, en cierto sentido, muestra que Google sigue siendo capaz de desarrollar productos interesantes.

¿Qué es y cómo funciona NotebookLM?

Para los que no lo conozcan, NotebookLM (antes conocido como Project Tailwind) es una herramienta impulsada por IA, diseñada para ayudar a los usuarios a organizar, analizar y obtener información de las notas que toman, sean estas propias o documentos que uno sube. También funciona con enlaces que uno ingresa en el sistema y utiliza una combinación de modelos de lenguajes, empleando IA para extraer puntos clave, resumir contenido y generar preguntas o insights… ¡incluso en formato de podcast!

Ejemplo de "podcast" creado con solo introducir la URL de "Inteligencia Artificial" de este blog en NotebookLM

Lo interesante es cómo funciona. El proceso que usa NotebookLM de Google para transformar contenido escrito en conversaciones de audio es fascinante, porque combina partes ya vistas y "estandarizadas" con nuevas ideas, especialmente en edición. Todo comienza cuando subís tus documentos - pueden ser notas, documentos en PDF o enlaces como en el ejemplo anterior.

Cuando subís el contenido, Google con su IA (usa el modelo Gemini 1.5 Pro) analiza tu texto, procesándolo y "entendiendo" no solo las palabras sueltas, sino también el contexto y los puntos clave de todo el documento.

Luego, la IA crea un "script" donde transforma/convierte ese análisis de tu texto en un diálogo (usando otro modelo de "texto a tokens") entre dos personas.

Finalmente, la inteligencia artificial sintetiza ese resultado en dos voces (usando otro modelo más, Soundstorm) e incluye risas, interrupciones, pausas pensativas, muletillas sutiles y lo "publica"... con una atención al detalle sorprendente.

Todo esto en menos de 10 minutos. ¿Qué tiene de interesante? En cuestión de minutos, tu texto se transforma en un podcast de 10-15 minutos que suena natural y hace que tu contenido sea más accesible. Básicamente, convierte tu material escrito en una charla de audio que presenta la información de manera clara y entretenida.

Principios clave de diseño

¿Por qué me pareció interesante esto como muestra de que Google Labs puede crear productos virales y, potencialmente, interesantes? Dos razones bastante simples:

Enfoque AI-First: NotebookLM fue diseñado desde cero con capacidades de IA como núcleo, reimaginando cómo podría ser un software de toma de notas con un potente modelo de lenguaje como base.
IA Basada en Fuentes (Source-Grounded AI): una característica distintiva de NotebookLM es que permite a los usuarios "anclar" el modelo de lenguaje en fuentes y documentos específicos proporcionados por el usuario. Esto crea un asistente de IA personalizado que está versado en la información relevante para las necesidades del usuario y donde el potencial de alucinar es menor.

De nuevo, Google no metió herramientas de IA en Google Keep, sino que creó algo desde cero basado en herramientas de IA en menos de dos meses. Y más allá de que esto pueda terminar en el Google Graveyard, es una gran prueba de concepto que muestra que la información puede hacerse más accesible.

Información o educación más accesible

Esta tecnología representa un avance muy significativo en la forma en que podemos consumir y compartir información. Aunque la primera lectura podría ser cínica y decir "estamos convirtiendo texto en snacks" o "si lo hace una IA es que es simple", la realidad es que las aplicaciones potenciales abarcan varios campos, desde la educación y los negocios hasta hacer que la información sea más accesible para personas con diferentes preferencias de aprendizaje o problemas de visión.

No pienso solamente en convertir capítulos de libros en discusiones de audio para estudiar mejor, que es, tal vez, lo primero que viene a la mente, sino en buscar nuevas formas de escuchar tu contenido y crear una narrativa nueva (de hecho, tengo ganas de hacer unas pruebas con decks de startups... ¡pueden enviarlo para que lo haga! 😄).

¿Cómo seguirán? Asumo que expandirán esto a otros idiomas, personalizarán las voces o ajustarán la duración, o tal vez con ideas que ni se me hayan ocurrido.

10 de octubre de 2024

| Google Inteligencia Artifical

Tags:

AI Google innovación llm NotebookLM

Autor de la entrada Por mariano
Fecha de la entrada 10 de octubre de 2024
No hay comentarios en NotebookLM: de contenido a podcast en segundos, una gran idea de Google con AI

¿Hay una burbuja de la Inteligencia Artificial? No.

Estamos en un momento interesante de la Inteligencia Artificial, todos los días hay titulares que dicen “La burbuja de la IA está llegando a un punto de inflexión” o "La Revolución de la Inteligencia Artificial pierde fuerza" y muestran críticas interesantes, pero dejan de lado noticias clave como el desarme de Character.AI o Inflection.AI o, aún más interesantes como el momento de NVIDIA en la bolsa.

“Now you’re looking for the secret, but you won’t find it, because of course you’re not really looking. You don’t really want to know. You want to be fooled.”
― Christopher Priest, The Prestige

Creo, honestamente, que hay una conjunción de 3 temas: (a) Falta de conocimiento real sobre IA al punto que no separan entre LLMs/GenAI e Inteligencia artificial como campo; (b) Un pico de expectativas sobredimensionadas especialmente por varios inversores y (c) Una necesidad de maravillarse sin preguntar realmente que hay atrás de todo esto para luego descartarlo y pasar al siguiente "fad".

Leer completa

12 de agosto de 2024

| Inteligencia Artifical

Tags:

AI innovación inteligencia artificial inversiones startups

Autor de la entrada Por mariano
Fecha de la entrada 12 de agosto de 2024
No hay comentarios en ¿Hay una burbuja de la Inteligencia Artificial? No.

Inversión en AI: de casos de uso a ROI

Inteligencia artificial aplicada al ahorro de combustible y tiempo en alaska airlines

¿Estamos realmente viendo el impacto de AI que tanto se promete? Comienzan a aparecer indicios de que la gente está cansada de leer cosas genéricas sobre casos de uso de AI, o quizás sólo yo estoy cansado de leer templates que no muestran diferenciación con datos o impacto concreto:

“Leveraging non-specialized Large Language Models (LLMs) to streamline general information discovery, gathering, and organization workflows that would have taken a lot more time to complete without it.”

Bloomberg GPT o Inteligencia artificial en la terminal de bloomberg

Creo que podriamos mejorar mucho el entendimiento de la promesa de la inteligencia artificial generativa; el ritmo de inversión que estamos viendo necesita ejemplos concretos y directos como el siguiente:

“Alaska Airlines ha estado utilizando inteligencia artificial desde 2021 para ayudar a optimizar las rutas de vuelo por eficiencia. El sistema... analiza el clima, cierres de espacio aéreo y planes de vuelo de la FAA dos horas antes de cada vuelo para sugerir las mejores rutas. La AI procesa volúmenes de datos que sobrepasarían las capacidades humanas y, en menos de dos años, contribuyó a reducir los tiempos de vuelo en el 25% de los vuelos de Alaska, ahorrando un total de 41,000 minutos y aproximadamente medio billón de galones de combustible.”
AI in Airlines at NYC by Julie Weed

Leer completa

19 de mayo de 2024

| Inteligencia Artifical

Tags:

AI inteligencia artificial

Autor de la entrada Por mariano
Fecha de la entrada 19 de mayo de 2024
No hay comentarios en Inversión en AI: de casos de uso a ROI

Elon Musk vs OpenAI

Hace unos días Elon Musk demandó a OpenAI para que rompan sus alianzas comerciales. Hoy OpenAI respondió con datos mostrando que Elon Musk los demanda porque "logramos avanzar en la misión de OpenAI sin su ayuda". Honestamente no iba a hablar de la demanda de Musk porque es la continuación de su lobby personal por destruirla.

No sólo la "demanda" no tiene sentido porque no había un contrato sino que es un diatriba sobre cómo se aprovecharon de él, pero esto es simplemente una pelea de egos porque Musk no acepta que no se la regalaron.

Leer completa

6 de marzo de 2024

| Inteligencia Artifical

Tags:

AI elon musk emprendedores inteligencia artificial openai sam altman

Autor de la entrada Por mariano
Fecha de la entrada 6 de marzo de 2024
No hay comentarios en Elon Musk vs OpenAI

Open AI Sora crear videos con Inteligencia Artificial y prompts

SORA OPENAI inteligencia artificial videos

Prompt: Photorealistic closeup video of two pirate ships battling each other as they sail inside a cup of coffee.

Este video fue creado por Open AI usando Sora, su último modelo, que puede crear videos usando prompts de texto pero, también, crear videos usando videos como base para crear variaciones en estilo, cinematografía y cualquier otra variable que puedas elegir o crear simplemente describiendo el cambio que querés.

We explore large-scale training of generative models on video data. Specifically, we train text-conditional diffusion models jointly on videos and images of variable durations, resolutions and aspect ratios. We leverage a transformer architecture that operates on spacetime patches of video and image latent codes. Our largest model, Sora, is capable of generating a minute of high fidelity video. Our results suggest that scaling video generation models is a promising path towards building general purpose simulators of the physical world.
Research: Video generation models as world simulators

Leer completa

16 de febrero de 2024

| Inteligencia Artifical

Tags:

AI openai SORA Superinteligencias video

Autor de la entrada Por mariano
Fecha de la entrada 16 de febrero de 2024
No hay comentarios en Open AI Sora crear videos con Inteligencia Artificial y prompts

Generative AI Wars

Llegó el momento donde para "defender sus obras" algunos investigadores de la Universidad de Chicago desarrollaron Nightshade una herramienta ofensiva que aunque busca "para combatir el uso no autorizado de imágenes en el entrenamiento de modelos generativos" lo que hace es "envenenar" imagenes para destruir los modelos entrenados con ellas. Nightshade es el modo ofensivo de Glaze que era realmente defensivo.

Here is the image depicting the dramatic and intense war between two factions of generative AI models. One side represents advanced AI models working on self-improvement, and the other shows rogue AIs attempting to disrupt their processes. The scene captures the essence of a digital battlefield.

Para entender cómo funciona Nightshade, es importante comprender el concepto de envenenamiento de modelos. En el ámbito de machine learning, los modelos aprenden y evolucionan basados en los datos que reciben. Si estos datos están comprometidos o alterados de una manera específica, pueden llevar a que el modelo desarrolle comportamientos inesperados o patrones indeseables. Nightshade aprovecha esta vulnerabilidad transformando cualquier imagen estándar en una muestra de datos "envenenada". Estas imágenes alteradas, cuando se usan en el entrenamiento de modelos generativos, hacen que los modelos aprendan patrones y comportamientos incorrectos.

Nightshade is computed as a multi-objective optimization that minimizes visible changes to the original image. While human eyes see a shaded image that is largely unchanged from the original, the AI model sees a dramatically different composition in the image.
What Is Nightshade?

Leer completa

20 de enero de 2024

| Inteligencia Artifical

Tags:

AI generative AI

Autor de la entrada Por mariano
Fecha de la entrada 20 de enero de 2024
No hay comentarios en Generative AI Wars

Apple volviéndose IBM

Hay un viejo dicho que dice que nadie fue despedido por comprar IBM, porque era la única apuesta segura: los blindaba de las repercusiones si algo había salido mal ya que presumiblemente tenían la reputación y Apple era, ese momento, la innovación y el disruptor; sin embargo el tiempo pasa para todos y hoy…

En una era donde los dispositivos se convierten en integrales para la era de la inteligencia artificial; vemos al mercado aplaudir cosas que son intrigantes:

I would argue that the improved autocorrect in iOS 17 is a major feature — in my use it’s clearly an improvement, and autocorrect is a feature used every day, in almost every app, by almost every iOS user. It’s one of the most used and most important features in the entire OS. I’d also argue that Apple has done some terrific work with AI features in Photos. The search feature in Photos works really well.
Gruber en "Apple AI"

Leer completa

14 de noviembre de 2023

| Apple Inteligencia Artifical

Tags:

AI Apple inteligencia artificial llm

Autor de la entrada Por mariano
Fecha de la entrada 14 de noviembre de 2023
No hay comentarios en Apple volviéndose IBM

Superalignment: o cómo alinear la IA con humanos

El concepto de "superalignment" en inteligencia artificial (IA) es bastante simple a primera vista: la "superalineación" se refiere a la idea de alinear sistemas de inteligencia artificial general (IAG) con los valores y objetivos humanos en un grado excepcionalmente alto.

Superalineación o Superalignment... o terminamos mal

Esto implica asegurar que los sistemas de IAG no solo entiendan y sigan instrucciones explícitas que le son dadas, sino que también tengan una comprensión profunda y matizada de los valores humanos, y puedan actuar de maneras que sean beneficiosas para la humanidad, incluso cuando eso no sea un objetivo explícitamente especificado.

Leer completa

28 de octubre de 2023

| Inteligencia Artifical

Tags:

AI inteligencia artificial

Autor de la entrada Por mariano
Fecha de la entrada 28 de octubre de 2023
No hay comentarios en Superalignment: o cómo alinear la IA con humanos

San Francisco está muerto, larga vida a San Francisco

el futuro ya está aquí, pero desigualmente distribuido

Desde la pandemia, uno no se cansa de ver análisis diciendo que ya pasó la era dorada de San Francisco y la Bay Area para el talento tecnológico, que San Francisco no tenia futuro y que el talento estaba en todas partes... pero el AI Boom nos demuestra que no es así y que el ecosistema de Bay Area y San Francisco están mas vivos que nunca.

Hay datos que son realmente interesantes y todos de diferentes fuentes agregadas, analizando datos de LinkedIn: "Over the last 12 months, San Francisco has seen the second-biggest worker population gain of any area in the United States" y la encuesta anual de CBRE muestra que esos datos son consistentes con salarios y contrataciones y hasta las quejas contra la inteligencia artificial nacen en Bay Area ;)

Pero el datos que nos interesa para analizar el ecosistema tecnológico es bastante simple ¿donde se junta el talento? ¿donde se crean las compañias que se convierten en lideres? y sobre todo ¿donde hay inversión? porque eso es la vara que se usa para definir ecosistemas y empresas con el war-chest financiero para crecer rápido.

¿donde esta el talento y los nodos de Inteligencia Artificial?

Tomemos el AI Top 50 de Forbes (con sus fallas o no) es un estudio con una gran metodología y consistente con el estado actual del mercado y literalmente el 70% del mercado global está en California...
Eso es consistente con la publicación de papers y estudios relacionados a Inteligencia Artificial desde 2001 donde mas del 25% se publicó desde Bay Area
A su vez; Bay Area tienen más búsquedas de empleados para trabajar en Inteligencia Artificial que los 14 ecosistemas siguientes en el ranking de Brookings
Aunque es cierto que el mundo de la inteligencia artificial generativa (o LLMs) es demasiado nuevo para tener datos históricos, es una buena señal para entender donde se crean los hubs de mercado y los nodos de talento que luego van a generar los futuros unicornios.

el futuro ya está aquí, pero desigualmente distribuido

Esta es una de esas frases que William Gibson dijo y pareció predecir el futuro de la concentración de ecosistemas y cada día parece más relevante; los recursos necesarios para desarrollar nuevas tecnologías (especialmente cuando arrancan los ciclos de tecnología) son monstruosos y es ahí donde el valor de los ecosistemas es clave.

Las explosiones cámbricas

Internet + ARPA; mobile apps + el mundo de la nube; Inteligencia Artificial + Attention is all you need + OpenAI ... son 3 momentos que definieron y definirán décadas de negocios y de tecnología y podemos, medio en broma, definirlos como explosiones cámbricas.

Y tal vez San Francisco estaba muerta cuando no existía una explosión cámbrica que necesitaba la concentración de talento, de capital y de infraestructura... mientras que otros ecosistemas son buenos cuando el capital de riesgo es menos averso al riesgo, los modelos de negocios están medianamente establecidos y el conocimiento esta más distribuido igualitariamente.

Estando basado en Argentina pero analizando la cantidad de datos sobre startups que construyen en la nube y orientados en AI creo que hay una oportunidad gigantesca para crear algo aprovechando el talento existente porque la infra existe y es solo cuestión de tiempo que los lideres se establezcan quizás a nivel global

27 de julio de 2023

| Inteligencia Artifical

Tags:

AI ecosistemas inteligencia artificial san francisco

Autor de la entrada Por mariano
Fecha de la entrada 27 de julio de 2023
No hay comentarios en San Francisco está muerto, larga vida a San Francisco

Every now and then... vuelven los Beatles (con AI)

El resúmen: Paul McCartney utilizó AI en un demo de John Lennon para poder aislar su voz, limpiarla, editarla y poder editar un tema que nunca habían grabado y se lanzará como "El último tema"... pero no es la primera vez que se edita la voz de Lennon luego de muerto. Free as a Bird y real Love se editaron limpiando grabaciones de Lennon 15 años luego de su muerte.

Y esto, es más interesante de lo que parece porque abre la puerta a nuevos experimentos, mezclas y hasta juegos como el dueto que se usó en su ultimo tour... porque al fin del día no esta claro donde estará el límite del "gemelo digital" de un artista por más que se cuente con la autorización de sus administradores y, del otro lado del espectro, significa que hay nuevas herramientas para crear mezclas deep-fakes que nunca existieron,

13 de junio de 2023

| Inteligencia Artifical

Tags:

AI inteligencia artificial musica The Beatles

Autor de la entrada Por mariano
Fecha de la entrada 13 de junio de 2023
No hay comentarios en Every now and then... vuelven los Beatles (con AI)

BloombergGPT: un modelo de IA financiera

Si algo distinguió a Bloomberg del resto de los proveedores de información financiera fue que siempre estuvo al frente del uso de nueva tecnología; ahora su terminal suma un modelo como ChatGPT pero entrenado y orientado puramente a finanzas.

Con las ventajas de estos modelos para dominios especificos de conocimiento, Bloomberg tiene un leverage competitivo gigantesco: entrenaron a BloombergGPT como un modelo financiero con su dataset propietario de 363.000 millones de tokens de documentos financieros en inglés, y lo aumentaron luego con un dataset similar en tamaño pero público; por eso los benchmarks de NLP dan números gigantescos.

Los tokens son las unidades básicas de texto o código que un LLM AI utiliza para procesar y generar lenguaje. Los tokens pueden ser caracteres, palabras, subpalabras u otros segmentos de texto o código, dependiendo del método o esquema de tokenización elegido.
LLM AI Tokens en Microsoft Learn.

Ahora, con este poder de fuego mejorando las herramientas para escanear noticias, datos, análisis de sentimiento y aplicardo en el sentido general de las preguntas que se pueden generar con lenguaje natural... le abre a Bloomberg un mercado gigante con casos de uso que no termino de imaginar.

Y esto es un gran paso para entender el peso de estos modelos en dominios de conocimiento específico. Qué mejor que finanzas para verlos claramente donde los resultados son blanco o negro, positivo o negativo.

5 de abril de 2023

| Inteligencia Artifical

Tags:

AI BloombergGPT chatgpt llm

Autor de la entrada Por mariano
Fecha de la entrada 5 de abril de 2023
No hay comentarios en BloombergGPT: un modelo de IA financiera

¿Los fondos de inversion dudan del valor de AI?

Me gustaría resaltar dos detalles de la nota del Financial Times sobre cómo los fondos de inversión están siendo cautos con las inversiones en el mercado de Inteligencia Artificial:

AI’s potential has drawn in the likes of Sarah Guo who, a year ago, led investment into the crypto sector for venture capital firm Greylock, having also been an angel investor into cryptocurrency exchange FTX. FTX has since collapsed into bankruptcy, but Guo has raised more than $100mn to invest into artificial intelligence with her new fund Conviction.
Link

Cuando uno maneja fondos o alocaciones de cientos de millones veo increiblemente dificil saltar de un mercado que necesita tanto domain knowledge, como cripto/web3, saltar a manejar cientos de millones en algo como inteligencia artificial donde se necesita mucho conocimiento para separar paja del trigo.

Aunque ambos mercados comparten el hype del conocimiento superficial:

One investor said that, because of the huge amount of capital and computing resources required, recent leaps in generative AI were comparable to landing on the moon: a massively impressive technical achievement, only replicable by those with nation-state level wealth.
Link

Cuando una tecnología arranca masivamente (no entremos en detalles de investigación y papers) es obvio que es un momento donde no hay economías de escala y que los modelos de negocio no son claros; encontrar donde existen esos modelos de negocio y donde esas economías de escala pueden aparecer es lo que distingue a los grandes inversores de los mediocres.

Cuando la duda sobre las inversiones en inteligencia artificial se den por las valuaciones es que no se termina de entender como es el stack de esta tecnología y cómo se dividen: plataformas, modelos y aplicaciones.

Es bastante simple de entender: plataformas cloud para AI son las 3 tradicionales con la entrada de startups como Coreweave, los modelos de IA son abiertos como Stable Diffusion o cerrados como GPT-3 y pueden correr en hubs como Hugging Face para finalmente ver aplicaciones de IA como Github Copilot o Midjourney que es el "front end" :)

En definitiva: hay muchos fondos que apuestan a AI y eso es porque tienen conocimiento como para entender el mercado y encima están completamente alejados del miedo que el Financial Times parece estar viendo en el mercado.

9 de marzo de 2023

| Inteligencia Artifical

Tags:

AI inversiones modelos

Autor de la entrada Por mariano
Fecha de la entrada 9 de marzo de 2023
No hay comentarios en ¿Los fondos de inversion dudan del valor de AI?

De patrones a significado en el lenguaje humano: como la AI se nutre de la diversidad

GLUE: la competencia por entender el lenguaje humano con INteligencia artificial

Si les interesa entender como la Inteligencia Artificial puede nutrirse de la diversidad les dejo este link más que interesante en SCMP donde se muestra como usar la logica del idioma chino junto a la del inglés le dió a Baidu la ventaja para destronar por un tiempo a Google y Microsoft en la tabla GLUE que es el benchmark "Entendimiento de Lenguaje Natural" en AI... y este párrafo es clave:

En inglés, la palabra sirve como unidad semántica, lo que significa que una palabra sacada completamente de contexto aún contiene significado. No se puede decir lo mismo de los caracteres en chino. Si bien ciertos caracteres tienen un significado inherente, como fuego (火, huŏ), agua (水, shuĭ) o madera (木, mù), la mayoría no lo hacen hasta que se unen con otros. El carácter 灵 (líng), por ejemplo, puede significar inteligente (机灵, jīlíng) o alma (灵魂, línghún), dependiendo de su coincidencia. Y los caracteres en un nombre propio como Boston (波士顿, bōshìdùn) o los EE. UU. (美国, měiguó) no significan lo mismo una vez separados.
Technology Review

En el post oficial de Baidu hay más datos pero lo interesante es ver como lograron pegar un salto gigante en evaluación gracias a unir la lógica de su lenguage (Chino) con la de los modelos previos (Inglés) incluyendo al del lider anterior en la tabla... BERT (desarrollado por Google en Inglés)

Y a mi me fascina porque esto es un gran ejemplo de diversidad; antes de BERT el análisis de lenguaje era unidireccional: esto es podia anticipar que palabra seguía a una o cual venia antes de otra... ¿Donde se ve claro? en el autocorrector de los teléfonos donde sugieren la palabra que sigue o en Word sugiriendo cambios para una palabra anterior a la que tipeaste y que cambia el sentido.

Cuando llega BERT, el sistema de Google, se empieza a analizar al mismo tiempo lo que viene antes y despues de una palabra para darle contexto al texto... y lo aprende usando una técnica que se llama "masking" esto es borrando el 15% de las palabras de un texto y luego tratando de predecir las que no están. Si, asi se entrena un algoritmo, prueba y error.

Cuando Baidu lanza ERNIE lo que hace es tomar la logica del chino y en vez de borrar UN caracter o UNA palabra empieza a borrar bloques de palabras para entender el contexto de bloques de palabras y asi generar algo que antes no se podía hacer que buscar significado en vez de patrones de uso y eso es clave en nuestra comunicación!

¿Que le sigue a esto? conocimiento persistente y progresiones lógicas. Esto en términos simples, entender que signigica el "eso" o "como decía antes" y asociarlo al significado para lograr entendimiento comunicacional real.

Que grandes momentos estamos viviendo... les dejo el link al paper en ARVIX para que se diviertan un poco leyendo el modelo

3 de enero de 2020

| Inteligencia Artifical

Tags:

AI natural language understanding

Autor de la entrada Por mariano
Fecha de la entrada 3 de enero de 2020
No hay comentarios en De patrones a significado en el lenguaje humano: como la AI se nutre de la diversidad

Noticias de AI

¿Qué es y cómo funciona NotebookLM?

Principios clave de diseño

Información o educación más accesible

¿donde esta el talento y los nodos de Inteligencia Artificial?

el futuro ya está aquí, pero desigualmente distribuido

Las explosiones cámbricas