Introducción a la Inteligencia Artificial

Un recorrido desde los fundamentos hasta las técnicas avanzadas de prompting.

Iniciar el Recorrido

I. Los Fundamentos de la IA

1.1. El Test de Alan Turing

Concepto: Una prueba para determinar si una máquina puede exhibir un comportamiento inteligente indistinguible del de un ser humano.

Funcionamiento: Un evaluador humano juzga conversaciones en lenguaje natural entre un humano y una máquina. Si el evaluador no puede distinguir a la máquina del humano, se dice que la máquina ha pasado el test.

Pasar el Test de Turing no significa necesariamente que la máquina "piensa" o es "consciente" de la misma forma que un humano. Lo que demuestra es la capacidad de la máquina para imitar la inteligencia humana en una conversación de manera indistinguible. Se enfoca en el comportamiento externo, en si puede usar el lenguaje, el razonamiento y el conocimiento de una forma que nos parezca humana.

Relevancia: Sentó las bases filosóficas y prácticas para la evaluación de la inteligencia artificial.

Imagina una conversación... ¿Podrías distinguir al humano de la IA? Este test desafió nuestra concepción de inteligencia.

Haz una prueba de audio y escucha la respuesta: Dime si eres capaz de saber si la respuesta la da una máquina...

Foto: Alan Turing

[Imagen de Alan Turing]

1.2. ¿Qué es una Neurona Digital?

Definición: La unidad fundamental de una red neuronal, inspirada en las neuronas biológicas.

Función: Recibe una o más entradas (inputs), les asigna un peso (importancia), las suma y aplica una "función de activación" para producir una salida (output).

Componentes:

Entradas
Pesos
Función de Activación
Salida

[Imagen de Neurona Digital en formato matematico]

1.3. ¿Qué es una Red Neuronal?

Estructura: Un conjunto de neuronas digitales interconectadas en capas (capa de entrada, capas ocultas y capa de salida).

Proceso: La información pasa a través de la red, de capa en capa, donde cada neurona realiza su cálculo. Esta arquitectura permite aprender patrones complejos a partir de los datos.

[Imagen de Red Neuronal]

Las capas procesan información, aprendiendo de forma progresiva.

Ejemplo de paso a paso de una red neuronal

1.4. Diferencia entre procesamiento CPU y GPU

CPU (Unidad Central de Procesamiento) La CPU es el "cerebro" de la computadora. Se encarga de ejecutar la mayoría de las instrucciones de un programa informático, realizando operaciones aritméticas, lógicas y de control de forma secuencial. Es ideal para tareas generales y de propósito único que requieren una baja *latencia por tarea.

*Baja latencia: poco tiempo de demora = proceso rápido. Alta latencia: mucho tiempo de demora = proceso lento.

GPU (Unidad de Procesamiento Gráfico) La GPU es un procesador especializado en el procesamiento de gráficos y tareas que se pueden dividir en miles de operaciones más pequeñas y ejecutarse en paralelo. Su arquitectura le permite realizar muchos cálculos simultáneamente, lo que la hace muy eficiente para renderizado de imágenes, videojuegos, simulaciones científicas y, especialmente, para inteligencia artificial y machine learning.

[Imagen que muestra procesamiento de CPU y de GPU]

El Futuro de la IA - Silicio vs Neuronas Biológicas

La eficiencia energética de las neuronas biolóicas es clave

Científicos Crean un 'Cerebro' que Juega al Pong

1.5. Entrenamiento de las Redes Neuronales

Supervisado
No Supervisado
Por Refuerzo

Supervisado: El modelo aprende a partir de datos etiquetados. Se le muestra un input y el output correcto correspondiente.
Ejemplo: identificar imágenes de gatos a partir de un dataset etiquetado como "gato". [Imagen de Dataset Supervisado]

No Supervisado: El modelo trabaja con datos no etiquetados y busca patrones o estructuras por sí mismo.
Ejemplo: agrupar clientes con comportamientos de compra similares. [Imagen de Aprendizaje No Supervisado]

Aprendizaje por Refuerzo: El modelo aprende a tomar decisiones mediante prueba y error, recibiendo "recompensas" o "castigos" por sus acciones.
Ejemplo: entrenar a una IA para jugar a un videojuego. [Imagen de Aprendizaje por Refuerzo]

Perro robot aprende a caminar en 60 minutos

II. La Revolución del Lenguaje

1.6. Transformers

Paper de Google ("Attention Is All You Need"): Introdujo la arquitectura "Transformer" en 2017, revolucionando el procesamiento del lenguaje natural.

Contexto y Atención: La clave de esta arquitectura es el mecanismo de "atención", que permite al modelo sopesar la importancia de diferentes palabras en una secuencia, capturando el contexto de manera mucho más eficaz que los modelos anteriores.

El mecanismo de atención permite a los modelos "enfocarse" en las partes relevantes de un texto, similar a como lo hacemos los humanos.

[Imagen de Arquitectura Transformer]
Lee el "Paper Attention Is All You Need"
RESUMEN del "Paper Attention Is All You Need"

1.8. LLM (Large Language Model)

Cómo Funcionan: Su tarea principal es predecir la siguiente palabra (o token) más probable en una secuencia.

Evolución:

  • Hace un año: Generaban texto coherente palabra por palabra, enfocándose en la fluidez lingüística.
  • Hoy día: Han evolucionado hacia "modelos de razonamiento", capaces de seguir instrucciones complejas, descomponer problemas y mostrar un pensamiento más estructurado.
[Imagen de los principales llm]

1.9. LLMs Multimodales

Definición: Modelos que pueden procesar y comprender información de múltiples modalidades, no solo texto.

Capacidades:

  • Visión: Interpretar y analizar imágenes y gráficos.
  • Audio: Comprender y transcribir lenguaje hablado.
  • Texto en Contexto: Integrar información visual o auditiva con el texto para una comprensión más profunda.
[Imagen de LLM Multimodal]

La IA ahora puede 'ver' y 'escuchar' además de 'leer'.

III. La Dimensión Visual de la IA

1.10. La Importancia de la Imagen y el Vídeo

Inicios: El reconocimiento de imágenes fue uno de los primeros grandes avances de la IA moderna.

Cómputo: El desarrollo de hardware potente (como las GPUs) ha sido crucial para entrenar modelos capaces de procesar la enorme cantidad de datos que suponen las imágenes y los vídeos.

Modelos de Generación (Imágenes y Vídeos):

Perro robot aprende a caminar en 60 minutos

IV. El Arte y la Ciencia del Prompting

1.11. Estructura de Prompt (Prompt Engineering)

Definición: El arte y la ciencia de diseñar entradas (prompts) efectivas para guiar a los LLMs hacia la respuesta deseada.

Estrategias Clave:

  • Ser asertivo
  • Integrar a la audiencia
  • Dividir tareas
  • Usar ejemplos
  • Frases directas
  • Dar tiempo para pensar
  • Permitir preguntas

Recordatorio Clave: Ningún LLM está entrenado para decir la verdad, sino para generar respuestas que el usuario perciba como satisfactorias.

El Poder del Rol en el Prompting

Influencia: Asignar un rol específico a la IA (médico, historiador, poeta) influye drásticamente en el estilo, tono y tipo de información de la respuesta.

Ejemplos de Roles:

Abogado Profesor Sherlock Holmes Einstein Novelista Músico

Pregunta: "Explícame la importancia del Renacimiento."

Selecciona un rol para ver cómo cambia la respuesta.

Fórmula para un Buen Prompt

Estructura Sugerida:

  1. [Rol]: Define quién quieres que sea la IA.
  2. [Tono]: Define en que tono quieres que la IA hable: Profesional, Amigable, Gracioso, etc.
  3. [Contexto]: Proporciona antecedentes relevantes.
  4. [Tarea]: Especifica qué debe hacer la IA.
  5. [Instrucción]: Detalla cómo realizar la tarea (formato, pasos).
  6. [Clarificación]: Añade ejemplos o restricciones.
  7. [Refinamiento]: Pide a la IA que mejore o evalúe su propia respuesta.

Construir un prompt detallado es como dar un mapa claro a la IA para llegar al tesoro (la respuesta deseada).

Ejemplo de Prompt estructurado

V. Conclusión y Mirada al Futuro

1.12. Conclusión: Maximizando el Potencial de la IA

Síntesis: El dominio del prompting, y en particular de técnicas como la asignación de roles es fundamental para maximizar la utilidad de los LLMs.

Mensaje Final: Estas estrategias transforman a la IA de un simple generador de texto a una poderosa herramienta para el análisis crítico, la resolución de problemas complejos y la innovación.

¡El viaje del conocimiento en IA continúa!

Taller Interactivo: IA y Ofimática

Ofimática con IA

Potencia tu Productividad

Guía Interactiva para Google Workspace y ChatGPT