Volver
Inteligencia Artificial

IA Generativa

Sistemas capaces de crear contenido nuevo — texto, imágenes, código, audio — aprendiendo patrones a partir de grandes volúmenes de datos.

175B+
Parámetros
GPT-3
2017
Año del
Transformer
100M
Usuarios ChatGPT
en 60 días
$1.3T
Mercado IA
proyectado 2032
¿Cómo funciona?
🗄 Datos Terabytes de texto Tokenización Texto → números 🧠 Entrenamiento RLHF + ajuste 💬 Prompt Instrucción usuario Generación Contenido nuevo
Conceptos clave

LLM

Modelos de lenguaje grande entrenados con enormes corpus

Tokens

Unidades mínimas que procesa el modelo

Transformer

Arquitectura con mecanismo de atención

Embeddings

Vectores numéricos de significado semántico

Prompt eng.

Arte de diseñar instrucciones precisas

RAG / Fine-tuning

Personalización y búsqueda externa

Historia de la IA
1950 Test de Turing 1957 Primer perceptrón 1986 Backpropagation 2014 GANs (Goodfellow) 2017 "Attention is All You Need" 2022–hoy Era ChatGPT / Claude Democratización masiva
Tipos de modelos generativos
Modelos de lenguaje 📝 Texto, código, diálogo GPT-4 Claude Llama 3 Modelos de imagen 🖼 Difusión, texto → imagen DALL·E 3 Midjourney Modelos multimodales 🌐 Texto + imagen + audio GPT-4o Gemini 1.5
Servicios AWS para IA generativa
AWS

Amazon Bedrock

Acceso unificado a modelos de Anthropic, Meta, Mistral y más mediante una sola API gestionada.

AWS

Amazon SageMaker

Plataforma MLOps para entrenar, hacer fine-tuning y desplegar modelos con infraestructura escalable.

AWS

Amazon Q

Asistente empresarial de IA generativa integrado con sistemas internos y control de acceso granular.

AWS

Amazon Kendra

Búsqueda inteligente de documentos para implementar arquitecturas RAG sobre bases de conocimiento.

AWS

Trainium + Inferentia

Chips especializados de AWS para entrenar e inferir modelos de IA a menor costo y mayor rendimiento.

AWS

Amazon Titan

Familia de modelos propios: Titan Text para generación y Titan Embeddings para búsqueda semántica.

Ejemplos prácticos y reales

Asistentes virtuales

ChatGPT, Claude y Gemini responden, redactan y resumen documentos al instante

Generación de código

GitHub Copilot y CodeWhisperer sugieren código y detectan bugs en tiempo real

Creación de imágenes

DALL·E 3 y Midjourney generan arte e ilustraciones desde texto natural

Medicina y diagnóstico

Análisis de imágenes médicas y redacción de informes clínicos asistidos por IA

Atención al cliente

Chatbots con LLM que resuelven consultas complejas en lenguaje natural sin humano

Síntesis de voz y video

ElevenLabs genera voces realistas; Sora y Runway crean video desde texto