Diccionario esencial de IA
83 términos clave para entender la conversación sobre inteligencia artificial en 2026 — explicados en cristiano.
LLM
Large Language Model. Modelo entrenado con cantidades masivas de texto para predecir la siguiente palabra. ChatGPT, Claude y Gemini son LLMs.
Transformer
Arquitectura de red neuronal introducida por Google en 2017 (paper «Attention is all you need»). Base de prácticamente todos los LLMs modernos.
Fine-tuning
Reentrenar un modelo preexistente con datos específicos para especializarlo en una tarea o estilo concreto.
RAG
Retrieval-Augmented Generation. Técnica donde el modelo busca información en una base externa antes de responder, reduciendo alucinaciones.
Hallucination
Cuando un modelo inventa información falsa pero la presenta con confianza. Riesgo central de los LLMs.
Token
Unidad mínima que procesa un LLM. Aproximadamente 0.75 palabras en inglés. Los modelos cobran y limitan por tokens.
Embedding
Representación numérica de texto en un espacio vectorial. Permite buscar por significado en lugar de por coincidencia literal.
Prompt Engineering
Arte de formular instrucciones para obtener el mejor output de un LLM. Incluye rol, contexto, restricciones y formato.
Zero-shot
Hacer que un modelo realice una tarea sin darle ejemplos previos. La habilidad emergente más sorprendente de los LLMs.
Few-shot
Darle al modelo 2-5 ejemplos del output deseado dentro del propio prompt para que clone el patrón.
RLHF
Reinforcement Learning from Human Feedback. Técnica para alinear el comportamiento del modelo con preferencias humanas. Es lo que hizo a ChatGPT viable.
Diffusion Model
Modelo que aprende a generar imágenes partiendo de ruido aleatorio y refinándolo paso a paso. Base de Midjourney, DALL-E y Stable Diffusion.
LoRA
Low-Rank Adaptation. Técnica eficiente para fine-tunear modelos enormes ajustando solo una pequeña matriz de pesos.
Quantization
Reducir la precisión numérica de un modelo (de 32-bit a 8-bit o 4-bit) para que ocupe menos memoria y corra más rápido.
Multimodal
Modelo que procesa varios tipos de datos a la vez: texto, imagen, audio, vídeo. GPT-4o, Claude Sonnet 4.5 y Gemini son multimodales.
Agent
Sistema IA que ejecuta tareas de varios pasos de forma autónoma: investiga, decide, llama a APIs, escribe código. Cursor Composer y Devin son ejemplos.
Chain of Thought
Técnica de prompting donde se pide al modelo «pensar paso a paso» antes de responder. Mejora drásticamente el razonamiento complejo.
Temperature
Parámetro que controla la aleatoriedad de las respuestas (0 = determinista, 1 = creativo). 0.7 es el valor más común.
Top-p
Parámetro alternativo a Temperature: el modelo solo elige entre las palabras cuya probabilidad acumulada llegue a p (ej. 0.9 = el 90% más probable).
Context Window
Cantidad máxima de tokens que un modelo puede «recordar» en una conversación. Claude Sonnet 4.5: 200K. Gemini Advanced: 2M.
Inference
El acto de ejecutar un modelo entrenado para obtener una respuesta. Distinto del training (entrenarlo).
Benchmark
Test estandarizado para medir capacidad de un modelo: MMLU (conocimiento general), HumanEval (código), GSM8K (matemáticas), etc.
GGUF
Formato de archivo para almacenar modelos cuantizados, optimizado para inferencia local en CPU/GPU. Reemplazó al antiguo GGML.
Tokenizer
Componente que parte texto en tokens. Modelos distintos usan tokenizers distintos, por eso un mismo texto tiene longitudes diferentes según el modelo.
Attention
Mecanismo que permite al modelo «mirar» a otras partes del texto al procesar cada palabra. El corazón del Transformer.
GPT
Generative Pretrained Transformer. Familia de modelos de OpenAI: GPT-3.5, GPT-4, GPT-4o, GPT-4.1.
BERT
Modelo Transformer de Google (2018) optimizado para entender texto (no generar). Sigue siendo la base de Google Search en 2026.
Stable Diffusion
Modelo de generación de imagen de código abierto, ejecutable en local. Rival open-source de Midjourney y DALL-E.
GAN
Generative Adversarial Network. Dos redes que compiten: una genera, otra discrimina. Precursora de los diffusion models para imagen.
Neural Network
Sistema de cómputo inspirado en el cerebro: nodos («neuronas») conectados por pesos ajustables. Base de todo el deep learning moderno.
Modelo base
Modelo entrenado en datos masivos sin ajuste para una tarea específica. GPT-4o y Claude 3 son modelos base antes de añadir instrucciones de sistema.
Modelo de razonamiento
LLM diseñado para pensar paso a paso antes de responder. o1 de OpenAI y Claude 3.7 Sonnet son ejemplos. Más lento pero más preciso en problemas complejos.
Parámetros
Los números internos que un modelo ajusta durante el entrenamiento. Más parámetros implica mayor capacidad potencial. GPT-4 tiene estimados 1,8 billones de parámetros.
Mixture of Experts (MoE)
Arquitectura que divide el modelo en submodelos especializados y activa solo los relevantes por consulta. GPT-4 y Mixtral usan MoE para ser más eficientes.
Modelo open source
Modelo cuyo código y pesos son públicos. Llama 3 (Meta) y Mistral son los más conocidos. Puedes ejecutarlos localmente sin pagar por API.
Modelo propietario
Modelo cuyo código o pesos no son públicos. GPT-4o, Claude y Gemini son propietarios. Accedes solo vía API o interfaz del proveedor.
SLM (Small Language Model)
Modelo de lenguaje pequeño diseñado para correr en dispositivos con poca memoria. Phi-3 de Microsoft y Gemma de Google son SLMs capaces de funcionar en móviles.
Pre-entrenamiento
Primera fase del entrenamiento donde el modelo aprende a predecir texto a partir de enormes conjuntos de datos de internet, libros y código.
Instruction tuning
Ajuste fino donde se entrena al modelo para seguir instrucciones en formato pregunta-respuesta. Convierte un modelo base en un asistente útil.
DPO (Direct Preference Optimization)
Alternativa más eficiente a RLHF para alinear modelos con preferencias humanas. Muchos modelos open source modernos usan DPO en lugar de RLHF.
Synthetic data
Datos de entrenamiento generados por IA en lugar de recogidos de humanos. Usado para entrenar modelos cuando los datos reales escasean o son costosos.
API (Application Programming Interface)
Interfaz que permite a tu aplicación enviar texto a un modelo y recibir respuestas. Pagas por tokens consumidos. OpenAI, Anthropic y Google ofrecen APIs de sus modelos.
Latencia
Tiempo que tarda el modelo en empezar a responder. Crítico en aplicaciones de tiempo real. Groq destaca por latencia ultra-baja usando hardware especializado (LPU).
Coste por token
Precio que cobra la API por cada mil tokens procesados. GPT-4o Mini cuesta ~0,15 dólares por millón de tokens. Clave para calcular el ROI de tu aplicación.
Self-hosting
Ejecutar un modelo en tu propia infraestructura en lugar de usar la API de un proveedor. Más control y privacidad, pero requiere GPU y conocimientos técnicos.
System prompt
Instrucciones que defines para el modelo antes de la conversación. Establece su rol, tono y restricciones. Invisible para el usuario final en la mayoría de apps.
In-context learning
Capacidad del LLM de aprender de ejemplos dentro del propio prompt sin reentrenamiento. Cuantos más ejemplos incluyes (few-shot), mejor sigue el patrón.
Prompt injection
Ataque donde un usuario intenta sobreescribir el system prompt para hacer que el modelo ignore sus instrucciones. Principal vulnerabilidad de seguridad en apps con LLMs.
Jailbreak
Técnica para evadir las restricciones de seguridad de un modelo mediante instrucciones engañosas. Los proveedores parchean continuamente estos intentos.
Grounding
Proceso de anclar las respuestas del modelo a hechos verificables, normalmente mediante RAG o búsqueda web en tiempo real. Reduce alucinaciones drásticamente.
Agentic AI
IA que no solo responde preguntas sino que toma acciones autónomas: busca en internet, ejecuta código, llama a APIs externas. Tendencia principal de 2026.
Function calling
Capacidad del modelo de invocar funciones externas (buscar en Google, consultar una base de datos, enviar un email) en lugar de solo generar texto.
Orquestador
Sistema que coordina múltiples agentes o llamadas a LLMs en secuencia. LangChain, LlamaIndex y n8n actúan como orquestadores en flujos de trabajo de IA.
MCP (Model Context Protocol)
Protocolo estándar de Anthropic para conectar LLMs con herramientas y fuentes de datos externas de forma segura. Adoptado por Claude y muchos IDEs como Cursor.
Multiagent system
Sistema donde múltiples agentes de IA colaboran para completar tareas complejas divididas en subtareas. Tendencia clave en automatización empresarial en 2026.
Vector database
Base de datos que almacena representaciones matemáticas de texto para búsqueda semántica. Pinecone, Weaviate y Chroma son populares. Esencial para sistemas RAG.
Semantic search
Búsqueda que entiende el significado del texto, no solo palabras exactas. Un sistema semántico entiende que "coche" y "automóvil" son equivalentes.
Chunking
División de documentos largos en fragmentos más pequeños antes de almacenarlos en una vector database. El tamaño del chunk afecta directamente la calidad del RAG.
Evals (Evaluaciones)
Tests automatizados para medir la calidad de un modelo en tareas específicas. Son el equivalente a los tests unitarios del software tradicional, aplicados a IA.
Sesgo (Bias)
Tendencia sistemática del modelo a producir respuestas parciales o estereotipadas. Puede venir de los datos de entrenamiento. Los proveedores lo mitigan con RLHF y DPO.
Text-to-image
Generación de imágenes a partir de una descripción textual (prompt). Midjourney, DALL-E 3 y Stable Diffusion son los modelos líderes en 2026.
Negative prompt
En generación de imágenes, texto que describe lo que NO quieres que aparezca. Ayuda a eliminar artefactos visuales y mejorar la composición.
Inpainting
Técnica que permite editar solo una zona seleccionada de una imagen existente manteniendo el resto intacto. Disponible en DALL-E 3, Adobe Firefly y Stable Diffusion.
Text-to-video
Generación de vídeo a partir de una descripción en texto. Sora (OpenAI), Runway Gen-3 y Kling son los modelos más avanzados en 2026.
TTS (Text-to-Speech)
Síntesis de voz a partir de texto. ElevenLabs y Murf AI ofrecen voces ultra-realistas. Muy usado en podcasts, videos de YouTube e interfaces de voz.
STT (Speech-to-Text)
Transcripción automática de audio a texto. Whisper de OpenAI es el modelo open source líder. Otter.ai y Fireflies.ai usan STT para transcribir reuniones.
Voice cloning
Crear una voz sintética que suena como una persona real usando solo unos segundos de audio de muestra. ElevenLabs es el líder indiscutible en esta tecnología.
PII (Información Personal Identificable)
Datos que permiten identificar a una persona (nombre, email, DNI). Crítico no enviar PII a APIs de LLMs sin revisar los términos del proveedor y el RGPD.
Prompt caching
Técnica para reutilizar partes del contexto ya procesado, reduciendo costes y latencia. Anthropic y OpenAI ofrecen prompt caching en sus APIs con descuentos de hasta 90%.
AI wrapper
Producto construido sobre la API de otro modelo sin tecnología de modelos propia. Muchas startups de IA de 2023-2024 son wrappers sobre GPT-4 o Claude.
Foundation model
Modelo grande entrenado en datos generales que sirve de base para múltiples aplicaciones específicas. GPT-4, Claude 3 y Gemini 1.5 son foundation models.
Frontier model
Modelo en la frontera de las capacidades actuales de la IA. GPT-4o, Claude Opus y Gemini Ultra compiten por ser el frontier model en cada momento.
Compute (cómputo)
Potencia de procesamiento necesaria para entrenar e inferir con modelos de IA. Medida en FLOPs. El acceso a compute (GPUs/TPUs) es el principal cuello de botella de la industria.
GPU (Graphics Processing Unit)
Chip diseñado para procesar miles de operaciones en paralelo. Esencial para entrenar e inferir con LLMs. NVIDIA H100 es el GPU más usado en IA en 2026.
Scaling laws
Leyes empíricas que describen cómo mejoran los modelos al aumentar datos, parámetros y cómputo. Base teórica detrás de la carrera por modelos más grandes.
Emergent capabilities
Capacidades que aparecen en modelos grandes sin haber sido entrenadas explícitamente para ellas. El razonamiento matemático emergió así en GPT-4.
Alignment
Campo de investigación que busca que los modelos de IA actúen de acuerdo con los valores e intenciones humanas. Anthropic, OpenAI y DeepMind tienen equipos dedicados.
Constitutional AI
Técnica de Anthropic para entrenar modelos seguros usando un conjunto de principios (constitución) en lugar de retroalimentación humana exhaustiva. Usada en Claude.
Guardrails
Barreras de seguridad programadas en un modelo para evitar respuestas dañinas, falsas o inapropiadas. Todos los modelos comerciales tienen guardrails, con distintos niveles de restricción.
Ventana de contexto extendida
Capacidad de procesar documentos muy largos en una sola llamada. Gemini 1.5 Pro maneja 1 millón de tokens. Permite analizar libros enteros o bases de código grandes.
Streaming
Modo de respuesta donde el modelo envía tokens uno a uno en tiempo real en lugar de esperar a generar toda la respuesta. Hace la experiencia más fluida en chatbots.
Temperatura (Temperature)
Parámetro que controla la aleatoriedad de las respuestas. Temperature 0 = determinista y predecible. Temperature 1 = creativo y variado. Fundamental para ajustar el comportamiento del modelo.
Modo multimodal
Capacidad del modelo de procesar y generar distintos tipos de datos: texto, imágenes, audio y video. GPT-4o, Gemini 1.5 y Claude 3 son multimodales.