Glosario IA

Diccionario esencial de IA

83 términos clave para entender la conversación sobre inteligencia artificial en 2026 — explicados en cristiano.

LLM

Large Language Model. Modelo entrenado con cantidades masivas de texto para predecir la siguiente palabra. ChatGPT, Claude y Gemini son LLMs.

Transformer

Arquitectura de red neuronal introducida por Google en 2017 (paper «Attention is all you need»). Base de prácticamente todos los LLMs modernos.

Fine-tuning

Reentrenar un modelo preexistente con datos específicos para especializarlo en una tarea o estilo concreto.

RAG

Retrieval-Augmented Generation. Técnica donde el modelo busca información en una base externa antes de responder, reduciendo alucinaciones.

Hallucination

Cuando un modelo inventa información falsa pero la presenta con confianza. Riesgo central de los LLMs.

Token

Unidad mínima que procesa un LLM. Aproximadamente 0.75 palabras en inglés. Los modelos cobran y limitan por tokens.

Embedding

Representación numérica de texto en un espacio vectorial. Permite buscar por significado en lugar de por coincidencia literal.

Prompt Engineering

Arte de formular instrucciones para obtener el mejor output de un LLM. Incluye rol, contexto, restricciones y formato.

Zero-shot

Hacer que un modelo realice una tarea sin darle ejemplos previos. La habilidad emergente más sorprendente de los LLMs.

Few-shot

Darle al modelo 2-5 ejemplos del output deseado dentro del propio prompt para que clone el patrón.

RLHF

Reinforcement Learning from Human Feedback. Técnica para alinear el comportamiento del modelo con preferencias humanas. Es lo que hizo a ChatGPT viable.

Diffusion Model

Modelo que aprende a generar imágenes partiendo de ruido aleatorio y refinándolo paso a paso. Base de Midjourney, DALL-E y Stable Diffusion.

LoRA

Low-Rank Adaptation. Técnica eficiente para fine-tunear modelos enormes ajustando solo una pequeña matriz de pesos.

Quantization

Reducir la precisión numérica de un modelo (de 32-bit a 8-bit o 4-bit) para que ocupe menos memoria y corra más rápido.

Multimodal

Modelo que procesa varios tipos de datos a la vez: texto, imagen, audio, vídeo. GPT-4o, Claude Sonnet 4.5 y Gemini son multimodales.

Agent

Sistema IA que ejecuta tareas de varios pasos de forma autónoma: investiga, decide, llama a APIs, escribe código. Cursor Composer y Devin son ejemplos.

Chain of Thought

Técnica de prompting donde se pide al modelo «pensar paso a paso» antes de responder. Mejora drásticamente el razonamiento complejo.

Temperature

Parámetro que controla la aleatoriedad de las respuestas (0 = determinista, 1 = creativo). 0.7 es el valor más común.

Top-p

Parámetro alternativo a Temperature: el modelo solo elige entre las palabras cuya probabilidad acumulada llegue a p (ej. 0.9 = el 90% más probable).

Context Window

Cantidad máxima de tokens que un modelo puede «recordar» en una conversación. Claude Sonnet 4.5: 200K. Gemini Advanced: 2M.

Inference

El acto de ejecutar un modelo entrenado para obtener una respuesta. Distinto del training (entrenarlo).

Benchmark

Test estandarizado para medir capacidad de un modelo: MMLU (conocimiento general), HumanEval (código), GSM8K (matemáticas), etc.

GGUF

Formato de archivo para almacenar modelos cuantizados, optimizado para inferencia local en CPU/GPU. Reemplazó al antiguo GGML.

Tokenizer

Componente que parte texto en tokens. Modelos distintos usan tokenizers distintos, por eso un mismo texto tiene longitudes diferentes según el modelo.

Attention

Mecanismo que permite al modelo «mirar» a otras partes del texto al procesar cada palabra. El corazón del Transformer.

GPT

Generative Pretrained Transformer. Familia de modelos de OpenAI: GPT-3.5, GPT-4, GPT-4o, GPT-4.1.

BERT

Modelo Transformer de Google (2018) optimizado para entender texto (no generar). Sigue siendo la base de Google Search en 2026.

Stable Diffusion

Modelo de generación de imagen de código abierto, ejecutable en local. Rival open-source de Midjourney y DALL-E.

GAN

Generative Adversarial Network. Dos redes que compiten: una genera, otra discrimina. Precursora de los diffusion models para imagen.

Neural Network

Sistema de cómputo inspirado en el cerebro: nodos («neuronas») conectados por pesos ajustables. Base de todo el deep learning moderno.

Modelo base

Modelo entrenado en datos masivos sin ajuste para una tarea específica. GPT-4o y Claude 3 son modelos base antes de añadir instrucciones de sistema.

Modelo de razonamiento

LLM diseñado para pensar paso a paso antes de responder. o1 de OpenAI y Claude 3.7 Sonnet son ejemplos. Más lento pero más preciso en problemas complejos.

Parámetros

Los números internos que un modelo ajusta durante el entrenamiento. Más parámetros implica mayor capacidad potencial. GPT-4 tiene estimados 1,8 billones de parámetros.

Mixture of Experts (MoE)

Arquitectura que divide el modelo en submodelos especializados y activa solo los relevantes por consulta. GPT-4 y Mixtral usan MoE para ser más eficientes.

Modelo open source

Modelo cuyo código y pesos son públicos. Llama 3 (Meta) y Mistral son los más conocidos. Puedes ejecutarlos localmente sin pagar por API.

Modelo propietario

Modelo cuyo código o pesos no son públicos. GPT-4o, Claude y Gemini son propietarios. Accedes solo vía API o interfaz del proveedor.

SLM (Small Language Model)

Modelo de lenguaje pequeño diseñado para correr en dispositivos con poca memoria. Phi-3 de Microsoft y Gemma de Google son SLMs capaces de funcionar en móviles.

Pre-entrenamiento

Primera fase del entrenamiento donde el modelo aprende a predecir texto a partir de enormes conjuntos de datos de internet, libros y código.

Instruction tuning

Ajuste fino donde se entrena al modelo para seguir instrucciones en formato pregunta-respuesta. Convierte un modelo base en un asistente útil.

DPO (Direct Preference Optimization)

Alternativa más eficiente a RLHF para alinear modelos con preferencias humanas. Muchos modelos open source modernos usan DPO en lugar de RLHF.

Synthetic data

Datos de entrenamiento generados por IA en lugar de recogidos de humanos. Usado para entrenar modelos cuando los datos reales escasean o son costosos.

API (Application Programming Interface)

Interfaz que permite a tu aplicación enviar texto a un modelo y recibir respuestas. Pagas por tokens consumidos. OpenAI, Anthropic y Google ofrecen APIs de sus modelos.

Latencia

Tiempo que tarda el modelo en empezar a responder. Crítico en aplicaciones de tiempo real. Groq destaca por latencia ultra-baja usando hardware especializado (LPU).

Coste por token

Precio que cobra la API por cada mil tokens procesados. GPT-4o Mini cuesta ~0,15 dólares por millón de tokens. Clave para calcular el ROI de tu aplicación.

Self-hosting

Ejecutar un modelo en tu propia infraestructura en lugar de usar la API de un proveedor. Más control y privacidad, pero requiere GPU y conocimientos técnicos.

System prompt

Instrucciones que defines para el modelo antes de la conversación. Establece su rol, tono y restricciones. Invisible para el usuario final en la mayoría de apps.

In-context learning

Capacidad del LLM de aprender de ejemplos dentro del propio prompt sin reentrenamiento. Cuantos más ejemplos incluyes (few-shot), mejor sigue el patrón.

Prompt injection

Ataque donde un usuario intenta sobreescribir el system prompt para hacer que el modelo ignore sus instrucciones. Principal vulnerabilidad de seguridad en apps con LLMs.

Jailbreak

Técnica para evadir las restricciones de seguridad de un modelo mediante instrucciones engañosas. Los proveedores parchean continuamente estos intentos.

Grounding

Proceso de anclar las respuestas del modelo a hechos verificables, normalmente mediante RAG o búsqueda web en tiempo real. Reduce alucinaciones drásticamente.

Agentic AI

IA que no solo responde preguntas sino que toma acciones autónomas: busca en internet, ejecuta código, llama a APIs externas. Tendencia principal de 2026.

Function calling

Capacidad del modelo de invocar funciones externas (buscar en Google, consultar una base de datos, enviar un email) en lugar de solo generar texto.

Orquestador

Sistema que coordina múltiples agentes o llamadas a LLMs en secuencia. LangChain, LlamaIndex y n8n actúan como orquestadores en flujos de trabajo de IA.

MCP (Model Context Protocol)

Protocolo estándar de Anthropic para conectar LLMs con herramientas y fuentes de datos externas de forma segura. Adoptado por Claude y muchos IDEs como Cursor.

Multiagent system

Sistema donde múltiples agentes de IA colaboran para completar tareas complejas divididas en subtareas. Tendencia clave en automatización empresarial en 2026.

Vector database

Base de datos que almacena representaciones matemáticas de texto para búsqueda semántica. Pinecone, Weaviate y Chroma son populares. Esencial para sistemas RAG.

Semantic search

Búsqueda que entiende el significado del texto, no solo palabras exactas. Un sistema semántico entiende que "coche" y "automóvil" son equivalentes.

Chunking

División de documentos largos en fragmentos más pequeños antes de almacenarlos en una vector database. El tamaño del chunk afecta directamente la calidad del RAG.

Evals (Evaluaciones)

Tests automatizados para medir la calidad de un modelo en tareas específicas. Son el equivalente a los tests unitarios del software tradicional, aplicados a IA.

Sesgo (Bias)

Tendencia sistemática del modelo a producir respuestas parciales o estereotipadas. Puede venir de los datos de entrenamiento. Los proveedores lo mitigan con RLHF y DPO.

Text-to-image

Generación de imágenes a partir de una descripción textual (prompt). Midjourney, DALL-E 3 y Stable Diffusion son los modelos líderes en 2026.

Negative prompt

En generación de imágenes, texto que describe lo que NO quieres que aparezca. Ayuda a eliminar artefactos visuales y mejorar la composición.

Inpainting

Técnica que permite editar solo una zona seleccionada de una imagen existente manteniendo el resto intacto. Disponible en DALL-E 3, Adobe Firefly y Stable Diffusion.

Text-to-video

Generación de vídeo a partir de una descripción en texto. Sora (OpenAI), Runway Gen-3 y Kling son los modelos más avanzados en 2026.

TTS (Text-to-Speech)

Síntesis de voz a partir de texto. ElevenLabs y Murf AI ofrecen voces ultra-realistas. Muy usado en podcasts, videos de YouTube e interfaces de voz.

STT (Speech-to-Text)

Transcripción automática de audio a texto. Whisper de OpenAI es el modelo open source líder. Otter.ai y Fireflies.ai usan STT para transcribir reuniones.

Voice cloning

Crear una voz sintética que suena como una persona real usando solo unos segundos de audio de muestra. ElevenLabs es el líder indiscutible en esta tecnología.

PII (Información Personal Identificable)

Datos que permiten identificar a una persona (nombre, email, DNI). Crítico no enviar PII a APIs de LLMs sin revisar los términos del proveedor y el RGPD.

Prompt caching

Técnica para reutilizar partes del contexto ya procesado, reduciendo costes y latencia. Anthropic y OpenAI ofrecen prompt caching en sus APIs con descuentos de hasta 90%.

AI wrapper

Producto construido sobre la API de otro modelo sin tecnología de modelos propia. Muchas startups de IA de 2023-2024 son wrappers sobre GPT-4 o Claude.

Foundation model

Modelo grande entrenado en datos generales que sirve de base para múltiples aplicaciones específicas. GPT-4, Claude 3 y Gemini 1.5 son foundation models.

Frontier model

Modelo en la frontera de las capacidades actuales de la IA. GPT-4o, Claude Opus y Gemini Ultra compiten por ser el frontier model en cada momento.

Compute (cómputo)

Potencia de procesamiento necesaria para entrenar e inferir con modelos de IA. Medida en FLOPs. El acceso a compute (GPUs/TPUs) es el principal cuello de botella de la industria.

GPU (Graphics Processing Unit)

Chip diseñado para procesar miles de operaciones en paralelo. Esencial para entrenar e inferir con LLMs. NVIDIA H100 es el GPU más usado en IA en 2026.

Scaling laws

Leyes empíricas que describen cómo mejoran los modelos al aumentar datos, parámetros y cómputo. Base teórica detrás de la carrera por modelos más grandes.

Emergent capabilities

Capacidades que aparecen en modelos grandes sin haber sido entrenadas explícitamente para ellas. El razonamiento matemático emergió así en GPT-4.

Alignment

Campo de investigación que busca que los modelos de IA actúen de acuerdo con los valores e intenciones humanas. Anthropic, OpenAI y DeepMind tienen equipos dedicados.

Constitutional AI

Técnica de Anthropic para entrenar modelos seguros usando un conjunto de principios (constitución) en lugar de retroalimentación humana exhaustiva. Usada en Claude.

Guardrails

Barreras de seguridad programadas en un modelo para evitar respuestas dañinas, falsas o inapropiadas. Todos los modelos comerciales tienen guardrails, con distintos niveles de restricción.

Ventana de contexto extendida

Capacidad de procesar documentos muy largos en una sola llamada. Gemini 1.5 Pro maneja 1 millón de tokens. Permite analizar libros enteros o bases de código grandes.

Streaming

Modo de respuesta donde el modelo envía tokens uno a uno en tiempo real en lugar de esperar a generar toda la respuesta. Hace la experiencia más fluida en chatbots.

Temperatura (Temperature)

Parámetro que controla la aleatoriedad de las respuestas. Temperature 0 = determinista y predecible. Temperature 1 = creativo y variado. Fundamental para ajustar el comportamiento del modelo.

Modo multimodal

Capacidad del modelo de procesar y generar distintos tipos de datos: texto, imágenes, audio y video. GPT-4o, Gemini 1.5 y Claude 3 son multimodales.