Tendencias Emergentes en Data Science e IA

Entre Automatización, Aplicaciones y Agentes

Aplicación Empresarial y Organizacional

INTEC • 2026

🎯 Warm-up: ¿De Qué Lado Estás?

Vamos a empezar con una afirmación polémica:

"La IA reemplazará a los data scientists en 5 años"

El viaje de hoy: De Usuario a Arquitecto de IA

🧠 Entender → ⚙️ Configurar → 💬 Comunicar → ✅ Evaluar → 🤖 Orquestar → 🚀 Aplicar

Hoy no solo vamos a hablar de IA.
Vamos a escalar 6 niveles de dominio sobre ella.

Nivel 1: Entender

¿Qué hay debajo del capó?
"Comenzamos entendiendo los fundamentos:
modelos y proveedores que forman el ecosistema de IA."

Modelos vs. Proveedores: La Diferencia Clave

Modelo = El "cerebro" (la red neuronal que razona)
Proveedor = La plataforma que lo hospeda y comercializa

Proveedor Modelos destacados 2026 Fortaleza
OpenAI GPT-5.2, o1 Líder en razonamiento
Anthropic Claude Opus 4.6 Mejor en agentes + seguridad
Meta Llama 3.1 Open-source, customizable
DeepSeek R1 Razonamiento avanzado, bajo costo

Contexto Peruano: Momento Crítico (2026)

Perú está en un momento único:

📈 Inversión en IA crecerá 3.9x en 2026 (máximo en LATAM)
🏢 60% de empresas están en fase de planificación de IA
🚀 Adopción de IA generativa: 28% para fin de 2025
⚠️ Prioridades: Calidad de datos y ciberseguridad

Lo que esto significa para ti:

  • Demanda de talento especializado → oportunidades
  • Empresas buscan quienes sepan implementar, no solo teoría
  • El que domina IA en Perú hoy = ventaja competitiva enorme

Nivel 2: Configurar

¿Cómo ajusto el comportamiento?
"Ahora que entendemos los modelos,
la siguiente pregunta es: ¿cómo controlamos su comportamiento?"

Hiperparámetros: Los 3 Que Más Importan

Hoy vamos a dominar los 3 hiperparámetros que controlan el 80% del comportamiento:

  1. 🌡️ Temperatura — creatividad vs precisión
  2. 📏 Max Tokens — longitud de respuesta
  3. 🎯 Top-p — diversidad de vocabulario

Los demás existen (frequency penalty, beam search, etc.),
pero estos 3 son los más importantes.

🌡️ Temperatura: El Control Maestro

Rango: 0.0 - 1.0

Valor Comportamiento Cuándo usar
0.0-0.3 Determinista, precisa, repetible SQL queries, análisis técnico, código
0.4-0.6 Balanceada Emails profesionales, documentación
0.7-1.0 Creativa, variada, arriesgosa Brainstorming, escritura creativa

💡 Analogía: Como el volumen de música

  • Baja = predecible, siempre igual
  • Alta = sorpresivo, cada vez diferente

Ejemplo práctico:

  • "Escribe query SQL para..." → temperatura 0.1
  • "Dame 10 ideas de nombres para startup" → temperatura 0.9

📏 Max Tokens: El Limitador

¿Qué es? Límite de tokens que el modelo puede generar en la respuesta.

Valor típico Equivalente Cuándo usar
100-200 ~1 párrafo Respuestas cortas, clasificaciones
500-1000 ~1 página Explicaciones, emails largos
2000+ ~3-5 páginas Documentos, análisis extensos

💡 Analogía: Como el límite de palabras en un trabajo o reporte

Truco: Si no estás seguro, empieza con 500. Puedes ajustar después.

🎯 Top-p (Nucleus Sampling): El Filtro

Rango: 0.0 - 1.0

¿Qué hace? Filtra palabras muy raras/improbables.

Valor Efecto Cuándo usar
0.1-0.5 Solo palabras muy comunes Textos técnicos, formales
0.9-0.95 Permite más diversidad Uso general (este es el default)
1.0 Permite cualquier palabra Casos especiales (raro)

💡 Analogía: Como un filtro de spam para vocabulario

Combinación ganadora:

  • Temperatura 0.7 + Top-p 0.9 = creatividad controlada
  • Temperatura 0.2 + Top-p 0.5 = precisión máxima

🧪 Demo en Vivo: Temperatura en Acción (3 min)

Voy a hacer lo siguiente frente a ustedes:

  1. Abrir plataforma de ChatGPT
  2. Usar mismo prompt: "Explica qué es machine learning"
  3. Cambiar solo la temperatura:
    • Primera vez: temperatura 0.1
    • Segunda vez: temperatura 0.9

Ustedes predicen:

  • ¿Cuál será más larga?
  • ¿Cuál usará vocabulario más variado?
  • ¿Cuál es mejor para un reporte ejecutivo?

Luego corremos el experimento y validamos

Nivel 3: Comunicar

¿Cómo le hablo para que me entienda?
"Con los modelos configurados,
¿cómo nos comunicamos efectivamente con ellos?"

Ejercicio Práctico #1: Prompt Engineering

Escenario: Analizar sentimiento de reseñas de producto de e-commerce.

  • Setup: Grupos 2-3, ChatGPT o Claude
  • Duración: 15 minutos
  • Objetivo: Mejorar accuracy iterativamente

De donde sacar reseñas de producto? https://es.trustpilot.com/review/www.falabella.com.pe

Nivel 1: Prompt Básico

Prompt: "Analiza el sentimiento de esta reseña: ..."

  • Problema: Respuesta vaga, sin estructura
  • Output típico: "La reseña parece positiva"
  • Falta: Formato, criterios, nivel de detalle

Nivel 2: Agregar Rol y Contexto

Prompt mejorado:
"Eres un analista de e-commerce. Clasifica el sentimiento de esta reseña en: Positivo, Neutral, Negativo. Reseña: ..."

  • Mejora: Clasificación clara, rol definido
  • Output: "Negativo" (más estructurado)

Nivel 3: Chain-of-Thought + Restricciones

Prompt óptimo:
"Eres analista de e-commerce. Analiza esta reseña paso a paso: 1) Identifica palabras clave emocionales 2) Evalúa tono 3) Clasifica como Positivo/Neutral/Negativo. Responde en JSON: {sentimiento: '', score: 0-10, keywords: []}. Reseña: ..."

  • Mejora: Reasoning explícito, formato JSON

Debrief del Ejercicio

  • Compartir resultados de cada nivel
  • ¿Qué cambio generó más mejora?
  • ¿Cómo aplicarían esto en proyectos reales?
  • Principio: Especificidad > Vaguedad

Nivel 4: Evaluar

¿Cómo sé si lo hizo bien?
"Ahora que sabemos comunicarnos con la IA,
¿cómo evaluamos si sus respuestas son buenas?"

Ejercicio Práctico #2: LLM-as-a-Judge

Escenario: Evaluar la calidad de respuestas generadas por IA usando otra IA como juez.

  • Setup: Grupos de 2-3, ChatGPT o Claude
  • Duración: 20 minutos
  • Objetivo: Crear una rúbrica, evaluar dos respuestas, y comparar con su juicio humano.

Paso 1: Las dos respuestas

Respuesta A:
"Machine learning es cuando las computadoras aprenden solas.
Es muy importante para las empresas porque les ayuda a hacer
cosas mejor y más rápido."

Respuesta B:
"Machine learning es una rama de la IA donde algoritmos
identifican patrones en datos sin ser programados explícitamente.
Para empresas, permite: 1) Predecir demanda (ej: retail),
2) Detectar fraude (ej: banca), 3) Personalizar experiencia
de cliente (ej: e-commerce). El ROI promedio es de 3-5x
en el primer año de implementación."

🤔 ¿Cuál es mejor? ¿Por qué? ¿Cómo lo medimos objetivamente?

Paso 2: Diseñen su rúbrica

En su grupo, definan 3-5 criterios para evaluar una respuesta de IA:

Criterio Descripción Peso (1-5)
¿? ¿? ¿?
¿? ¿? ¿?
¿? ¿? ¿?

Tiempo: 5 minutos
Pista: Piensen en qué haría que una respuesta sea útil para un gerente que no sabe de IA.

Paso 3: El LLM evalúa

Prompt:
"Eres un evaluador experto de calidad de contenido de IA.
Evalúa las siguientes dos respuestas usando esta rúbrica:
[PEGAR RÚBRICA].

Para cada respuesta:

  1. Puntúa cada criterio de 1 a 5
  2. Explica brevemente tu razonamiento por criterio
  3. Da un puntaje total
  4. Declara un ganador y explica por qué

Respuesta A: [PEGAR]
Respuesta B: [PEGAR]

Responde en formato tabla."

Debrief: LLM-as-a-Judge

Preguntas para discusión:

  • ¿El LLM coincidió con su evaluación humana?
  • ¿Qué criterios fueron más fáciles/difíciles de evaluar para el LLM?
  • ¿Cambiarían algo de su rúbrica después de ver los resultados?

Concepto clave: LLM-as-a-Judge es escalable pero no infalible.
La combinación humano + IA es más robusta que cualquiera por separado.

Conexión con el siguiente tema:
Si un LLM puede evaluar outputs... ¿puede también decidir qué hacer
con esa evaluación? → Eso nos lleva a Agentic AI 🤖

Nivel 5: Orquestar

¿Cómo lo pongo a trabajar solo?
"Si un LLM puede evaluar sus propias respuestas,
¿por qué no dejar que decida qué hacer y lo ejecute?"

¿Qué es Agentic AI?

Sistemas de IA que toman decisiones autónomas, planifican múltiples pasos y ejecutan tareas complejas sin supervisión constante.

  • Decisión autónoma basada en objetivos
  • Integración dinámica de herramientas y APIs
  • Planificación y ejecución multi-paso

AI Tradicional siempre va a tomar un prompt, correr un modelo y luego retornar el resultado. Agentic AI recibe un objetivo, lo descompone en pasos, ejecuta acciones y continua hasta completar el objetivo, o recibir un error.

Frameworks Agentic AI Principales

Aplicaciones Empresariales (Global)

  • Salud: Diagnóstico asistido, drug discovery
  • Finanzas: Detección de fraude, trading algorítmico
  • Retail: Personalización, optimización de inventario
  • Manufactura: Mantenimiento predictivo

Referencias: Data Science Applications 2026 - TechTarget

Nivel 6: Aplicar

¿Cómo encaja esto en mi futuro?
"Ahora que dominamos los conceptos y podemos diseñar agentes,
¿cómo se aplica esto en el mundo real y qué carrera nos espera?"

Mercado Peruano de IA

  • Inversión en IA crecerá 3.9x en 2026 (máximo en LATAM)
  • 60% de empresas en fase de planificación de IA
  • Adopción de IA generativa alcanzará 28% en 2025
  • Prioridad: calidad de datos y ciberseguridad

Referencias:

Mi Experiencia: La Realidad vs Lo Que Se Enseña

Lo que te enseñan Lo que realmente haces
📚 Algoritmos de ML sofisticados 🧹 60-80% limpieza de datos
💻 Modelos en Jupyter Notebooks 🐳 Deployment con Docker + CI/CD
✨ Datasets limpios y preparados 🔍 Datos faltantes, inconsistentes, duplicados
🧑‍💻 Trabajar solo en tu código 🗣️ Comunicar resultados a stakeholders no-técnicos
🤖 "La IA lo resuelve todo" 🛠️ La IA es UNA herramienta más en tu toolkit

El skill más subestimado:

Saber explicar qué significa un número a alguien
que no sabe de datos.

🔄 Volvamos al Inicio: ¿Cambiaste de Opinión?

Recuerdan la afirmación del warm-up?

"La IA reemplazará a los data scientists en 5 años"

Mi respuesta después de algunos años en el campo:

La IA no va a reemplazar a los data scientists.

Va a reemplazar a los data scientists que NO usen IA.

Tu valor no es competir con la IA en velocidad o memoria.
Tu valor es:

  • Hacer las preguntas correctas
  • Evaluar críticamente las respuestas
  • Conectar análisis con decisiones de negocio
  • Diseñar sistemas que usen IA responsablemente

Esas habilidades siguen siendo 100% humanas.

Resumen: Tu Viaje de Hoy

Has escalado 6 niveles de dominio en IA:

Nivel Lograste Evidencia
1. 🧠 Entender Distingues modelos de proveedores
2. ⚙️ Configurar Controlas temperatura, tokens, top-p
3. 💬 Comunicar Escribes prompts efectivos
4. ✅ Evaluar Usas LLM-as-a-Judge con rúbricas
5. 🤖 Orquestar Diseñas agentes con patrón ReAct
6. 🚀 Aplicar Tienes plan de acción para esta semana

Conceptos clave consolidados:

  • ✅ Prompt engineering es la puerta de entrada
  • ✅ Evaluación objetiva (LLM-as-a-Judge) escala pero necesita supervisión
  • ✅ Agentic AI = diseño sistemático de objetivos + herramientas + flujo
  • ✅ Perú tiene enorme potencial (inversión 3.9x en 2026)
  • ✅ Tu viaje empieza AHORA: elige un nivel y practica esta semana

¡Gracias!

¿Preguntas o Comentarios?

Referencias Completas

Imágenes y Recursos Visuales

Frameworks y Arquitectura de IA

Modelos y Evaluación

Prompt Engineering

Casos de Uso y Aplicaciones

Mercado Peruano de IA

Papers Académicos

Videos y Tutoriales

Blogs y Artículos