Tendencias Emergentes en Data Science e IA

Del Prompt al Dataset

Mini-EDA Asistido por IA en Sheets

INTEC • 2026

Conexión con la Sesión Anterior


La sesión pasada aprendimos a:

  • 📝 Nivel 3: Comunicar → Prompt engineering con rol y contexto
  • ⚖️ Nivel 4: Evaluar → LLM-as-a-Judge para validar calidad
  • 🤖 Nivel 5: Orquestar → Diseñar agentes que usan herramientas

Ahora vamos a aplicar esas habilidades a:

Explorar un dataset real en Sheets,
con IA como asistente, no como reemplazo

Dataset para Hoy

Productos de E-commerce (dataset real de productos tecnológicos)

Descargar aquí: https://edatos.consorciomadrono.es/dataset.xhtml?persistentId=doi:10.21950/JTIQQ5

Analizaremos productos y sus características para encontrar insights de mercado.

Nota: Los campos rating y reviews tienen valores NULL en la mayoría de filas, pero algunos productos sí tienen datos.

Columna Tipo Ejemplo
name Texto "Aire Acondicionado Portatil WiFi"
price Número 205.74
brand Texto "Cecotec"
rating Número 4.2 (escala 1-5)
reviews Número 105080
platform Texto "amazon" / "pccomponentes" / "mediamarkt" / "corteingles"
Category-ES Texto "aire acondicionado"
Macro-Category-ES Texto "Electrodomésticos"

Actividad 1: Pregunta de Negocio

En grupos:

  1. Miran el dataset en Sheets

  2. Planteen: ¿Qué pregunta de negocio queremos responder?

    • Ej: "¿Qué categorías tienen mejores precios promedio?"
    • Ej: "¿Qué marcas dominan cada segmento de mercado?"
    • Ej: "¿Cómo se relacionan rating y número de reseñas?"
  3. Definen rol del LLM: ¿En qué nos ayudará ChatGPT?

    • Sugerir análisis posibles
    • Identificar patrones de mercado
    • Ayudar a redactar conclusiones de negocio

Prompt Base para el LLM

Copien y peguen este prompt en ChatGPT/Claude:

Eres analista de datos. Tengo un dataset de productos e-commerce con:
- price, brand, rating, reviews, platform, categorías

Pregunta negocio: "[PEGA TU PREGUNTA AQUÍ]"

Sugiere 3 análisis para Sheets (sin código) que respondan esta pregunta.

Actividad 2: Mini-EDA

Dividido en 3 micro-fases:

2.1 Elegir 2 vistas clave

  • Ejecutan 2 sugerencias en Sheets (tablas dinámicas, gráficos)

2.2 Crear columna de segmentación

  • Usan LLM para diseñar reglas de segmentación
  • Aplican reglas manualmente en Sheets (ej: rango de precios, nivel de popularidad)

2.3 Cruce con nueva columna

  • Tabla dinámica: segmento_precio vs Macro-Category-ES
  • Tabla dinámica: nivel_popularidad vs platform

Fase 2.1: Elegir Vistas Clave

El LLM propone, ustedes deciden
El modelo sugiere acciones, pero ustedes eligen cuál es más útil

Ejemplos de vistas que pueden aparecer:

  • Precio promedio por macro-categoría
  • Distribución de ratings por plataforma
  • Top 10 marcas por número de productos
  • Relación entre precio y número de reseñas
  • Evolución de precios por categoría en el tiempo

Ejecuten 2 en Sheets:

  • Tablas dinámicas
  • Gráficos de barras/líneas

Fase 2.2: Segmentación Manual Asistida

Conexión con ejercicio anterior:

La vez pasada clasificamos una reseña.
Hoy diseñamos reglas para segmentar muchos productos.

Flujo:

  1. Identifiquen 2-3 criterios útiles para segmentar:
    • Rango de precios (bajo/medio/alto)
    • Nivel de popularidad (pocas/muchas reseñas)
    • Nivel de satisfacción (rating bajo/medio/alto)
  1. Prompt al LLM:
Voy a segmentar productos de e-commerce usando estos datos:
- price (rango: 1.2 a 5405 EUR)
- reviews (rango: 0 a 105080)
- rating (escala 1-5)

Para cada criterio (precio, reviews, rating):
1) sugiere 3 segmentos lógicos
2) define los rangos numéricos para cada segmento
3) nombra cada segmento (ej: "Económico", "Popular")

Ejemplo de formato:
PRECIO:
- Bajo: < 50 EUR
- Medio: 50-200 EUR  
- Alto: > 200 EUR

Fase 2.2: Aplicar Reglas (continuación)

  1. Usen las sugerencias del LLM para definir reglas simples:

    • Ejemplo: price < 50 → ECONÓMICO
    • Ejemplo: reviews > 1000 → POPULAR
    • Ejemplo: rating >= 4 → ALTA_SATISFACCIÓN
  2. Añadan columnas en Sheets:

    • segmento_precio
    • nivel_popularidad
    • nivel_satisfaccion
    • Usen filtros/fórmulas para marcar cada fila


Mensaje clave:

El LLM ayudó a diseñar la segmentación,
pero ustedes deciden qué criterios usar.
Eso es Data Science.

Fase 2.3: Cruce Simple

Tabla dinámica básica:

  • segmento_precio (filas) vs Macro-Category-ES (columnas)
  • nivel_popularidad (filas) vs platform (columnas)
  • nivel_satisfaccion (filas) vs brand (columnas)

Conexión con Nivel 4 (Evaluar):

La sesión pasada usamos LLM-as-a-Judge para evaluar salidas.
Hoy están evaluando su propia segmentación:
¿Tiene sentido que la categoría X tenga más productos económicos?

Actividad 3: Insight Final con LLM

3.1 Hallazgos en Bruto

Escriban en un doc:

  • Pregunta inicial
  • 2-3 hallazgos numéricos claros:
    • "En Electrodomésticos, 60% de productos son de precio alto (>200EUR)"
    • "Amazon tiene 2x más productos que las otras plataformas combinadas"
    • "Productos con rating >4 tienen 2.5x más reseñas promedio"

Actividad 3: Insight Final (continuación)

3.2 LLM como Editor de Comunicación

Prompt sugerido:

Actúa como analista de datos que prepara un resumen
para un gerente de e-commerce.

Nuestra pregunta era:
"[PREGUNTA]"

Nuestros hallazgos en bruto son:
- [bullet 1]
- [bullet 2]
- [bullet 3]

Redacta un párrafo de 4-5 líneas que:
1) responda la pregunta de forma clara
2) mencione los datos sin jerga estadística
3) termine con 1 recomendación accionable

No inventes números nuevos; usa solo los que di.

Mini-Presentaciones

Cada grupo comparte:

  • Pregunta de negocio
  • 1 hallazgo clave (número + contexto)
  • Párrafo final (conclusión + recomendación)

No hay que explicar todo el análisis
Solo: pregunta → insight → acción

Cierre:

¿Qué reutilizamos hoy?

Concepto Anterior Aplicación Hoy
Prompt Engineering Definir rol del LLM y contexto del dataset
LLM-as-a-Judge Evaluar si nuestra segmentación tiene sentido
Agentic AI Ver al LLM como herramienta, no como el flujo completo

¡Gracias!

¿Preguntas o Comentarios?

INTEC • 2026

Referencias

Prompt Engineering

Data Science Aplicado

Datasets de Práctica