Investigación de Mercado

Diapositivas

Diapositivas de referencia

Presentación de la clase. Usá las flechas del teclado o los controles para navegar. Presioná F para pantalla completa.

Apertura

Caso de apertura: los datos secundarios en acción

El capítulo abre con Starbucks VIA (2009). El caso ilustra perfectamente cómo los datos secundarios guían el diseño de investigación antes de recurrir a datos primarios. Se complementa con un caso latinoamericano más reciente que sigue la misma lógica.

📖 Caso de apertura — Malhotra 2016 (vigente en su lógica)

En 2009, Starbucks lanzó su café instantáneo VIA. Antes de entrar a un mercado completamente nuevo, realizó una extensa investigación de datos secundarios —internos, externos y sindicados— que reveló:

Starbucks perdía participación ante McDonald's (McCafé) y Dunkin' Donuts en varios mercados.
El mercado global del café instantáneo valía $17.000 millones, dominado por Nescafé y Sanka, pero con espacio para un entrante premium.
El café instantáneo representaba el 81% de las ventas de café en Reino Unido y el 63% en Japón.
Los consumidores querían un café de alta calidad a menor costo.

La lección metodológica: ninguno de estos hallazgos requirió encuestas propias. Todos provenían de datos secundarios evaluados críticamente. Solo después de esta fase se diseñaron los estudios primarios de validación. El resultado: $100 millones en ventas globales en los primeros 10 meses.

📖 Dato desactualizado — Malhotra 2016

El libro menciona que el mercado global del café instantáneo valía $17.000 millones en 2009. Hoy ese mercado superó los $35.000 millones (Euromonitor, 2024) — más del doble. Además, Sanka era de Kraft Foods; tras la escisión de Kraft Heinz en 2015, Sanka quedó bajo Kraft Heinz, no Kraft Foods Inc. como indica el libro.

Caso sustituto: Mercado Libre y la expansión a servicios financieros

caso reallatinoamérica

Mercado Libre siguió la misma secuencia metodológica de Starbucks VIA: antes de lanzar Mercado Pago como servicio de crédito al consumo, analizó datos secundarios para responder una pregunta estratégica: ¿existe un mercado desatendido suficientemente grande?

💳 Caso en clase — Datos secundarios como base del diseño

Mercado Libre: del e-commerce a los servicios financieros

Pregunta de decisión administrativa: ¿debería Mercado Libre entrar al negocio de crédito al consumo en América Latina?

Datos secundarios internos: historial de transacciones de 50+ millones de compradores activos; tasas de abandono de carrito por falta de financiamiento; segmentación por ticket promedio y frecuencia.

Datos secundarios externos: Banco Mundial (2021) — el 55% de los adultos en América Latina no tenía cuenta bancaria formal; GSMA — penetración de smartphones superaba el 70%; datos de bancos centrales sobre tasas de interés del crédito formal (70–150% anual en varios países).

Datos sindicados: Euromonitor y Americas Market Intelligence sobre el tamaño del mercado de crédito informal y el crecimiento del segmento "bancarizado digital" en la región.

Conclusión: existía un segmento masivo con historial transaccional verificable pero sin acceso a crédito formal. Los datos secundarios definieron el problema con suficiente precisión para diseñar la investigación primaria de validación. Hoy Mercado Crédito tiene más de 5 millones de clientes en LATAM.

Pregunta para clase: ¿Qué criterios de evaluación de datos secundarios (SEOANC) aplicaría Mercado Libre a cada una de estas fuentes? ¿Cuál presenta mayor riesgo de sesgo?

📚 Fuentes

Mercado Libre Inc. (2024). Annual Report 2023. investor.mercadolibre.com — Fuente primaria con datos de usuarios activos, volumen de créditos y cobertura geográfica.

Banco Mundial (2021). Global Findex Database 2021: Financial Inclusion, Digital Payments, and Resilience in the Age of COVID-19. worldbank.org/en/publication/globalfindex — La fuente de referencia sobre bancarización en LATAM.

GSMA Intelligence (2023). The Mobile Economy: Latin America 2023. gsma.com — Datos de penetración de smartphones y conectividad por país de la región.

Sección 01

Definición y componentes del diseño de investigación

El marco conceptual del diseño de investigación de Malhotra sigue siendo la estructura más clara para organizar el proceso. Lo que cambió es la disponibilidad, velocidad y diversidad de datos secundarios disponibles en la etapa inicial.

📖 Definición — Malhotra 2016 (vigente)

Diseño de investigación Marco de referencia o plan de acción para realizar el proyecto de investigación de mercados. Especifica los procedimientos para obtener la información requerida para estructurar y/o resolver los problemas de investigación.

El diseño se basa en los pasos 1 (definición del problema) y 2 (desarrollo del enfoque). Es iterativo: acepta retroalimentación de fases posteriores hacia los pasos previos. Un buen diseño garantiza que la información reunida sea relevante y útil para la gerencia. Comúnmente incluye ocho componentes:

Análisis de datos secundarios y sindicados (primer componente — siempre)
Investigación cualitativa
Investigación basada en encuestas y observaciones
Investigación experimental
Procedimientos de medición y escalamiento
Diseño del cuestionario o formulario de observación
Proceso de muestreo y determinación del tamaño de la muestra
Plan preliminar para el análisis de los datos

Principio clave: El análisis de datos secundarios siempre es el primer componente del diseño. Es el paso más barato y rápido, y frecuentemente subestimado. Ningún diseño debería avanzar a etapas más costosas sin agotar primero las fuentes secundarias disponibles.

Lo que cambió: el diseño de investigación en la era de los datos continuos

herramientasbibliografía

En 2016, los ocho componentes del diseño se ejecutaban de forma relativamente secuencial, con semanas o meses entre cada etapa. Hoy, muchas empresas operan en un modelo de investigación continua donde los datos secundarios (analítica digital, CRM, social listening) se actualizan en tiempo real y alimentan decisiones sin esperar un diseño formal completo.

Esto no reemplaza el diseño estructurado: sigue siendo necesario para preguntas estratégicas y decisiones de alta inversión. Pero para decisiones operativas (ajustar un precio, modificar una campaña), los datos continuos permiten ciclos mucho más cortos. El diseño del investigador debe anticipar qué preguntas requieren cada tipo de proceso.

📚 Referencia

Davenport, T. & Spanyi, A. (2019). "Making the most of your company's data." MIT Sloan Management Review, 60(3). — Argumenta que las empresas que integran datos operativos con investigación formal toman mejores decisiones que las que separan ambos procesos.

Sección 02

Tipos básicos de diseño de investigación

La clasificación exploratoria / concluyente (descriptiva y causal) es una de las contribuciones más duraderas de la metodología. Sigue siendo el marco organizador por excelencia del campo. Los casos se actualizan completamente.

📖 Clasificación — Malhotra 2016 (vigente)

Hay dos tipos de diseño: exploratorio y concluyente. Los concluyentes se subdividen en descriptivos (transversales y longitudinales) y causales.

Investigación exploratoria Objetivo: brindar información y facilitar la comprensión del problema. Información definida vagamente. Proceso flexible y no estructurado. Muestra pequeña y poco representativa. Análisis cualitativo. Hallazgos tentativos. Métodos principales: datos secundarios e investigación cualitativa.

Investigación concluyente descriptiva Describe características o funciones de grupos relevantes. Es el diseño más usado en investigación de mercados. Se clasifica en transversal (una sola medición sobre una muestra) y longitudinal (misma muestra medida repetidamente en el tiempo mediante paneles).

Investigación concluyente causal Obtiene evidencia de relaciones de causa y efecto. Requiere diseño planeado y estructurado. Su método principal es la experimentación. La descriptiva puede mostrar asociación entre variables (X e Y varían juntas); solo la causal puede afirmar que X es causa de Y.

Recomendación metodológica: la mayoría de los proyectos inician con exploratoria y continúan con concluyente. La exploratoria evita diseñar preguntas equivocadas en la fase concluyente.

Dimensión	Exploratoria	Concluyente
Objetivo	Facilitar la comprensión del problema	Someter a prueba hipótesis, examinar relaciones
Información	Definida vagamente	Definida con claridad
Proceso	Flexible, no estructurado	Formal y estructurado
Muestra	Pequeña, no representativa	Grande, representativa
Análisis	Cualitativo	Cuantitativo
Hallazgos	Tentativos	Concluyentes
Resultado	Seguida de más investigación	Usada directamente en decisiones

Caso sustituto — Exploratoria: Spotify y el modelo freemium en LATAM

caso reallatinoamérica

El libro ilustra la secuencia exploratoria → concluyente con P&G y compradores latinos en EE.UU. (datos de 2010–2012). Un caso más reciente con mayor relevancia para estudiantes de la región:

🎵 Caso en clase — Investigación exploratoria → concluyente

Spotify: ¿por qué los usuarios de LATAM no convertían a premium?

Fase exploratoria (datos secundarios): Banco Mundial sobre ingreso per cápita y gasto en entretenimiento; GSMA sobre prepago vs. postpago móvil en la región (el 70% de conexiones en LATAM son prepago, lo que complica el pago recurrente mensual); encuestas sindicadas de GWI sobre hábitos de consumo digital.

Fase exploratoria (cualitativa): focus groups en Brasil, Argentina y Colombia revelaron que el problema no era el precio en sí, sino la modalidad de pago — muchos usuarios no tenían tarjeta de crédito o no querían usarla para suscripciones.

Fase concluyente (descriptiva): encuestas representativas en cinco países confirmaron que el 43% de los no-premium en LATAM citaba la ausencia de método de pago conveniente como barrera principal, no el precio.

Resultado: Spotify lanzó pagos en efectivo a través de Oxxo (México), redes de cobro como PagoFácil (Argentina) y tarjetas de regalo físicas — sin modificar el precio. Hoy LATAM es la región con mayor crecimiento de suscriptores de Spotify.

Pregunta para clase: ¿En qué punto del proceso el equipo de Spotify pasó de investigación exploratoria a concluyente? ¿Qué criterio usarías para identificar ese momento metodológicamente?

📚 Fuentes

Spotify AB (2024). Shareholder Letter Q4 2023. investors.spotify.com — Datos de usuarios activos mensuales y suscriptores premium por región, incluyendo LATAM.

GWI (2023). Music Streaming Report. gwi.com — Panel global de consumo de medios con desglose por región. Fuente sindicada de referencia para el sector.

GSMA Intelligence (2023). The Mobile Economy: Latin America 2023. gsma.com — Datos de prepago vs. postpago por país de la región.

Caso sustituto — Causal: A/B testing en Rappi

caso reallatinoamérica

📦 Caso en clase — Investigación causal

Rappi: ¿el costo de delivery causa un cambio en la tasa de conversión?

Pregunta causal: ¿una reducción en el costo de envío aumenta la tasa de conversión de pedidos? No es obvio: puede aumentar el volumen pero reducir el ticket promedio e impactar negativamente la rentabilidad.

Diseño causal (A/B test): Rappi segmenta aleatoriamente usuarios activos en grupos de control y tratamiento. El grupo de tratamiento ve la oferta de envío reducido; el control, la tarifa normal. Todas las demás variables (menú, tiempo de entrega, interfaz) se mantienen constantes. La aleatorización garantiza que cualquier diferencia en conversión se debe causalmente a la variable de envío.

Límite metodológico: el A/B testing digital solo puede probar causalidad en variables manipulables en la plataforma. No puede probar causalidad en decisiones de largo plazo (lealtad de marca) ni en contextos fuera de la app.

Pregunta para clase: ¿Por qué el A/B test de Rappi es investigación causal y no meramente descriptiva? ¿Qué ocurriría si los grupos no se asignaran aleatoriamente?

📚 Fuentes

Kohavi, R., Tang, D., & Xu, Y. (2020). Trustworthy Online Controlled Experiments: A Practical Guide to A/B Testing. Cambridge University Press. — El manual de referencia de la industria para diseño experimental digital.

Gupta, S. et al. (2019). "Top challenges from the first practical online controlled experiments summit." ACM SIGKDD Explorations Newsletter, 21(1), 20–35. — Resume problemas metodológicos que enfrentan Google, Microsoft y Netflix en A/B testing a escala.

Sección 03

Datos primarios vs. datos secundarios

La distinción fundamental entre primarios y secundarios sigue siendo el eje organizador de la metodología. Las definiciones son vigentes; lo que cambió es la abundancia y diversidad de fuentes secundarias disponibles.

📖 Definiciones y regla de oro — Malhotra 2016 (vigente)

Datos primarios Datos originados por el investigador con el propósito específico de abordar el problema de investigación. Implican los seis pasos completos del proceso de investigación. Son costosos y llevan tiempo.

Datos secundarios Datos reunidos con anterioridad para propósitos diferentes al problema en cuestión. Se pueden localizar con rapidez y a bajo costo.

Regla de oro: "Primero se deben examinar los datos secundarios. El proyecto buscará datos primarios solamente cuando se agoten las fuentes secundarias o cuando produzcan resultados marginales."

Dimensión	Datos Primarios	Datos Secundarios
Propósito de recopilación	Para el problema en cuestión	Para otros problemas anteriores
Proceso de recopilación	Muy complejo (6 pasos)	Rápido y relativamente sencillo
Costo	Alto	Relativamente bajo o gratuito
Tiempo	Semanas o meses	Días u horas
Relevancia al problema	Máxima (diseñada para él)	Variable (puede no ajustarse)
Control de calidad	Total (investigador controla)	Limitado (decisiones de terceros)

Lo que cambió: la frontera entre primarios y secundarios se difumina

herramientasbibliografía

En 2016, la distinción era clara: una encuesta propia era primaria; un informe de Euromonitor era secundaria. Hoy existen categorías intermedias que complican la clasificación:

Datos de plataforma: Google Analytics, Meta Insights o Shopify generan datos de nuestros propios usuarios, pero con metodología que no controlamos totalmente. ¿Son primarios o secundarios?
Datos de CRM: técnicamente internos y generados por la empresa, pero con sesgo de autoselección (registran solo a quienes interactuaron, no al mercado total).
Datos sintéticos: generados por modelos de IA entrenados en datos reales. Crecen en uso para proteger privacidad, pero con sesgos no siempre visibles.

La pregunta relevante no es solo ¿primario o secundario?, sino ¿qué sesgos introduce la metodología de recolección, independientemente de quién generó los datos?

📚 Referencia

Mela, C.F., & Moorman, C. (2018). "Why big data isn't enough." MIT Sloan Management Review, 59(3). — Argumenta que los datos generados por plataformas digitales no reemplazan la investigación primaria diseñada para responder preguntas causales.

Sección 04

Criterios para evaluar datos secundarios

El marco SEOANC de Malhotra es metodológicamente sólido y sigue siendo la referencia estándar. Lo que cambió son los riesgos específicos que cada criterio enfrenta en el entorno digital.

📖 Criterios de evaluación — Malhotra 2016 (vigente)

Antes de usar cualquier fuente secundaria, el investigador debe evaluarla en seis dimensiones:

Especificaciones: metodología de recolección — tamaño y naturaleza de la muestra, tasa de respuesta, diseño del cuestionario, trabajo de campo y análisis. Revisar siempre la fuente original, no resúmenes de terceros.
Error: exactitud de los datos. Localizar múltiples fuentes independientes y compararlas. Si coinciden, la confianza aumenta; si difieren, se requiere verificación adicional.
Actualidad: ¿cuándo se recopilaron? Los censos y estudios tienen desfases entre recolección y publicación. En mercados dinámicos, datos de hace 2 años pueden ser obsoletos.
Objetivo: ¿por qué se recopilaron originalmente? El propósito original sesga los resultados. Un estudio encargado por una empresa para vender publicidad tendrá sesgos distintos a uno académico independiente.
Naturaleza: contenido, variables, unidades de medición y categorías empleadas. Las definiciones deben ser compatibles con las del problema actual.
Confiabilidad: reputación, credibilidad y transparencia de la fuente. Datos de organismos reconocidos (INE, Banco Mundial) son más confiables que blogs sin metodología publicada.

Nuevos riesgos para cada criterio en el entorno digital

bibliografíaherramientas

Criterio	Riesgo clásico (Malhotra)	Riesgo adicional hoy
Especificaciones	Muestra no representativa, bajo nivel de respuesta	Paneles online con bots o "professional respondents"; sesgo de autoselección digital
Error	Diferencias entre fuentes	Métricas de plataformas no auditadas externamente; datos de social media manipulados por algoritmos de amplificación
Actualidad	Desfase entre recolección y publicación	APIs que cambian metodología sin aviso; datos "en tiempo real" con demoras técnicas no documentadas
Objetivo	Sesgo del patrocinador	Estudios de empresas tecnológicas sobre el valor de sus propias plataformas; consultoras que recomiendan sus servicios
Naturaleza	Definiciones incompatibles	"Usuario activo" definido diferente por Facebook, Spotify, TikTok y Netflix; penetración calculada sobre bases distintas
Confiabilidad	Fuente sin reputación verificable	Estudios generados por IA sin revisión; fuentes que citan otras secundarias en cadena hasta perder el dato original

📚 Referencias

Kennedy, R. & Hartig, H. (2019). "Response rates in telephone surveys have resumed their decline." Pew Research Center, pewresearch.org — Documenta la caída en tasas de respuesta y sus implicaciones para los criterios de especificación y error.

Broniatowski, D.A. et al. (2018). "Weaponized health communication: Twitter bots and Russian trolls amplify the vaccine debate." American Journal of Public Health, 108(10). — Caso documentado de cómo los datos de social media pueden estar sistemáticamente contaminados.

Sección 05

Clasificación y fuentes de datos secundarios

La clasificación en datos internos y externos sigue siendo el esquema organizador más útil. Las fuentes específicas citadas en el libro (2012–2015) están mayormente desactualizadas; se ofrecen los equivalentes actuales con foco latinoamericano.

📖 Clasificación — Malhotra 2016 (vigente)

Datos internos: generados dentro de la organización. Incluyen bases de datos de clientes, almacenes de datos, minería de datos, sistemas ARC (CRM) y marketing de bases de datos.

Almacén de datos Base de datos centralizada que consolida información de toda la compañía, proveniente de distintos sistemas operativos.

Minería de datos Técnica que usa computadoras y programas estadísticos avanzados para analizar grandes bases de datos y descubrir patrones desconocidos con valor para el marketing.

ARC / CRM Sistema de apoyo para la toma de decisiones que administra las interacciones entre la organización y sus clientes. El marketing de bases de datos usa los datos del CRM para acciones de marketing con enfoque preciso.

Datos externos: obtenidos fuera de la organización — fuentes de negocios/no gubernamentales, gubernamentales, servicios sindicados y social media.

Recomendación metodológica (vigente): analizar datos internos antes de recurrir a externos. Las organizaciones procesan datos internos de manera habitual que pocas veces se aprovechan completamente.

Datos internos hoy: del CRM al Data Lakehouse

herramientasbibliografía

La infraestructura de datos internos evolucionó radicalmente desde 2016. El CRM tradicional es hoy apenas una capa de una arquitectura más compleja:

🛠 Evolución de la infraestructura de datos internos

CRM tradicionalSalesforce, HubSpot, Vtex (LATAM) — gestión de contactos y ventas

CDP (Customer Data Platform)Unifica datos de múltiples touchpoints en un perfil único del cliente

Data WarehouseBigQuery, Snowflake, Redshift — datos estructurados para análisis

Data LakeAWS S3, Azure Data Lake — datos crudos (structurados + no structurados) a escala

Minería de datos / MLModelos predictivos de churn, propensión de compra, personalización en tiempo real

Ejemplo LATAMGrupo Bimbo: integra datos de 50,000+ rutas de distribución diarias en +32 países en su Data Warehouse

📚 Referencia

Ghavami, P. (2023). Big Data Analytics Methods, 3ª ed. De Gruyter. — Referencia actualizada sobre minería de datos y ML aplicados a datos de marketing.

Fuentes externas: equivalentes actuales y latinoamericanos

latinoaméricabibliografía

El libro cita principalmente fuentes de EE.UU. (Census Bureau, Moody's, D&B, LexisNexis). Se presentan los equivalentes relevantes para investigación en América Latina:

🌎 Fuentes gubernamentales de LATAM

Institutos nacionales de estadística (equivalentes al Census Bureau): INE Uruguay (ine.gub.uy) · INDEC Argentina (indec.gob.ar) · IBGE Brasil (ibge.gov.br) · INEGI México (inegi.org.mx) · DANE Colombia (dane.gov.co) · INE Chile (ine.cl) · INEI Perú (inei.gob.pe).

Fuentes regionales gratuitas: CEPAL STAT (cepal.org/es/datos-y-estadisticas) — estadísticas comparadas de 33 países; BID Data (data.iadb.org) — indicadores de desarrollo; Latinobarómetro (latinobarometro.org) — opinión pública y valores.

Fuentes comerciales con cobertura LATAM: Euromonitor Passport — informes por industria y país; Statista (es.statista.com) — agregador de estadísticas; Americas Market Intelligence — investigación especializada en la región.

📚 Fuentes verificadas

INE Uruguay (2023). Encuesta Continua de Hogares 2022. ine.gub.uy — La fuente de referencia para datos socioeconómicos de Uruguay. Publicación anual gratuita.

CEPAL (2023). Panorama Social de América Latina y el Caribe 2023. cepal.org — Informe anual con indicadores de pobreza, desigualdad y empleo por país. Gratuito.

Banco Mundial (2023). World Development Indicators. data.worldbank.org — Base de datos abierta con indicadores de más de 200 países. Gratuita.

Sección 06

Naturaleza y clasificación de los datos sindicados

Los datos sindicados son una de las categorías más importantes en la práctica profesional. El marco conceptual del libro es completamente vigente; lo que cambió son las empresas específicas y la consolidación del sector.

📖 Definición y clasificación — Malhotra 2016 (vigente)

Fuentes sindicadas Compañías que recaban y venden conjuntos de datos diseñados para satisfacer las necesidades de información de varios clientes, incluyendo empresas que compiten en el mismo ramo. Cualquier cliente puede comprar los mismos datos — incluso dos competidores directos (como Coca-Cola y PepsiCo). Se adquieren generalmente por suscripción.

Se diferencian de la investigación a medida en que el objetivo que guía la búsqueda es común para varios clientes, no específico a uno. Esto reduce el costo significativamente. Los informes pueden adaptarse a las necesidades específicas de cada cliente (por territorios de ventas, líneas de producto).

Se clasifican según la unidad de medición:

Hogares/consumidores: mediante encuestas, paneles de compras y de medios, y servicios de escaneo electrónico.
Instituciones: auditorías a detallistas y mayoristas, y datos corporativos/industriales.

Recomendación: Siempre examinar datos sindicados pertinentes antes de recolectar datos primarios. Su costo es bajo en comparación con los primarios.

Lo que NO cambió: la lógica de los datos sindicados es idéntica en 2024 que en 2016. Cambiaron las empresas específicas, las plataformas de acceso y se sumaron nuevas categorías digitales — pero el principio de "datos para múltiples clientes a menor costo unitario" sigue siendo el núcleo del modelo de negocio.

El ecosistema sindicado hoy: consolidación y digitalización

bibliografíalatinoamérica

El sector experimentó consolidación significativa desde 2016. El libro menciona Nielsen, IRI, GfK, Ipsos, Kantar como empresas separadas. Los cambios más relevantes:

Nielsen se dividió en 2023: NielsenIQ (datos de retail y consumidor) y Nielsen Media (medición de audiencias).
IRI (Information Resources) se fusionó con NPD Group en 2022 para formar Circana.
GfK fue adquirida por NielsenIQ en 2023, creando la mayor empresa de datos de consumidor del mundo.
Kantar sigue independiente y es el proveedor dominante de panel de hogares en América Latina (Argentina, Brasil, Chile, Colombia, Ecuador, México, Perú, Venezuela).

📚 Fuentes

ESOMAR (2023). Global Market Research Report 2023. esomar.org — El informe anual más citado en la industria. Incluye rankings de proveedores y datos de gasto global por región.

Kantar Worldpanel (2023). Brand Footprint LATAM 2023. kantarworldpanel.com — Ranking de marcas compradas por más hogares en América Latina. Publicación anual con acceso al resumen ejecutivo.

Sección 07

Encuestas sindicadas

Las encuestas sindicadas son el método más flexible para obtener información sobre actitudes, valores y motivaciones a escala. El marco tipológico del libro es vigente; se actualizan los proveedores y se incorporan los paneles digitales.

📖 Tipos de encuestas sindicadas — Malhotra 2016 (vigente)

Encuestas periódicas Reúnen datos a intervalos regulares sobre el mismo conjunto de variables, con una nueva muestra de participantes cada vez. Permiten estudiar cambios en el tiempo sin el costo de mantener un panel estable.

Paneles ómnibus Un grupo grande de panelistas es reclutado; distintos clientes insertan sus preguntas en diferentes momentos. No miden las mismas variables repetidamente (eso los diferencia de los paneles longitudinales verdaderos).

Encuestas psicográficas y de estilos de vida Miden actividades, intereses y opiniones (AIO) para clasificar consumidores según valores y estilos de vida con propósitos de segmentación. El sistema VALS (Values and Lifestyles) de Strategic Business Insights es el más conocido.

Encuestas de evaluación de publicidad Miden el tamaño y perfil de audiencias publicitarias y evalúan la eficacia de la publicidad en distintos medios.

Ventajas y límites: las encuestas son flexibles y permiten plantear una gran variedad de preguntas. Su principal limitación: dependen de autorreportes, que pueden diferir del comportamiento real.

Encuestas sindicadas digitales: el nuevo estándar

herramientaslatinoaméricabibliografía

Las encuestas sindicadas migraron masivamente a formato digital. Los paneles en papel y las entrevistas telefónicas fueron reemplazados casi completamente por paneles online:

🛠 Principales proveedores con cobertura LATAM

GWI (Global Web Index)Panel de 700,000+ personas en 50 países. Referencia para audiencias digitales y tendencias de consumo

Kantar / TNS OmnibusPanel ómnibus en Argentina, Brasil, Chile, Colombia, México y Perú. Frecuencia mensual

OfferwisePanel regional especializado en LATAM; 18 países. Foco en mercados difíciles de alcanzar

NetquestPanel con fuerte presencia en España y LATAM. Estudios cuantitativos en línea

LatinobarómetroEncuesta periódica de valores en 18 países. Gratuita. Referencia para contexto cultural

LAPOP / Barómetro de las AméricasVanderbilt University. Base de datos abierta sobre opinión pública en 30+ países

📚 Referencias

GWI (2024). GWI Core Dataset. gwi.com — El panel más citado en informes de tendencias de consumo digital. Actualización trimestral, cobertura de 50 países.

Callegaro, M. et al. (2014). Online Panel Research: A Data Quality Perspective. Wiley. — La referencia metodológica más completa sobre calidad en paneles online, con discusión de sesgos específicos de los paneles digitales.

Sección 08

Paneles de compras y de medios de comunicación

Los paneles siguen siendo la herramienta más poderosa para datos longitudinales de comportamiento del consumidor. La lógica conceptual es intacta; el ecosistema de medición evolucionó radicalmente.

📖 Paneles — Malhotra 2016 (vigente)

Los paneles se componen de individuos, hogares u organizaciones que registran sus compras y comportamiento a lo largo del tiempo. La característica distintiva frente a las encuestas es que los participantes o dispositivos electrónicos registran conductas en el momento en que ocurren — no con base en el recuerdo posterior.

Paneles de compras Los participantes registran sus compras en un diario o electrónicamente. Permiten estudiar: lealtad de marca, cambio de marca, elasticidad de precio, eficacia de promociones y perfil del comprador.

Paneles de medios Dispositivos electrónicos registran automáticamente el consumo de medios (TV, radio, Internet, dispositivos móviles). Se clasifican según el tipo de consumo que miden.

Ventajas sobre encuestas: mayor exactitud (registro en el momento), datos longitudinales, capacidad de vincular compras con características del consumidor.

Desventajas: los miembros pueden no ser representativos de la población general; grupos minoritarios y personas con bajo nivel educativo suelen estar subrepresentados; el simple hecho de pertenecer al panel puede alterar el comportamiento.

Caso actualizado: Kantar Worldpanel en América Latina

caso reallatinoamérica

El libro menciona el panel Homescan de Nielsen (250,000 familias en 27 países) como el referente global. En América Latina, el panel de hogares más influyente es el de Kantar Worldpanel:

🛒 Panel de referencia en LATAM

Kantar Worldpanel: penetración de hogares y Brand Footprint

Kantar Worldpanel opera en Argentina, Brasil, Chile, Colombia, Ecuador, México, Perú y Venezuela. Sus datos de panel miden la penetración de marcas en el hogar (Household Penetration) — el porcentaje de hogares que compró la marca al menos una vez al año — y la frecuencia de compra.

Su reporte Brand Footprint LATAM 2023 reveló que Coca-Cola lidera como la marca más comprada de la región por décimo año consecutivo, seguida de Palmolive y Colgate. En Uruguay específicamente, CONAPROLE es la marca local con mayor penetración en el hogar, por encima de marcas multinacionales en la categoría láctea.

Pregunta para clase: ¿Por qué la "penetración del hogar" es una métrica más útil que el volumen de ventas total para decidir si una marca debe invertir en adquirir nuevos compradores vs. aumentar la frecuencia de compra de los actuales?

📚 Fuentes

Kantar Worldpanel (2023). Brand Footprint: Latin America 2023. kantarworldpanel.com — Acceso gratuito al resumen ejecutivo. Permite discutir metodología de panel con datos reales de la región.

Sharp, B. (2010). How Brands Grow: What Marketers Don't Know. Oxford University Press. — Popularizó el uso de datos de panel (Ehrenberg-Bass Institute) para entender dinámica de crecimiento de marcas. Referencia académica fundamental sobre paneles de compras en marketing.

Medición de audiencias en la era del streaming y la fragmentación

herramientasbibliografía

El libro describe los paneles de medios de Nielsen como el referente de medición televisiva. En 2024, el ecosistema de medios está radicalmente fragmentado: televisión lineal, streaming, YouTube y apps móviles tienen métricas separadas:

TV lineal en LATAM: Kantar IBOPE Media (Argentina, Chile, Colombia) y Nielsen (México, Brasil) miden rating en tiempo real.
Streaming: Netflix publicó sus primeros datos de horas vistas por título en 2022; Prime Video y Disney+ aún no son completamente transparentes.
Medición cross-media: Nielsen ONE (lanzado en 2022) intenta consolidar todas las pantallas en una métrica unificada. Todavía en implementación.
Digital: Comscore mide audiencias web y móvil; SimilarWeb estima tráfico sin panel de seguimiento.

📚 Referencia

Napoli, P.M. (2023). Audience Economics: Media Institutions and the Audience Marketplace, 2ª ed. Columbia University Press. — Actualiza el clásico sobre economía de audiencias con el impacto del streaming y la medición algorítmica.

Sección 09

Servicios de escaneo electrónico

El escaneo sigue siendo la fuente de datos de punto de venta más precisa y rápida para bienes de consumo masivo. La tecnología base se mantiene; se suman nuevas fuentes digitales de datos de compra.

📖 Tipos de datos de escaneo — Malhotra 2016 (vigente)

Datos de escaneo Se obtienen al leer el código universal de producto (UPC/EAN) en la caja registradora. Son más rápidos y precisos que los datos de encuesta o panel manual, eliminan errores de memoria y registran variables de tienda (precio, promociones, exhibiciones). Se clasifican en tres tipos:

Datos de seguimiento de volumen: ventas por marca, tamaño, precio y sabor a nivel de tienda. No vinculan compras con el comprador individual. SCANTRACK (Nielsen) e InfoScan (IRI) son los servicios históricos de referencia.
Paneles de escaneo: cada miembro del panel presenta una tarjeta ID al pagar, vinculando la compra con su identidad. Genera datos longitudinales a nivel individual.
Paneles de escaneo con televisión por cable: combinan datos de compra con exposición controlada a anuncios diferentes por hogar. Permiten experimentos cuasi-naturales sobre eficacia publicitaria.

Limitaciones: cubren solo establecimientos con escáneres; no capturan actitudes ni motivaciones; pueden excluir canales informales relevantes en LATAM.

Caso actualizado: NielsenIQ en América Latina y el sell-out omnicanal

caso reallatinoamérica

📊 Dato sindicado de referencia en LATAM

NielsenIQ Discover: del UPC al omnichannel tracking

NielsenIQ (fusionada con GfK en 2023) opera en Argentina, Brasil, Chile, Colombia, México, Perú y otros. Su plataforma NielsenIQ Discover integra: auditorías en tienda física, datos de cajas registradoras, datos de e-commerce (Mercado Libre, Amazon, Falabella), y datos de programas de fidelidad de cadenas de supermercados.

Un fabricante de cuidado personal puede monitorear semanalmente la participación de mercado de su champú Dove frente a Head and Shoulders (P&G) en el canal supermercado de São Paulo, desagregada por formato de tienda y región — información inimaginable con las auditorías físicas tradicionales del libro.

Pregunta para clase: ¿Cuál de los seis criterios SEOANC es más crítico al interpretar datos de NielsenIQ para tomar decisiones de distribución en el canal informal (kioscos, almacenes de barrio) que históricamente no tenían escáneres?

📚 Fuentes

NielsenIQ (2024). Consumer Outlook Latin America 2024. nielseniq.com/latam — Informe semestral gratuito sobre tendencias de consumo en la región, basado en datos de panel y escaneo.

Shankar, V. et al. (2021). "How technology is changing retail." Journal of Retailing, 97(1), 13–27. — Revisa cómo la digitalización del retail transforma la recolección de datos de punto de venta, incluyendo la integración online-offline.

Más allá del UPC: nuevas fuentes digitales de datos de compra

herramientaslatinoamérica

El principio del escaneo — registrar automáticamente conductas de compra en el punto de venta — se extendió a nuevos formatos que el libro no podía anticipar:

Programas de fidelidad digitales: las tarjetas de puntos y apps (Tienda Inglesa en Uruguay, CMR de Falabella, Disco+) generan datos vinculados al comprador idénticos a los paneles de escaneo — y con mayor cobertura geográfica en LATAM que los paneles tradicionales.
E-commerce nativo: Mercado Libre, Rappi y PedidosYa registran cada transacción con datos completos del comprador, producto, contexto de compra y promoción activa en tiempo real.
Tiendas sin cajeros (Amazon Go): visión computacional que registra cada artículo tomado del estante. Aún en expansión piloto fuera de EE.UU.

📚 Referencia

Bradlow, E.T. et al. (2017). "The role of big data and predictive analytics in retailing." Journal of Retailing, 93(1), 79–95. DOI: 10.1016/j.jretai.2016.12.004 — Marco conceptual actualizado sobre cómo los datos de punto de venta digital transforman la investigación de mercados en retail.

Sección 10

Auditorías a detallistas y mayoristas · Servicios industriales

Las auditorías de canal siguen siendo la referencia para medir participación de mercado en punto de venta físico. Los servicios industriales permiten investigar mercados B2B con datos sindicados.

📖 Auditorías y servicios institucionales — Malhotra 2016 (vigente)

Auditoría Proceso de recopilación de datos derivado de registros físicos o análisis de inventarios. Mide el flujo de productos a través del canal — detallistas y mayoristas — registrando niveles de inventario, distribución y la influencia de programas promocionales y de precios.

La información de auditoría se usa para: (1) determinar tamaño del mercado y participación por tipo de tienda, región o ciudad; (2) evaluar actividad de la competencia; (3) identificar problemas de distribución y espacio de anaquel; (4) establecer potenciales de venta; (5) verificar asignación de promociones.

Desventaja clave: cobertura limitada a establecimientos participantes y desfase de 2 meses entre el ciclo de auditoría y la publicación de los informes. Los datos de auditoría no pueden vincularse directamente con características individuales del consumidor.

Servicios industriales Datos sindicados sobre compañías, negocios e instituciones para marketing B2B. Reúnen datos financieros, operativos y de empleo clasificados por el Sistema de Clasificación Industrial (NAICS). Se recaban mediante interrogatorios directos, seguimiento de publicaciones comerciales e informes corporativos.

Investigación de una sola fuente Combinación de datos de múltiples fuentes sindicadas que sigue el proceso completo de marketing: vincula información demográfica y psicográfica del individuo con sus hábitos de exposición a medios y sus compras reales.

Servicios industriales actualizados: de D&B a LinkedIn Sales Navigator

herramientasbibliografía

El libro menciona D&B (Dun & Bradstreet) como la referencia de datos sobre empresas. D&B sigue siendo relevante, pero el ecosistema de datos empresariales se amplió significativamente:

🛠 Fuentes actuales de datos sindicados B2B

D&B HooversSigue siendo referencia; cubre 500M+ compañías globales. hoovers.com

LinkedIn Sales NavigatorDatos de empresas y contactos con actualización continua. Dominante para prospección B2B.

ZoomInfo / Apollo.ioBases de datos de contactos con datos de "intent" (señales de compra). Crecimiento exponencial desde 2020.

CrunchbaseStartups, rondas de inversión, fundadores. Referencia para mercados de tecnología y emprendimiento en LATAM.

EMISDatos financieros de industria para mercados emergentes, incluyendo LATAM.

Refinitiv / LSEGDatos financieros de empresas cotizadas globalmente. Estándar en finanzas e inversión.

📚 Referencia

Järvinen, J. & Taiminen, H. (2016). "Harnessing marketing automation for B2B content marketing." Industrial Marketing Management, 54, 164–175. — Ilustra cómo los datos sindicados B2B se integran con automatización para personalizar la comunicación comercial.

Sección 11

Social media y datos digitales como fuente secundaria

El libro introduce el social media como fuente de datos secundarios con ejemplos de 2012–2013. En 2024, el ecosistema de datos digitales es radicalmente más rico, fragmentado y metodológicamente más complejo.

📖 Social media como fuente de datos secundarios — Malhotra 2016 (vigente en su lógica)

El análisis del contenido de los social media facilita el proceso de diseño de investigación de dos maneras: (1) como herramienta de investigación exploratoria para identificar temas, percepciones y patrones antes de diseñar encuestas; (2) como fuente de datos secundarios externos que se actualiza en tiempo real.

Permiten analizar: menciones de marca, sentimiento del consumidor, tendencias emergentes, conversaciones sobre productos y comportamiento de influenciadores. Son especialmente útiles en la fase exploratoria.

Límites metodológicos señalados en el libro (vigentes y ampliados): los datos de social media provienen de usuarios que decidieron expresarse públicamente — no son una muestra representativa de todos los consumidores. Las diferencias entre plataformas, los sesgos de selección y el ruido deben considerarse cuidadosamente.

Advertencia metodológica central: los datos de social media NO son una muestra aleatoria de consumidores. Representan a quienes eligieron publicar en esa plataforma. En LATAM, donde la brecha digital aún es significativa, el sesgo de representatividad es mayor. Los hallazgos de social listening son válidos para generar hipótesis (investigación exploratoria), no para estimar prevalencias en la población general.

El ecosistema de datos digitales en 2024: herramientas y advertencias

herramientasbibliografía

🛠 Herramientas actuales para datos digitales como fuente secundaria

Social listeningBrandwatch, Sprinklr, Mention: monitoreo de menciones y análisis de sentimiento en redes, foros y noticias

Búsquedas (gratuito)Google Trends: interés de búsqueda en el tiempo por región. Útil para demanda latente y estacionalidad

Tráfico webSimilarWeb, Semrush: tráfico y fuentes de visitas de cualquier sitio. Benchmarking competitivo digital

Plataformas propiasMeta Business Suite, TikTok Insights, YouTube Analytics: datos de audiencia de la marca en redes sociales

ReseñasReviewTrackers, Yotpo: agrega reseñas de Google Maps, Tripadvisor y e-commerce

Open data LATAMdatos.gub.uy (Uruguay), datos.gob.ar (Argentina): portales gubernamentales de datos abiertos. Gratuitos

📚 Referencias

Tufekci, Z. (2014). "Big questions for social media big data: Representativeness, validity and other methodological pitfalls." Proceedings of ICWSM 2014. — El paper de referencia sobre los límites metodológicos de usar datos de Twitter/redes sociales en investigación.

Tirunillai, S. & Tellis, G.J. (2014). "Mining marketing meaning from online chatter." Journal of Marketing Research, 51(4), 463–479. — Metodología para extraer insights estratégicos de datos de texto en redes sociales, con validación cuantitativa.

Caso: datos digitales en investigación exploratoria en Uruguay

caso reallatinoamérica

🇺🇾 Caso en clase — Uruguay

Pilsen Uruguay: monitoreo de conversación de marca en redes sociales

Antes de redefinir su posicionamiento post-pandemia, el equipo de marketing de Pilsen (FNC) analizó datos digitales secundarios como fase exploratoria. Las fuentes incluyeron: menciones en Twitter/X e Instagram con herramientas de social listening; búsquedas en Google Trends de "cerveza uruguaya" vs. "cerveza artesanal" en Uruguay (2019–2022); reseñas en Google Maps de bares y almacenes; y comentarios en grupos de Facebook de consumidores de cerveza.

El análisis reveló que el atributo "precio accesible" había desplazado al atributo "identidad uruguaya" como razón de compra principal — un hallazgo que requería validación con investigación primaria cuantitativa pero que orientó el diseño del cuestionario posterior.

Pregunta para clase: ¿Qué criterios del marco SEOANC aplicarías para evaluar las reseñas de Google Maps como fuente de datos secundarios? ¿Qué sesgos sistemáticos podrían tener?

Sección 12

Investigación internacional y contexto latinoamericano

El libro aborda la investigación internacional con datos de 2012 y ejemplos centrados en EE.UU. Los conceptos sobre comparabilidad y fuentes internacionales son vigentes. Los datos y ejemplos regionales se actualizan completamente.

📖 Investigación internacional — Malhotra 2016 (vigente conceptualmente)

En la investigación internacional, los datos secundarios adquieren importancia especial: no siempre es viable recolectar datos primarios en múltiples países, y la comparabilidad entre naciones requiere fuentes estandarizadas.

Desafíos metodológicos: las diferencias en definiciones estadísticas entre países (qué se considera "ingreso medio", cómo se clasifica la industria) dificultan las comparaciones directas. El investigador debe verificar que categorías y unidades de medida sean compatibles antes de comparar fuentes de distintos países.

Procedimiento recomendado (vigente): (1) identificar el problema específico; (2) buscar en fuentes gubernamentales del país objetivo; (3) revisar organismos internacionales (BM, FMI, CEPAL); (4) consultar servicios sindicados con cobertura global; (5) evaluar cada fuente con los criterios SEOANC.

Desafíos específicos de datos secundarios en América Latina

latinoaméricabibliografía

LATAM presenta desafíos específicos que el libro no anticipa porque sus ejemplos internacionales se centran en mercados desarrollados:

Economía informal: entre el 45% (Chile) y el 70% (Bolivia) de la fuerza laboral opera en el sector informal (OIT, 2023). Los datos secundarios formales no capturan adecuadamente esta realidad económica.
Heterogeneidad intra-regional: el ingreso per cápita de Chile ($16,000 USD PPP) es cuatro veces el de Bolivia ($4,000). Los datos regionales promediados pueden ocultar diferencias críticas para las decisiones de marketing.
Brecha digital: la penetración de internet varía del 91% (Uruguay) al 45% (Nicaragua) según la ITU (2023). Los datos digitales secundarios sobrerrepresentan a la población urbana y conectada.
Distintos marcos legales de privacidad: Brasil (LGPD), México (LFPDPPP), Argentina (Ley 25.326) y Uruguay (Ley 18.331) tienen requisitos diferentes sobre recolección y uso de datos, lo que afecta la disponibilidad de ciertas fuentes sindicadas.

🌎 Fuentes de referencia para investigación en LATAM

Para contexto socioeconómico: CEPAL STAT (statistics.cepal.org) — estadísticas comparadas de 33 países; BID Data (data.iadb.org) — indicadores de desarrollo; Latinobarómetro — valores y opinión pública regional.

Para consumidor y mercados: Kantar Worldpanel — panel de hogares; Euromonitor Passport — informes de industria por país; GWI — consumo digital por región; eMarketer/Insider Intelligence — mercados digitales.

Para datos gubernamentales nacionales: INE Uruguay · INDEC Argentina · IBGE Brasil · INEGI México · DANE Colombia · INE Chile · INEI Perú.

📚 Referencias

OIT (2023). Panorama Laboral de América Latina y el Caribe 2023. ilo.org/americas — Informe anual con datos sobre empleo formal/informal por país. Gratuito.

ITU (2023). Measuring Digital Development: Facts and Figures 2023. itu.int — Datos de penetración de internet y móviles por país. Gratuito.

CEPAL (2023). Perspectivas del Comercio Internacional de América Latina y el Caribe 2023. cepal.org — Marco contextual para entender la dinámica de mercados en la región.

Sección 13

Ética en el uso de datos secundarios y sindicados

El libro introduce la ética del diseño de investigación con un marco clásico de responsabilidades. En 2024, los temas éticos centrales incluyen privacidad de datos, marcos legales de LATAM, sesgo algorítmico y uso de datos sin consentimiento explícito.

📖 Ética en el diseño de investigación — Malhotra 2016 (vigente como marco)

Los aspectos éticos en esta etapa involucran principalmente: la recolección de datos secundarios de manera que no perjudique a los participantes originales; el uso de datos sindicados dentro de los términos de la licencia de suscripción; y la transparencia sobre las limitaciones de las fuentes al reportar resultados.

Los contratos de datos sindicados suelen prohibir compartir los datos brutos con terceros no suscriptores — incluyendo colegas de otras divisiones de la misma empresa.

La responsabilidad de evaluar y reportar honestamente las limitaciones de los datos secundarios recae sobre el investigador, independientemente de la presión del cliente por obtener hallazgos favorables.

① Privacidad de datos y marcos legales en LATAM

bibliografíalatinoamérica

Desde 2018, el uso de datos personales — incluyendo datos secundarios sobre consumidores — está regulado por marcos legales que el investigador debe conocer:

RGPD / GDPR (Unión Europea, 2018): aplica cuando los datos involucran ciudadanos europeos, independientemente de dónde opere la empresa. Establece consentimiento explícito, derecho al olvido y portabilidad de datos.
LGPD (Brasil, 2020): Lei Geral de Proteção de Dados. Aplica a cualquier empresa que procese datos de personas en Brasil.
LFPDPPP (México, 2010): Ley Federal de Protección de Datos Personales en Posesión de los Particulares. La primera ley de privacidad de datos de LATAM.
Ley 25.326 y modificaciones (Argentina): actualizada para alinearse parcialmente con el GDPR.
Ley 18.331 (Uruguay): Protección de Datos Personales y Acción de Habeas Data. Uruguay es el único país de LATAM con reconocimiento de "adecuación" de la UE — sus estándares se consideran equivalentes al GDPR.

📚 Fuentes

AGESIC Uruguay (2022). Ley 18.331 de Protección de Datos Personales. agesic.gub.uy — La agencia reguladora uruguaya publica guías de cumplimiento para organizaciones e investigadores.

ANPD Brasil (2023). Guia Orientativo para Definições dos Agentes de Tratamento de Dados Pessoais. gov.br/anpd — Autoridad de Protección de Datos de Brasil; guías de cumplimiento para investigadores y empresas.

② Sesgos algorítmicos en el análisis de datos secundarios

bibliografía

Cuando la investigación usa herramientas de IA para analizar datos secundarios (análisis de sentimiento, clasificación automática de respuestas, resumen de textos), existe riesgo de que el modelo reproduzca sesgos presentes en sus datos de entrenamiento.

Ejemplos documentados: modelos de análisis de sentimiento entrenados principalmente en inglés clasifican incorrectamente el sarcasmo en español rioplatense o el lunfardo; herramientas de reconocimiento facial entrenadas con datos de EE.UU. tienen tasas de error significativamente mayores en personas afrodescendientes.

Adicionalmente, crece el uso de datos sintéticos — generados por modelos de IA a partir de datos reales — para proteger privacidad. Los datos sintéticos pueden perpetuar los sesgos del modelo generador de manera no visible para el investigador.

📚 Referencias

Buolamwini, J. & Gebru, T. (2018). "Gender shades: Intersectional accuracy disparities in commercial gender classification." Proceedings of Machine Learning Research, 81, 1–15. — El paper fundacional sobre sesgo en sistemas de IA aplicados a datos de personas, con evidencia experimental.

O'Neil, C. (2016). Weapons of Math Destruction. Crown. — Explicación accesible de cómo los algoritmos reproducen sesgos con consecuencias reales en decisiones de negocio.

③ Uso de datos sin consentimiento explícito y scraping de redes sociales

bibliografía

Una práctica creciente es el web scraping — extracción automática de datos de redes sociales, foros y sitios web. Si bien técnicamente posible, plantea dilemas éticos que el libro no aborda:

Los usuarios publican en redes sociales para su audiencia, no para ser objeto de investigación de mercados.
Los términos de uso de la mayoría de plataformas (Twitter/X, Instagram, LinkedIn) prohíben el scraping masivo.
El uso de la API oficial de las plataformas (cuando existe y es accesible) es metodológicamente superior y más estable.
El GDPR y leyes equivalentes requieren base legal para procesar datos de personas identificables, incluso si son públicamente accesibles.

📚 Referencias

Williams, M.L., Burnap, P. & Sloan, L. (2017). "Towards an ethical framework for publishing Twitter data in social research." Sociology, 51(6), 1149–1168. — El marco más citado sobre ética en el uso de datos de redes sociales en investigación.

ESOMAR (2022). ICC/ESOMAR International Code on Market, Opinion and Social Research and Data Analytics. esomar.org — El código de ética de referencia de la industria. Acceso gratuito. Incluye guías específicas sobre datos de redes sociales.