Únete a la comunidad recientemente lanzada de
Discord para participar en debates en tiempo real, obtener asistencia de otros miembros y comunicarte directamente con el equipo de Meridian.
Observaciones de los datos de exclusión (división de entrenamiento y prueba)
Organiza tus páginas con colecciones
Guarda y categoriza el contenido según tus preferencias.
La especificación del modelo Meridian contiene un argumento holdout_id
(un array booleano de dimensiones \(G \times T\)) que se puede usar para especificar una muestra de datos de exclusión. Los datos de KPI de las observaciones de los datos de exclusión se ignoran durante el entrenamiento del modelo (por ejemplo, durante el muestreo posterior de MCMC) y no afectan la verosimilitud ni la densidad de probabilidades a posteriori del modelo. No obstante, los datos de medios de las observaciones de los datos de exclusión sí se usan para entrenar el modelo, ya que afectan los valores de los medios almacenados en Adstock para períodos posteriores.
La muestra de datos de exclusión se usa principalmente para calcular las métricas de bondad de ajuste fuera de la muestra, como el R cuadrado. Esto es útil para comparar diferentes especificaciones de modelos, como las fortalezas de la distribución de probabilidades a priori, siempre que cada modelo que se compare use la misma muestra de datos de exclusión. No se puede garantizar que el modelo con el mejor ajuste fuera de la muestra sea el más adecuado para la inferencia causal, pero, por lo general, se prefiere un modelo con mejor ajuste. Las especificaciones incorrectas del modelo que generan un ajuste deficiente también pueden causar sesgos en la inferencia causal.
Recomendamos usar una muestra de datos de exclusión que esté relativamente equilibrada en cuanto a ubicaciones geográficas y períodos. En otras palabras, usa una muestra de datos de exclusión que tenga aproximadamente la misma cantidad de observaciones de datos de exclusión para cada ubicación geográfica y para cada período. Si la muestra de datos de exclusión no está equilibrada, se pueden obtener muy pocas observaciones en el entrenamiento para estimar el efecto geográfico\(\tau_g\) para ciertas ubicaciones geográficas o el efecto temporal \(\mu_t\) para ciertos períodos. De forma predeterminada, Meridian no especifica una muestra de datos de exclusión. Tú debes especificar la muestra de datos de exclusión y asegurarte de que esté razonablemente equilibrada.
Evita excluir grandes fragmentos de datos contiguos en el tiempo, como al final del período del MMM, para evaluar el error de previsión en el KPI. Meridian no está diseñado para predecir el KPI, sobre todo si tiene una tendencia y una estacionalidad fuertes. En su lugar, Meridian estima el impacto causal de los medios y usa el enfoque basado en nudos para modelar la tendencia y la estacionalidad. El enfoque basado en nudos necesita datos cerca del nudo para realizar una estimación efectiva.
Si se excluyen grandes fragmentos de datos contiguos en el tiempo, no habrá datos cerca de los nudos dentro del período excluido. En este caso, la distribución de la probabilidad a posteriori del nudo estará impulsada por la probabilidad a priori, lo que puede generar una previsión deficiente.
Además, Meridian se puede usar para estimar el impacto de los medios en el pasado y en el futuro, ya que supone que los parámetros del modelo que determinan el impacto son constantes a lo largo del tiempo.
Salvo que se indique lo contrario, el contenido de esta página está sujeto a la licencia Atribución 4.0 de Creative Commons, y los ejemplos de código están sujetos a la licencia Apache 2.0. Para obtener más información, consulta las políticas del sitio de Google Developers. Java es una marca registrada de Oracle o sus afiliados.
Última actualización: 2025-08-04 (UTC)
[[["Fácil de comprender","easyToUnderstand","thumb-up"],["Resolvió mi problema","solvedMyProblem","thumb-up"],["Otro","otherUp","thumb-up"]],[["Falta la información que necesito","missingTheInformationINeed","thumb-down"],["Muy complicado o demasiados pasos","tooComplicatedTooManySteps","thumb-down"],["Desactualizado","outOfDate","thumb-down"],["Problema de traducción","translationIssue","thumb-down"],["Problema con las muestras o los códigos","samplesCodeIssue","thumb-down"],["Otro","otherDown","thumb-down"]],["Última actualización: 2025-08-04 (UTC)"],[[["\u003cp\u003eThe Meridian model's \u003ccode\u003eholdout_id\u003c/code\u003e argument allows you to specify a holdout sample for calculating out-of-sample goodness of fit metrics, like R-squared, to compare different model specifications.\u003c/p\u003e\n"],["\u003cp\u003eWhile media data for holdout observations is used in training, their KPI data is excluded, ensuring the holdout sample doesn't influence model parameters.\u003c/p\u003e\n"],["\u003cp\u003eFor optimal performance, use a balanced holdout sample across geos and time periods to ensure sufficient data for accurate model estimation.\u003c/p\u003e\n"],["\u003cp\u003eAvoid holding out large, continuous time chunks as Meridian focuses on causal impact estimation, not KPI forecasting, and requires data near knots for effective trend and seasonality modeling.\u003c/p\u003e\n"],["\u003cp\u003eMeridian can be used to estimate the impact of both past and future media due to its assumption of consistent media impact parameters over time.\u003c/p\u003e\n"]]],["The `holdout_id` in the Meridian model defines a holdout sample, where KPI data is excluded from model training but media data is still used. This holdout is used to calculate out-of-sample fit metrics. It is recommended the holdout sample be balanced across geos and time periods. Avoid holding out large contiguous time blocks as this can negatively impact the estimation of knots, affecting model forecasting ability. Meridian can estimate the impact of both past and future media.\n"],null,["# Holdout observations (train and test split)\n\nThe Meridian model specification contains a `holdout_id` argument (a\nboolean array of dimensions \\\\(G \\\\times T\\\\)) that can be used to specify a\nholdout sample. The KPI data of the holdout observations is ignored during model\ntraining (for example, MCMC posterior sampling), and does not affect the model\nlikelihood or posterior density. Media data for the holdout observations is\nstill used for model training, because it affects the adstocked media values for\nsubsequent time periods.\n\nThe primary use of the holdout sample is for calculating out-of-sample goodness\nof fit metrics, such as R-squared. This is useful for comparing different model\nspecifications, such as prior distribution strengths, provided that each model\nbeing compared uses the same holdout sample. There is no guarantee that the\nmodel with the best out-of-sample model fit is the best model for causal\ninference, but generally a better fitting model is preferred. Model\nmisspecifications that lead to poor model fit can also cause bias in causal\ninference.\n\nWe recommend using a holdout sample that is fairly balanced across geos and time\nperiods. In other words, use a holdout sample that has approximately the same\nnumber of holdout observations for each geo and approximately the same number of\nholdout observations for each time period. If the holdout sample is imbalanced,\nthis can result in too few training observations to estimate the geo effect\n\\\\(\\\\tau_g\\\\) for certain geos, or the time effect \\\\(\\\\mu_t\\\\) for certain time\nperiods. By default, Meridian does not specify a holdout sample. You\nmust specify the holdout sample and ensure that it has a reasonable degree of\nbalance.\n\nAvoid holding out large, contiguous-in-time, chunks of data, such as at the end\nof the MMM time window, to assess forecast error in the KPI. Meridian\nisn't designed for forecasting the KPI, especially if there is strong trend and\nseasonality in the KPI. Instead, Meridian estimates the causal media\nimpact and uses the knot-based approach to modeling trend and seasonality. The\nknot-based approach needs data near the knot to estimate the knot effectively.\nIf large, contiguous-in-time, chunks of data are held out, there is no data near\nthe knots within the held out period. In this case, the knot's posterior\ndistribution is driven by the prior, which can result in poor forecasting.\n\nAdditionally, Meridian can be used to estimate the impact of both\nhistorical and future media because it assumes that model parameters which\ndetermine media impact are consistent over time."]]