Rejoignez la nouvelle communauté
Discord pour discuter en temps réel, obtenir l'aide de vos pairs et communiquer directement avec l'équipe Meridian.
Observations de validation (répartition entre entraînement et test)
Restez organisé à l'aide des collections
Enregistrez et classez les contenus selon vos préférences.
La spécification du modèle Meridian contient un argument holdout_id
(un tableau booléen de dimensions \(G \times T\)) qui peut être utilisé pour spécifier un échantillon de validation. Les données de KPI des observations de validation sont ignorées lors de l'entraînement du modèle (par exemple, échantillonnage a posteriori MCMC) et n'ont aucune incidence sur la densité a posteriori ou la probabilité du modèle. Les données média des observations de validation sont toujours utilisées pour l'entraînement du modèle, car elles affectent les valeurs média de l'inventaire publicitaire pour les périodes suivantes.
L'échantillon de validation est principalement utilisé pour calculer la qualité hors échantillon des métriques d'ajustement, telles que le coefficient de détermination. Cela est utile pour comparer différentes spécifications de modèle, telles que les avantages d'une distribution a priori, à condition que chaque modèle comparé utilise le même échantillon de validation. Rien ne garantit que le modèle ayant le meilleur ajustement hors échantillon soit le meilleur modèle pour l'inférence causale, mais en général, un modèle mieux ajusté est préférable. Les spécifications de modèle incorrectes qui entraînent un mauvais ajustement du modèle peuvent également entraîner un biais dans l'inférence causale.
Nous vous recommandons d'utiliser un échantillon de validation qui soit assez équilibré en termes de zones géographiques et de périodes. En d'autres termes, utilisez un échantillon de validation qui comporte approximativement le même nombre d'observations de validation pour chaque zone géographique et pour chaque période. Si l'échantillon de validation est déséquilibré, il peut en résulter un nombre insuffisant d'observations d'entraînement pour estimer l'effet géographique\(\tau_g\) pour certaines zones géographiques ou l'effet temporel \(\mu_t\) pour certaines périodes. Par défaut, Meridian ne spécifie pas d'échantillon de validation. Vous devez spécifier l'échantillon de validation et vous assurer qu'il présente un degré d'équilibre raisonnable.
Évitez de réserver de grands segments de données contigus dans le temps, par exemple à la fin de la période MMM, pour évaluer l'erreur de prévision dans le KPI. Meridian n'est pas conçu pour prévoir le KPI, en particulier s'il présente une tendance et une saisonnalité fortes. Meridian estime plutôt l'impact média causal et utilise l'approche basée sur les nœuds pour modéliser les tendances et la saisonnalité. L'approche basée sur les nœuds nécessite des données à proximité du nœud pour estimer efficacement le nœud.
Si de grands segments de données contigus sont utilisés pour la validation, il n'y a pas de données à proximité des nœuds pendant la période de validation. Dans ce cas, la distribution a posteriori du nœud est déterminée par le prior, ce qui peut entraîner des prévisions médiocres.
De plus, Meridian peut être utilisé pour estimer l'impact média historique et futur, car il suppose que les paramètres du modèle qui déterminent l'impact média restent cohérents au fil du temps.
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2025/08/04 (UTC).
[[["Facile à comprendre","easyToUnderstand","thumb-up"],["J'ai pu résoudre mon problème","solvedMyProblem","thumb-up"],["Autre","otherUp","thumb-up"]],[["Il n'y a pas l'information dont j'ai besoin","missingTheInformationINeed","thumb-down"],["Trop compliqué/Trop d'étapes","tooComplicatedTooManySteps","thumb-down"],["Obsolète","outOfDate","thumb-down"],["Problème de traduction","translationIssue","thumb-down"],["Mauvais exemple/Erreur de code","samplesCodeIssue","thumb-down"],["Autre","otherDown","thumb-down"]],["Dernière mise à jour le 2025/08/04 (UTC)."],[[["\u003cp\u003eThe Meridian model's \u003ccode\u003eholdout_id\u003c/code\u003e argument allows you to specify a holdout sample for calculating out-of-sample goodness of fit metrics, like R-squared, to compare different model specifications.\u003c/p\u003e\n"],["\u003cp\u003eWhile media data for holdout observations is used in training, their KPI data is excluded, ensuring the holdout sample doesn't influence model parameters.\u003c/p\u003e\n"],["\u003cp\u003eFor optimal performance, use a balanced holdout sample across geos and time periods to ensure sufficient data for accurate model estimation.\u003c/p\u003e\n"],["\u003cp\u003eAvoid holding out large, continuous time chunks as Meridian focuses on causal impact estimation, not KPI forecasting, and requires data near knots for effective trend and seasonality modeling.\u003c/p\u003e\n"],["\u003cp\u003eMeridian can be used to estimate the impact of both past and future media due to its assumption of consistent media impact parameters over time.\u003c/p\u003e\n"]]],["The `holdout_id` in the Meridian model defines a holdout sample, where KPI data is excluded from model training but media data is still used. This holdout is used to calculate out-of-sample fit metrics. It is recommended the holdout sample be balanced across geos and time periods. Avoid holding out large contiguous time blocks as this can negatively impact the estimation of knots, affecting model forecasting ability. Meridian can estimate the impact of both past and future media.\n"],null,["# Holdout observations (train and test split)\n\nThe Meridian model specification contains a `holdout_id` argument (a\nboolean array of dimensions \\\\(G \\\\times T\\\\)) that can be used to specify a\nholdout sample. The KPI data of the holdout observations is ignored during model\ntraining (for example, MCMC posterior sampling), and does not affect the model\nlikelihood or posterior density. Media data for the holdout observations is\nstill used for model training, because it affects the adstocked media values for\nsubsequent time periods.\n\nThe primary use of the holdout sample is for calculating out-of-sample goodness\nof fit metrics, such as R-squared. This is useful for comparing different model\nspecifications, such as prior distribution strengths, provided that each model\nbeing compared uses the same holdout sample. There is no guarantee that the\nmodel with the best out-of-sample model fit is the best model for causal\ninference, but generally a better fitting model is preferred. Model\nmisspecifications that lead to poor model fit can also cause bias in causal\ninference.\n\nWe recommend using a holdout sample that is fairly balanced across geos and time\nperiods. In other words, use a holdout sample that has approximately the same\nnumber of holdout observations for each geo and approximately the same number of\nholdout observations for each time period. If the holdout sample is imbalanced,\nthis can result in too few training observations to estimate the geo effect\n\\\\(\\\\tau_g\\\\) for certain geos, or the time effect \\\\(\\\\mu_t\\\\) for certain time\nperiods. By default, Meridian does not specify a holdout sample. You\nmust specify the holdout sample and ensure that it has a reasonable degree of\nbalance.\n\nAvoid holding out large, contiguous-in-time, chunks of data, such as at the end\nof the MMM time window, to assess forecast error in the KPI. Meridian\nisn't designed for forecasting the KPI, especially if there is strong trend and\nseasonality in the KPI. Instead, Meridian estimates the causal media\nimpact and uses the knot-based approach to modeling trend and seasonality. The\nknot-based approach needs data near the knot to estimate the knot effectively.\nIf large, contiguous-in-time, chunks of data are held out, there is no data near\nthe knots within the held out period. In this case, the knot's posterior\ndistribution is driven by the prior, which can result in poor forecasting.\n\nAdditionally, Meridian can be used to estimate the impact of both\nhistorical and future media because it assumes that model parameters which\ndetermine media impact are consistent over time."]]