Le modèle Meridian permet aux médias à l'instant \(t\) d'affecter le KPI aux instants\(t, t + 1, \dots , t + L\) , où l'entier \(L\) est un hyperparamètre défini par l'utilisateur à l'aide du paramètre max_lag
de ModelSpec
. Le média peut avoir un effet durable qui se prolonge au-delà de max_lag
. Toutefois, Meridian suppose que les effets différés convergent de manière monotone vers zéro et finissent par devenir faibles. Pour des raisons pratiques, nous altérons l'effet selon la valeur max_lag
.
Compromis concernant max_lag
Des valeurs de max_lag
plus faibles entraînent généralement une meilleure convergence du modèle et des durées d'exécution plus rapides du modèle. Des valeurs de max_lag
plus faibles peuvent également réduire la variance du modèle : avec des valeurs de max_lag
élevées, la quantité de données disponibles est souvent insuffisante pour que les modèles Meridian estiment précisément les effets différés, ce qui augmente la variance du modèle. En revanche, des valeurs de max_lag
plus élevées augmentent la durée des effets différés, ce qui peut être bénéfique pour les modèles qui prévoient des effets à long terme.
L'augmentation de max_lag
ne signifie pas nécessairement que les estimations du ROI augmenteront également. En effet, si le média à l'instant \(t\) peut affecter le KPI à l'instant \(t+L\), cela peut nuire à l'effet média à l'instant\(t+1, \dots , t+L\) sur le KPI à l'instant \(t+L\).
Conseils pratiques pour définir max_lag
Les deux fonctions de régression de l'adstock proposées dans Meridian (géométrique et binomiale) équilibrent de façon différente les compromis concernant max_lag
.
Lorsque vous utilisez la régression géométrique
Avec la régression géométrique, si vous définissez max_lag
dans la plage de 2 à 10, vous obtiendrez un bon équilibre entre la modélisation des effets différés des médias et la limitation des inconvénients potentiels d'une latence maximale trop importante. La courbe de régression géométrique décroît très rapidement jusqu'à zéro pour la plupart des valeurs de \(\alpha\). Par conséquent, définir max_lag
sur une valeur très élevée a un effet négligeable sur la probabilité du modèle.
Lorsque vous utilisez la régression binomiale
Avec la régression binomiale, la courbe est une fonction de la latence maximale : elle est étirée pour couvrir la période d'effet, car son abscisse à l'origine est toujours à\(L + 1\). Par conséquent, le problème de diminution des rendements ne s'applique plus et vous pouvez utiliser la régression binomiale avec une valeur de max_lag
plus élevée. Toutefois, la convergence et les durées d'exécution du modèle peuvent encore se détériorer avec l'augmentation de max_lag
.
Cette tension doit être contrebalancée par les avantages potentiels de l'augmentation de max_lag
. Dans ce cas, nous vous recommandons de sélectionner une valeur de max_lag
comprise entre 4 et 20.
Lorsque vous utilisez une combinaison de régression géométrique et de régression binomiale
Il peut être difficile de décider d'augmenter la valeur de max_lag
si vous utilisez différentes fonctions de régression pour différents canaux. Si vous utilisez essentiellement une fonction avec un petit nombre d'exceptions, nous vous recommandons de suivre la recommandation de la fonction prédominante. Si vous utilisez une combinaison plus équilibrée, nous vous recommandons de sélectionner une max_lag
comprise entre 4 et 20. Cela permet d'obtenir un bon équilibre entre la modélisation binomiale de l'effet différé et les inconvénients liés à l'utilisation de la régression géométrique avec une max_lag
élevée.
Fonction de régression de l'adstock | Latence maximale recommandée |
---|---|
Géométrique | 2-10 périodes |
Binomiale | 4-20 périodes |
Combinaison géométrique/binomiale | 4-20 périodes |
Pour en savoir plus sur les fonctions de régression et l'a priori alpha, consultez Définir le paramètre adstock_decay_spec.