Depuis la mise en place du RGPD et l'engouement pour l'exploitation des données, la confidentialité des fréquentations et la protection de la vie privée des utilisateurs sont devenues des priorités pour les éditeurs de contenus. Cela a conduit à l'adoption de diverses techniques de bruitage et d'anonymisation des données, utilisées notamment dans des projets cross-média tels que ceux de la WFA (World Federation of Advertisers) opérés par Google. Cependant, ces techniques peuvent influencer l'exactitude des analyses statistiques, en particulier pour le calcul de la déduplication des audiences entre éditeurs. Cette présentation examine l'impact de ces méthodes sur les paramètres statistiques spécifiques au marché des médias, avec un accent particulier sur l'utilisation des filtres de Bloom.
Au travers des études de simulation, nous montrons comment ces techniques influencent les estimateurs. Les résultats de cette recherche révèlent les compromis nécessaires entre la protection de l'information, la complexité des calculs, et l'exactitude des mesures d'audience.