FR

Paywall SEO : gérer l’indexation des contenus accessibles par abonnement

Lucas Perrosé . 13 septembre 2020

Pour la plupart des médias, inciter leurs lecteurs à souscrire à un abonnement est enjeu fort de monétisation de l’audience. Restreindre l’accès gratuit aux contenus pour convaincre les utilisateurs de payer pour en profiter sans limite est ainsi devenu une pratique répandue parmi les éditeurs. Mais se pose alors la question du référencement de ces articles bloqués : comment s’assurer de leur présence dans les résultats des moteurs de recherche – importante source de trafic et donc, de souscriptions potentielles – tout en cachant leur contenu ?

Sommaire

Le concept de paywall

Le principe du paywall est simple : il consiste à masquer tout ou partie d’un contenu à un utilisateur n’ayant pas payé pour y accéder (via, par exemple, un abonnement). La plupart des grands médias et éditeurs de presse recourent aujourd’hui à cette solution pour générer des revenus par abonnement (via notamment des solutions dynamiques comme Pool) : ils attisent la curiosité des lecteurs grâce à des contenus attractifs, et en restreignent l’accès. Les plus intéressés n’ont alors qu’une option pour en apprendre plus : souscrire. Ils bénéficieront alors d’un accès complet à l’information et d’une navigation sans publicité pour un meilleur confort de lecture.

paywall le figaro
Exemple de paywall sur le site Le Figaro

La logique du paywall dans la presse n’est qu’une tentative de répliquer sur le web l’accès payant à l’information pour les journaux « physiques » : lire un journal, la plupart du temps, nécessite de l’acheter ou d’être abonné. Mais le paywall est surtout le témoin d’une évolution du comportement des lecteurs et d’une réalité financière très compliquée pour les différents groupes de presse.

Avec des ventes physiques qui s’écroulent d’année en année pour les acteurs de la PQN (Presse Quotidienne Nationale) – pour ne parler que d’eux – et une audience de plus en plus digitale, leurs revenus sont directement menacés. Entre 2015 et 2019, par exemple, Libération a perdu 40% de son lectorat papier (-19 000 journaux vendus/jour) (1). Dans le même temps, la consommation numérique des contenus est en hausse, un facteur amplifié en 2020 suite à la crise du COVID-19 : la fréquentation du site Le Monde a progressé cette année de 129% par rapport à sa moyenne de 2019 (2).

Cette digitalisation du lectorat a ainsi bouleversé le format de monétisation pour la presse. Aujourd’hui, 60% des revenus de la PQN proviennent de la publicité, d’où un besoin d’augmenter le nombre d’abonnés pour ne pas trop dépendre des revenus publicitaires. Les abonnement numériques ont ainsi pris une place importante : pour un média comme Le Monde, ils sont la première source de diffusion payante, devant les abonnements papiers (3). Ce qui explique le rôle stratégique et presque incontournable du paywall.

Les différents formats de paywall

  • Hard paywall : la forme de paywall qui bloque de façon permanente l’accès à tous les contenus d’un site pour les utilisateurs non abonnés. Un format plutôt destiné aux médias avec une ligne éditoriale suffisamment réputée pour provoquer à elle-seule l’abonnement sans besoin de donner d’avant-goût.
hard paywall mediapart
Exemple de hard paywall sur le site Médiapart, dont la consultation de l’ensemble des articles est réservée aux abonnés.
  • Soft paywall (contrôle des mesures) : un format qui consiste à déclencher le paywall au-delà d’un certain nombre de consultations sur une période donnée. Ce qui permet aux lecteurs ponctuels de profiter de la ligne éditoriale avant d’être soumis à une limitation. L’idée est ici de « séduire » le lecteur en lui donnant un aperçu de la qualité de contenu dont il pourrait bénéficier une fois abonné.
  • Freemium paywall : une version répandue proche du soft paywal où seulement une partie du contenu publié est accessibles aux non-abonnés. Ces derniers peuvent consulter les articles gratuits sans limite, mais doivent souscrire à une formule payante pour accéder aux contenus réservés, qui sont souvent les plus intéressants.
freemium paywall les echos
Exemple de freemium paywall sur le site Les Echos : certains articles sont réservés aux abonnés.
  • Lead-in : pas une forme de paywall en soi, le terme désigne le fait de laisser affiché à tous les lecteurs une première partie de l’article (le chapô ou un certain nombre de mots) avant de masquer la partie réservée aux abonnés.

Quels enjeux SEO pour les paywall ?

Si l’enjeu de monétisation porté par les paywall est évident, d’un point de vue SEO se pose la question de leur impact sur la capacité des contenus bloqués à se positionner dans les résultats des moteurs de recherche, et donc à générer du trafic. Or, pour un média, moins de trafic équivaut à moins de revenus (publicitaires ou abonnements).

Du contenu masqué pour les utilisateurs et Google

Le principe du paywall étant de bloquer des contenus (partiellement ou intégralement), la limitation SEO est vite trouvée : sans contenu lisible, Google – et les autres moteurs – ne pourra pas faire ressortir les articles dans ses résultats de recherche ou d’actualités, faute d’en comprendre le sujet et la réponse qu’il pourrait apporter aux requêtes de ses utilisateurs.

Même dans les contenus de soft paywall ou de freemium paywall, la situation peut paraître complexe pour le référencement des articles : si Google ne peut explorer qu’une part réduite des contenus, il risque de ne pas leur accorder autant de légitimité qu’à ceux d’autres sites web les rendant accessibles. De plus, les articles réservés aux abonnements (freemium) restent eux bloqués aux robots alors qu’ils peuvent adresser des sujets générant un fort intérêt pour le public.

Une expérience utilisateur à prendre en compte

La mise en place d’un paywall pose également la question de l’expérience de navigation pour les utilisateurs arrivant sur un contenu partiellement masqué ou dont la lecture peut être entravée au bout de quelques clics. Une limitation trop forte peut impacter le taux de rebond et la durée des sessions pour les différents sites ayant déployé un paywall, ce qui peut à terme nuire à leur référencement et leurs revenus publicitaires.

Optimiser un paywall pour le SEO

Comment concilier contraintes économiques – favoriser l’abonnement – et référencement dans les résultats des moteurs de recherche – générer des visites – pour les médias utilisant un paywall ? Heureusement pour eux, Google a déployé certaines mesures permettant de concilier ces exigences, à condition de respecter les règles de mise en place.

Quel paywall choisir dans une logique SEO ?

Aucun format de paywall n’est plus indiqué qu’un autre. D’un point de vue strictement SEO, le soft paywall est la solution la plus avantageuse, car elle limite l’accès après un certain nombre de lectures en utilisant les cookies des utilisateurs. Les robots comme ceux de Google n’étant pas soumis à une navigation « cookiefiée », ils peuvent explorer à volonté l’ensemble des contenus. Toutefois, pour un utilisateur, cette situation peut facilement être contournée, limitant drastiquement le rôle du paywall.

Les solutions proposées par Google aux éditeurs de contenus ne favorisent pas une méthode de paywall plutôt qu’une autre (bien que le moteur de recherche semble préférer le soft ou le freemium paywall avec lead-in) : l’option idéale doit inclure davantage de facteurs que les seuls critères SEO. Objectifs économique, ligne éditoriale, image de marque, parcours de navigation,… Tous ces facteurs doivent être considérés pour retenir le format de paywall le plus approprié au média.

Implémenter les données structurées paywall

Google a défini des guidelines concernant les contenus soumis à un paywall ou accessibles par abonnement. Ces dernières définissent la façon d’intégrer des données structurées spécifiques permettant de fournir aux robots du moteur l’intégralité d’un contenu, tout en restreignant son accès aux lecteurs sur le site. Le balisage de la partie masquée d’un contenu selon le vocabulaire NewsArticle de schema.org permet de l’isoler aux bots de Google et de l’exclure de la vue utilisateur, sans que cela ne soit considéré comme du cloaking (pratique pénalisée par Google). Dans l’exemple ci-dessous, un balisage en JSON-LD indique que l’article contient du contenu non-accessible gratuitement (« isAccessibleForFree : False »), délimité au sein de l’article par la class « .paywall ».

données structurées paywall seo
Extrait du balisage structuré permettant d’isoler le contenu concerné par le paywall.

Servir le contenu payant à Google et aux abonnés

Le contenu réservé aux abonnés doit alors être fourni aux utilisateurs inscrits, et aux différents robots d’exploration des moteurs de recherche, notamment Googlebot. Le code source d’une page soumise à un paywall sera donc différent en fonction de qui la consulte : sera servi à un lecteur un code allégé ne contenant que le contenu accessible gratuitement, et à Google ainsi qu’aux abonnés un code complet comprenant l’article dans son intégralité.

Bloquer le cache de Google

Si Google est capable de lire le contenu soumis à un abonnement, ce dernier sera de base visible dans le cache de Google. Il suffirait alors aux utilisateurs non abonnés de regarder la version « en cache » d’une page pour accéder au contenu leur étant normalement interdit.

La fonction « en cache » permet d’afficher la vue qu’a Google d’un contenu

Pour protéger le contenu soumis à un paywall, il est nécessaire d’indiquer à Google de ne pas fournir de cache pour les articles réservés aux abonnés via la balise Meta noarchive

Balise Meta Robots noarchive

Autoriser l’indexation du contenu

En plus de l’implémentation rigoureuse des données structurées, la page doit être indexable et explorable par Google (pas de blocage des User-Agent Googlebot et Googlebot-News dans le fichier robots.txt), afin d’assurer sa présence dans les résultats de recherche.

La combinaison de tous ces critères garantit ainsi :

  • la lisibilité des contenus paywall par Google
  • une protection des contenus payants (noarchive)
  • leur indexation et leur positionnement dans les résultats de recherche
  • un gain de trafic depuis ces résultats (Google Search ou Actualités)
  • une gestion optimale de la navigation utilisateur
  • une mise en avant cohérente des offres d’abonnement

Case study : The Athletic

Parmi les nombreux sites de presse ayant déployé un paywall, The Athletic est l’un de ceux ayant réussi une bonne intégration SEO, assurant au contenu réservé aux abonnés d’être lu et indexé par Google.

hard paywall lead-in the athletic
The Athletic a mis en place un système de hard paywall avec lead-in (début de contenu accessible à tous)
données structurées paywall
L’article possède des données structurées NewsArticle préscisant la présence d’un paywall
noarchive
La présence d’une balise meta robots « noarchive » empêche l’article d’être mis en cache par Google.
résultat recherche google
Le contenu réservé aux abonnés, masqué par le paywall, est bien indexé par Google qui accède donc à une version de la page comprenant l’intégralité de l’article, ce qui n’est pas le cas pour un utilisateur non inscrit
résultat recherche google actualités
L’article est bien indexé par Google et remonte dans les résultats de recherche et dans les Actualités

Besoin de conseils sur la gestion SEO de vos paywall ? N’hésitez pas à nous contacter.

(1) https://lareclame.fr/mathieulehot-chiffres-presse-francaise-236504
(2) https://www.franceculture.fr/medias/presse-en-confinement-la-victoire-definitive-du-numerique-sur-le-papier
(3) https://www.lesechos.fr/2018/03/le-digital-va-devenir-le-premier-canal-de-diffusion-des-journaux-986397