Skip to main content
SEO paywall

Comment gérer votre SEO avec un paywall ?

Depuis toujours, le web est majoritairement gratuit. Même quand la presse a investi ce support, elle a donné un libre accès à des articles pourtant payants dans un journal papier. Bien entendu, il s’est rapidement posé des questions de rentabilité. Comment se faire de l’argent avec du contenu en accès libre ? Vous vous en doutez, la réponse a été la publicité. Mais cette stratégie de revenus pose des problèmes : peu rémunératrice pour les éditeurs de sites, peu respectueuse de la vie privée du lecteur, c’est une rustine intéressante mais l’histoire nous a prouvé qu’elle ne suffit pas toujours.

Alors le web est devenu de plus en plus payant, dans le but d’enfin trouver un modèle économique viable. Pour beaucoup de médias il existe encore des articles gratuits, mais la plupart sont proposés uniquement aux abonnés. Un visiteur lambda ne peut voir que les premières lignes de ces contenus. Arrive alors un autre problème : le SEO d’un site reposant en grande partie sur du texte directement visible, comment atteindre sur Google vos concurrents qui proposent du contenu exclusivement gratuit ? L’objet de cet article est précisément de répondre à cette question !

Qu’est-ce qu’un paywall ?

Un paywall est un terme anglophone désignant une barrière mise en place par des éditeurs de site, afin de restreindre l’accès à une partie ou à la totalité de son contenu. Le terme “paywall” est une contraction de “payment” (paiement) et “wall” (mur), ce qui signifie qu’il s’agit d’un mur virtuel que les utilisateurs doivent franchir en effectuant un paiement pour accéder au texte bloqué.

Il existe différentes formes de paywalls, chacune avec ses propres règles et restrictions. Voici quelques exemples :

  • Paywall strict : seuls les utilisateurs ayant payé un abonnement ou un accès payant peuvent accéder au contenu. Il peut s’agir de sites d’information, de revues en ligne, de services de streaming vidéo ou de toute autre forme de média en ligne.
  • Paywall partiel : certains sites offrent des articles, mais limitent l’accès à du contenu exclusif aux abonnés payants.
  • Pay-per-article : dans ce modèle, les utilisateurs peuvent acheter individuellement l’accès à un article sans avoir besoin d’un abonnement complet.
  • Freemium : les sites utilisant ce modèle offrent une version gratuite avec des fonctionnalités de base, mais proposent des fonctionnalités avancées ou un contenu exclusif réservé aux abonnés payants.

Pourquoi un paywall est mauvais pour votre SEO ?

Un paywall peut avoir un impact négatif sur le référencement naturel (SEO) d’un site web pour plusieurs raisons :

  • Contenu masqué : Lorsqu’un site utilise un paywall strict pour verrouiller son contenu, les moteurs de recherche ne peuvent pas accéder au contenu derrière ce mur. Cela signifie que les pages avec du contenu payant peuvent ne pas être indexées correctement, ce qui limite leur visibilité dans les résultats de recherche. Nous verrons plus tard qu’il est possible de mettre en place des solutions corrigeant cette limitation.
  • Moins de liens entrants : Les sites gratuits et accessibles sont plus susceptibles de générer des liens entrants (backlinks) provenant d’autres sites web, ce qui est bénéfique pour le classement dans les moteurs de recherche. Les contenus payants, en revanche, ont tendance à être moins partagés et moins liés, ce qui peut réduire le potentiel de classement SEO.
  • Perte de trafic organique : En général, le contenu accessible gratuitement est plus susceptible d’attirer du trafic organique provenant des moteurs de recherche. En restreignant l’accès au contenu, un site peut réduire le nombre de visiteurs et de sessions, ce qui peut avoir un impact négatif sur son classement SEO global.

Vous l’avez compris, un paywall n’est pas très SEO-friendly. Mais ce modèle se développant intensément ces dernières années, Google a cherché des solutions faisant avec. Dans cet article, nous allons voir comment les données structurées peuvent vous permettre de mieux faire accepter votre paywall à ses algorithmes.

Paywall

Comment installer des données structurées pour améliorer le SEO de votre paywall ?

La difficulté pour Google est de distinguer un paywall légitime d’une technique de cloaking. Cette dernière consiste à proposer une page HTML différente à ses robots, ce qui est formellement interdit par ses guidelines. Il a donc trouvé une solution alternative intéressante : les données structurées.

Ainsi Google a récemment communiqué publiquement sur ce sujet et propose une documentation officielle vous permettant de vous mettre aux normes en vigueur.

Imaginons que vous avez avez cette balise pour restreindre l’accès au contenu : <div class=”paywall”>La suite de cet article nécessite un abonnement.< /div>

Vous pouvez insérer dans la page cette donnée structurée au format JSON-LD, afin de mieux faire comprendre à Google la nature de cette page :

“hasPart”: {
“@type”: “WebPageElement”,
“isAccessibleForFree”: “False”,
“cssSelector”: “.paywall”
}

Depuis une mise à jour datant d’octobre 2023, l’outil Google Rich Results Test peut valider si vous avez correctement implémenté ce balisage de votre paywall. Mais cela ne répond pas à une question : comment permettre malgré tout au moteur de recherche d’accéder au contenu ?

Des données structurées pour faire du cloaking autorisé par Google

Vous l’aurez peut-être compris, cette donnée structurée n’est qu’une première étape pour votre SEO. Une fois mise en place, Google comprend que vous avez un paywall et qu’il est donc normal que vous lui proposiez un contenu plus riche que celui de l’utilisateur non inscrit.

Pour donner la possibilité à ses robots d’accéder à votre article complet, tout va se jouer au niveau de l’User Agent. Cet identifiant permet à un serveur de recevoir de multiples informations utiles : navigateur utilisé, système d’exploitation, résolution d’affichage, etc. Vous vous en doutez, le User Agent des robots de Google est facile à repérer car très spécifique.

Pour éviter tout abus, votre serveur ne doit pas se contenter de vérifier l’User Agent. Des petits malins pourraient en profiter pour se faire passer pour Google et lire vos précieux articles gratuitement. Une fois cette étape passée, vous devez vérifier l’adresse IP liée à l’User Agent. Si Google utilise des adresses IP variées, toutes sont publiques. Cela vous donne la possibilité de faire une liste blanche.

Paywall

En résumé, si l’User Agent et l’adresse IP correspondent tous deux à un Googlebot, vous rendez le contenu accessible. Si l’ordinateur distant ne remplit pas ces deux conditions, vous laissez l’article tronqué.

Comme vous avez été un bon élève, vous avez installé auparavant la donnée structurée vous identifiant comme un paywall. Cela permet à Google de connaître l’intégralité de votre contenu, sans vous pénaliser en croyant que vous essayez de le piéger. C’est bon pour votre SEO, car vous proposez plus de mots que le texte introductif, tout en ne le rendant pas accessible au tout venant.

Mais cela induit aussi que Google a accès à l’intégralité de vos contenus payants… Cette problématique devient de plus en plus importante à l’ère de l’IA. L’objectif de cette donnée structurée est aussi de prévenir les agents conversationnels que le contenu n’est pas accessible au public, et qu’ils ne peuvent donc pas l’utiliser comme une source. Est-ce suffisant ? Pas nécessairement, car cela reste une simple indication. Mais nous voyons malgré tout que Google tient compte de cet aspect, en communiquant officiellement à ce sujet…

Découvrez des articles similaires

Derniers articles

Newsletter