La balise NoIndex se situe dans la partie <head> du code html. Pour demander à Google de ne pas indexer la page, vous aller utiliser la balise meta robots. Cette balise se structure de la manière suivante :
<meta name = « robots » content= »NOINDEX, NOFOLLOW »>
Il y a donc 2 informations dans cette balise :
- La directive d’indexation, dans ce cas NOINDEX,
- La directive de crawl, FOLLOW signifie que le bot va suivre les liens pour découvrir d’autres pages. NOFOLLOW va indiquer que les liens ne doivent pas être suivis.
Google met à disposition toutes les informations sur la balise Meta pour les robots. Vous avez la possibilité de préciser les comportements pour les différents robots d’exploration existants.
La balise NoIndex dans la page peut être utile mais elle impacte l’utilisation du budget crawl. Effet, le bot va devoir charger le code html de la page pour découvrir cette balise. La balise NoIndex bloquera bien l’indexation mais consommera du temps de crawl au détriment d’autres pages utiles. Pour l’éviter, vous pouvez utiliser la directive NoIndex directement dans le fichier robots.txt.