Analyse du fichier robots.txt de Gitea (blablalinux.be)

Directive	Contenu	Explication
`User-agent: [Nom du Bot]`	Liste exhaustive d’agents utilisateurs liés à l’IA, à l’analyse de données (scraping), et à l’exploration étendue (ex. : ChatGPT, Claude, Gemini, GPTBot, Scrapy).	Le propriétaire du site cible explicitement ces collecteurs de données pour empêcher l’utilisation du code source ou du contenu hébergé pour l’entraînement de modèles d’IA (LLMs).
`Disallow: /`	Associée à chaque agent utilisateur de la liste.	Cette directive bloque totalement l’accès au site pour l’agent ciblé. Aucune page n’est autorisée à être explorée par ces bots.

Directive	Contenu	Explication
*`User-agent: `**	Le caractère générique `` désigne tous les autres robots* qui ne sont pas spécifiquement bloqués à la section 1.	Ceci permet de définir des règles générales pour l’indexation traditionnelle.
`Disallow: /user/settings`, `/notifications`, `/login`, `/install`, etc.	Liste ciblée de chemins bloqués.	Ces chemins correspondent à des pages privées, sensibles ou utilitaires de Gitea. Les bloquer garantit qu’elles n’apparaissent pas dans les résultats de recherche.
`Allow: /`	Placé après les directives `Disallow` spécifiques.	Ceci autorise l’indexation des dépôts publics, des pages d’exploration de code et des issues pour les moteurs de recherche. Les règles `Disallow` priment toujours sur le `Allow` général.

¶ I. Décortication du fichier `robots.txt`