====== GEO Bot Monitor ====== > Plugin WordPress de surveillance et gestion des robots visitant votre site, avec outils de blocage et intégration GEO. * [[https://dl.ticoet.me/downloads/1-SEO-GEO/2-entity-authority-signals-v1/geo-bot-monitor.zip|Télécharger le plugin WordPress]] * [[https://dl.ticoet.me/downloads/1-SEO-GEO/2-entity-authority-signals-v1/dmg.zip|Application GEO Bot Dashboard pour Mac]] ou directment le [[https://dl.ticoet.me/downloads/1-SEO-GEO/2-entity-authority-signals-v1/GEO%20Bot%20Dashboard_1.0.0.dmg|dmg]] * **Version** : 1.1.0 * **Licence** : GPL2+ * **Compatibilité** : WordPress 5.8+, PHP 7.4+ ===== Description ===== **GEO Bot Monitor** surveille, catégorise et permet de bloquer les robots qui visitent votre site WordPress : moteurs de recherche (SEO), IA génératives (GEO), réseaux sociaux, outils SEO et podcasts. ===== Fonctionnalités principales ===== ==== Surveillance des bots ==== * **Détection automatique** de 80+ robots avec signatures actualisées * **Catégorisation** : SEO, GEO/IA, Réseaux sociaux, Outils SEO, Podcast, Interne, Autres * **Tableau de bord** avec statistiques en temps réel * **Graphiques d'évolution** par période * **Historique** des visites par bot et par page ==== Catégories de bots détectés ==== ^ Catégorie ^ Exemples ^ | **SEO** | Googlebot, Bingbot, Applebot, YandexBot, DuckDuckBot | | **GEO / IA** | GPTBot, Claude-Web, PerplexityBot, Google-Extended, CCBot | | **Outils SEO** | MozBot, AhrefsBot, SemrushBot, MJ12bot, Screaming Frog | | **Réseaux sociaux** | Twitterbot, LinkedInBot, WhatsApp, Discordbot | | **Podcast** | Podchaser, Spotify, Apple-Podcasts, Overcast | | **Interne** | WordPress-Cron, GEO-Audit-Bot, Jetpack | ==== Blocage des bots ==== * **Interface de gestion** pour bloquer/autoriser chaque bot * **Génération automatique** des règles de blocage : * ''robots.txt'' : Directives Disallow * ''.htaccess'' : Règles RewriteCond (blocage serveur) * ''llms.txt'' : Format spécifique IA * **Application directe** au fichier robots.txt du site * **Détection** des bots déjà bloqués dans robots.txt existant ==== Intégration GEO Authority Suite ==== Si le plugin **GEO Authority Suite** est installé : * Synchronisation automatique avec le fichier ''llms.txt'' * Ajout des directives de blocage IA dans la section dédiée * Cohérence entre robots.txt et llms.txt ==== Export des données ==== * **CSV** : Export complet ou par période * **PDF** : Rapport formaté * **Markdown** : Format texte structuré * **API REST** : Accès programmatique aux données --- ===== Installation ===== - Téléchargez le plugin - Uploadez dans ''/wp-content/plugins/geo-bot-monitor/'' - Activez depuis **Extensions > Extensions installées** - Accédez au menu **Bot Monitor** dans l'administration --- ===== Pages d'administration ===== ^ Page ^ Description ^ | **Tableau de bord** | Vue d'ensemble et statistiques | | **Liste des bots** | Historique détaillé par robot | | **Blocage** | Gestion des autorisations et génération de règles | | **Export** | Export des données (CSV, PDF, Markdown) | | **Réglages** | Configuration du plugin | --- ===== Blocage des bots ===== ==== Interface de blocage ==== La page **Bot Monitor > Blocage** permet de : * Voir la liste de tous les bots détectés * Identifier leur statut actuel (Autorisé / Bloqué) * Bloquer ou autoriser individuellement chaque bot * Générer les codes de blocage ==== Méthodes de blocage ==== === robots.txt === Le fichier ''robots.txt'' indique aux robots respectueux les pages à ne pas crawler. # Règles de blocage générées par GEO Bot Monitor # Date: 2026-02-23 10:00:00 # Bloquer MJ12bot User-agent: MJ12bot Disallow: / # Bloquer AhrefsBot User-agent: AhrefsBot Disallow: / **Avantages** : Simple, standard, respecté par les bots légitimes. **Limites** : Les bots malveillants peuvent ignorer ces directives. === .htaccess (Apache) === Blocage au niveau serveur, plus strict. # Règles de blocage générées par GEO Bot Monitor RewriteEngine On # Bloquer MJ12bot RewriteCond %{HTTP_USER_AGENT} MJ12bot [NC] RewriteRule .* - [F,L] **Avantages** : Blocage effectif, le bot reçoit une erreur 403. **Limites** : Nécessite Apache avec mod_rewrite. === llms.txt === Format spécifique pour les crawlers IA (standard llmstxt.org). # Bots IA bloqués User-agent: GPTBot User-agent: CCBot # Règles Disallow: / ==== Détection automatique ==== Le plugin détecte les bots déjà bloqués dans votre ''robots.txt'' existant : * Lecture du fichier robots.txt actuel * Analyse des directives User-agent / Disallow * Affichage du statut "Bloqué" ou "Autorisé" pour chaque bot --- ===== Intégration GEO Authority Suite ===== Si **GEO Authority Suite** est installé sur le même site : ==== Synchronisation llms.txt ==== Quand vous bloquez un bot IA via GEO Bot Monitor : - Le plugin détecte GEO Authority Suite - Propose d'ajouter le blocage dans le ''llms.txt'' généré - Les directives sont ajoutées dans la section "Crawlers IA bloqués" ==== Exemple de sortie llms.txt ==== ## Crawlers IA bloques Les crawlers IA suivants ne sont pas autorises a indexer ce site : - **GPTBot** (User-Agent: `GPTBot`) - **CCBot** (User-Agent: `CCBot`) ### Directives de blocage User-agent: GPTBot Disallow: / User-agent: CCBot Disallow: / Ces directives sont egalement presentes dans le fichier robots.txt. Gere par : GEO Bot Monitor v1.1.0 --- ===== API REST ===== ==== Endpoints disponibles ==== GET /wp-json/geo-bot-monitor/v1/stats GET /wp-json/geo-bot-monitor/v1/bots GET /wp-json/geo-bot-monitor/v1/visits ==== Exemple de réponse ==== { "total_visits": 12474, "categories": { "seo": 6500, "geo_ai": 1, "social": 2, "other": 5971 }, "top_bots": [ {"name": "Moz", "visits": 6179}, {"name": "Unknown Bot", "visits": 5960} ] } --- ===== Signatures de bots ===== Le plugin inclut des signatures pour 80+ robots : ==== Moteurs de recherche (SEO) ==== * Googlebot, Googlebot-Image, Googlebot-Video, Googlebot-News * Bingbot, BingPreview * YandexBot, YandexImages * Baiduspider * DuckDuckBot * Applebot ==== Bots IA (GEO) ==== * GPTBot, ChatGPT-User (OpenAI) * Claude-Web, ClaudeBot (Anthropic) * PerplexityBot * Google-Extended * CCBot (Common Crawl) * Bytespider (ByteDance) * Meta-ExternalAgent * Amazonbot ==== Outils SEO ==== * MozBot, rogerbot * AhrefsBot * SemrushBot * MJ12bot (Majestic) * DotBot * Screaming Frog * SEOkicks, Seobility, Sistrix ==== Réseaux sociaux ==== * Twitterbot * LinkedInBot * facebot, FacebookBot * WhatsApp * Discordbot * TelegramBot * Slackbot * Pinterest ==== Podcast ==== * Podchaser * Spotify * Apple-Podcasts (AppleCoreMedia, iTunes) * Google-Podcasts * Overcast * Pocket Casts * Castro * Deezer ==== Internes ==== * WordPress-Cron * GEO-Audit-Bot * Jetpack --- ===== Cas d'utilisation ===== ==== Surveiller l'activité IA ==== Identifiez quels crawlers IA visitent votre site et à quelle fréquence. ==== Bloquer les bots indésirables ==== Bloquez les bots SEO tiers (Moz, Ahrefs, MJ12bot) qui consomment de la bande passante sans apporter de valeur directe. ==== Optimiser pour le GEO ==== Vérifiez que les bots IA (GPTBot, Claude-Web) accèdent correctement à vos contenus optimisés. ==== Mesurer l'impact ==== Comparez l'activité des bots avant/après modifications pour valider l'effet de vos optimisations GEO. --- ===== Changelog ===== ==== Version 1.1.0 (Février 2026) ==== * **Nouveau** : Système de blocage des bots * **Nouveau** : Génération de règles robots.txt, .htaccess, llms.txt * **Nouveau** : Application directe au robots.txt du site * **Nouveau** : Détection des bots déjà bloqués * **Nouveau** : Intégration avec GEO Authority Suite (llms.txt) * **Nouveau** : Catégorie Podcast (Podchaser, Spotify, Apple Podcasts...) * **Nouveau** : Signatures MozBot et MJ12bot améliorées * **Amélioration** : Détection Unknown Bot (distinction WP-Cron, internes) * **Amélioration** : Interface de blocage avec statut en temps réel ==== Version 1.0.0 (Janvier 2026) ==== * Version initiale * Détection et catégorisation des bots * Tableau de bord et statistiques * Export CSV, PDF, Markdown * API REST --- ===== Ressources ===== * [[https://schema.org/|Documentation Schema.org]] * [[https://developers.google.com/search/docs/crawling-indexing/robots/intro|Spécification robots.txt]] * [[https://llmstxt.org/|llms.txt Standard]] --- ===== Support ===== **Auteur** : Erwan Tanguy - Ticoët\\ **Site** : [[https://www.ticoet.fr/|ticoet.fr]]\\ **Wiki** : [[https://wiki.ticoet.me/doku.php?id=geo-bot-monitor|wiki.ticoet.me]]