Outils pour utilisateurs

Outils du site


geo-bot-monitor

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentesRévision précédente
Prochaine révision
Révision précédente
geo-bot-monitor [26/01/2026 19:06] erwangeo-bot-monitor [23/02/2026 12:08] (Version actuelle) – [GEO Bot Monitor] erwan
Ligne 1: Ligne 1:
 ====== GEO Bot Monitor ====== ====== GEO Bot Monitor ======
-Plugin WordPress pour surveiller les visites des robots SEO et GEO/AI sur votre site.+Plugin WordPress de surveillance et gestion des robots visitant votre site, avec outils de blocage et intégration GEO.
   * [[https://dl.ticoet.me/downloads/1-SEO-GEO/2-entity-authority-signals-v1/geo-bot-monitor.zip|Télécharger le plugin WordPress]]   * [[https://dl.ticoet.me/downloads/1-SEO-GEO/2-entity-authority-signals-v1/geo-bot-monitor.zip|Télécharger le plugin WordPress]]
 +  * [[https://dl.ticoet.me/downloads/1-SEO-GEO/2-entity-authority-signals-v1/dmg.zip|Application GEO Bot Dashboard pour Mac]] ou directment le [[https://dl.ticoet.me/downloads/1-SEO-GEO/2-entity-authority-signals-v1/GEO%20Bot%20Dashboard_1.0.0.dmg|dmg]]
  
-== Description ==+  * **Version** : 1.1.0 
 +  * **Licence** : GPL2+ 
 +  * **Compatibilité** : WordPress 5.8+, PHP 7.4+
  
-GEO Bot Monitor détecte et enregistre automatiquement les visites des robots sur votre site WordPress. Il catégorise les robots en quatre groupes : SEO, GEO/IA, Réseaux sociaux et Autres. 
  
-=== Fonctionnalités ===+===== Description =====
  
-* **Détection automatique** de 50+ robots (Googlebot, Bingbot, GPTBot, Claude-Web, PerplexityBot...) +**GEO Bot Monitor** surveille, catégorise et permet de bloquer les robots qui visitent votre site WordPress : moteurs de recherche (SEO), IA génératives (GEO)réseaux sociaux, outils SEO et podcasts.
-* **Catégorisation** : SEO, GEO/IARéseaux sociaux, Autres +
-* **Tableau de bord** avec statistiques en temps réel et graphiques +
-* **Comparaison de périodes** pour mesurer l'impact d'une action +
-* **Exports** : CSV (Excel), PDF, Markdown +
-* **API REST** pour connexion avec applications externes +
-* **Maintenance** : purge des données anciennes+
  
-== Installation ==+===== Fonctionnalités principales =====
  
-1. Télécharger le dossier `geo-bot-monitor` +==== Surveillance des bots ====
-2. Le copier dans `wp-content/plugins/+
-3. Activer le plugin dans l'admin WordPress +
-4. Accéder au menu **Bot Monitor**+
  
-== Configuration ==+  * **Détection automatique** de 80+ robots avec signatures actualisées 
 +  * **Catégorisation** : SEO, GEO/IA, Réseaux sociaux, Outils SEO, Podcast, Interne, Autres 
 +  * **Tableau de bord** avec statistiques en temps réel 
 +  * **Graphiques d'évolution** par période 
 +  * **Historique** des visites par bot et par page
  
-=== Configuration API ===+==== Catégories de bots détectés ====
  
-Pour connecter une application externe (comme GEO Bot Dashboard) :+^ Catégorie ^ Exemples ^ 
 +| **SEO** | Googlebot, Bingbot, Applebot, YandexBot, DuckDuckBot | 
 +| **GEO / IA** | GPTBot, Claude-Web, PerplexityBot, Google-Extended, CCBot | 
 +| **Outils SEO** | MozBot, AhrefsBot, SemrushBot, MJ12bot, Screaming Frog | 
 +| **Réseaux sociaux** | Twitterbot, LinkedInBot, WhatsApp, Discordbot | 
 +| **Podcast** | Podchaser, Spotify, Apple-Podcasts, Overcast | 
 +| **Interne** | WordPress-Cron, GEO-Audit-Bot, Jetpack |
  
-1. Aller dans **Bot Monitor > API** +==== Blocage des bots ====
-2. Cliquer sur **Générer une nouvelle clé** +
-3. Enregistrer +
-4. Utiliser cette clé dans votre application+
  
-== Utilisation ==+  * **Interface de gestion** pour bloquer/autoriser chaque bot 
 +  * **Génération automatique** des règles de blocage : 
 +    * ''robots.txt'' : Directives Disallow 
 +    * ''.htaccess'' : Règles RewriteCond (blocage serveur) 
 +    * ''llms.txt'' : Format spécifique IA 
 +  * **Application directe** au fichier robots.txt du site 
 +  * **Détection** des bots déjà bloqués dans robots.txt existant
  
-=== Tableau de bord ===+==== Intégration GEO Authority Suite ====
  
-Le tableau de bord affiche :+Si le plugin **GEO Authority Suite** est installé :
  
-Nombre total de visites sur la période sélectionnée +  Synchronisation automatique avec le fichier ''llms.txt'
-* Répartition par catégorie de robots +  Ajout des directives de blocage IA dans la section dédiée 
-* Graphique d'évolution journalière +  Cohérence entre robots.txt et llms.txt
-Top 20 des robots les plus actifs +
-Top 10 des pages les plus visitées par les robots+
  
-=== Comparaison de périodes ===+==== Export des données ====
  
-Cette fonctionnalité permet de comparer deux périodes pour mesurer l'impact d'une action SEO ou GEO :+  * **CSV** : Export complet ou par période 
 +  * **PDF** : Rapport formaté 
 +  * **Markdown** : Format texte structuré 
 +  * **API REST** Accès programmatique aux données
  
-1. Sélectionner la période 1 (référence) +---
-2. Sélectionner la période 2 (à comparer) +
-3. Cliquer sur **Comparer**+
  
-Le résultat affiche la variation en nombre absolu et en pourcentage, détaillée par catégorie et par robot.+===== Installation =====
  
-=== Exports ===+  - Téléchargez le plugin 
 +  - Uploadez dans ''/wp-content/plugins/geo-bot-monitor/'' 
 +  - Activez depuis **Extensions > Extensions installées** 
 +  - Accédez au menu **Bot Monitor** dans l'administration
  
-Trois formats d'export sont disponibles :+---
  
-* **CSV** : Compatible Excel, séparateur point-virgule, encodage UTF-8 BOM +===== Pages d'administration =====
-* **PDF** : Rapport HTML stylisé avec résumé et tableaux +
-* **Markdown** : Format texte pour documentation+
  
-=== Maintenance ===+^ Page ^ Description ^ 
 +| **Tableau de bord** | Vue d'ensemble et statistiques | 
 +| **Liste des bots** | Historique détaillé par robot | 
 +| **Blocage** | Gestion des autorisations et génération de règles | 
 +| **Export** | Export des données (CSV, PDF, Markdown) | 
 +| **Réglages** | Configuration du plugin |
  
-La page de maintenance permet de :+---
  
-* Voir la taille de la base de données +===== Blocage des bots =====
-* Sélectionner et supprimer des mois de données pour libérer de l'espace+
  
-== API REST ==+==== Interface de blocage ====
  
-=== Endpoints ===+La page **Bot Monitor > Blocage** permet de :
  
-{| class="wikitable" +  * Voir la liste de tous les bots détectés 
-! Endpoint !! Méthode !! Description +  * Identifier leur statut actuel (Autorisé Bloqué
-|- +  * Bloquer ou autoriser individuellement chaque bot 
-| <code>/wp-json/geo-bot-monitor/v1/ping</code> || GET || Test de connexion (sans authentification) +  * Générer les codes de blocage
-|- +
-| <code>/wp-json/geo-bot-monitor/v1/auth</code> || POST || Vérifier la validité de la clé API +
-|- +
-| <code>/wp-json/geo-bot-monitor/v1/stats</code> || GET || Statistiques globales (total, par catégorie, par jour+
-|- +
-| <code>/wp-json/geo-bot-monitor/v1/visits</code> || GET || Liste paginée des visites +
-|- +
-| <code>/wp-json/geo-bot-monitor/v1/compare</code> || GET || Comparer deux périodes +
-|- +
-| <code>/wp-json/geo-bot-monitor/v1/bots</code> || GET || Liste des robots détectables +
-|- +
-| <code>/wp-json/geo-bot-monitor/v1/categories</code> || GET || Liste des catégories +
-|- +
-| <code>/wp-json/geo-bot-monitor/v1/database</code> || GET || Informations sur la base de données +
-|- +
-| <code>/wp-json/geo-bot-monitor/v1/months</code> || GET || Mois disponibles avec le nombre de visites +
-|- +
-| <code>/wp-json/geo-bot-monitor/v1/export</code> || GET || Exporter les données (JSON ou CSV) +
-|}+
  
-=== Authentification ===+==== Méthodes de blocage ====
  
-==== Option 1 : Header HTTP (recommandé) ====+=== robots.txt ===
  
-<pre> +Le fichier ''robots.txt'' indique aux robots respectueux les pages à ne pas crawler.
-X-GEO-Bot-API-Key: votre_cle_api +
-</pre>+
  
-==== Option 2 Paramètre URL ====+<code> 
 +# Règles de blocage générées par GEO Bot Monitor 
 +# Date2026-02-23 10:00:00
  
-<pre> +# Bloquer MJ12bot 
-?api_key=votre_cle_api +User-agent: MJ12bot 
-</pre>+Disallow: /
  
-=== Exemples de requêtes ===+# Bloquer AhrefsBot 
 +User-agent: AhrefsBot 
 +Disallow: / 
 +</code>
  
-==== Statistiques des 30 derniers jours ====+**Avantages** : Simple, standard, respecté par les bots légitimes. 
 +**Limites** : Les bots malveillants peuvent ignorer ces directives.
  
-<pre> +=== .htaccess (Apache) ===
-curl -H "X-GEO-Bot-API-Key: gbm_xxx"+
-  "https://example.com/wp-json/geo-bot-monitor/v1/stats" +
-</pre>+
  
-==== Statistiques personnalisées ====+Blocage au niveau serveur, plus strict.
  
-<pre+<code apache
-curl -H "X-GEO-Bot-API-Key: gbm_xxx"+# Règles de blocage générées par GEO Bot Monitor 
-  "https://example.com/wp-json/geo-bot-monitor/v1/stats?start_date=2025-01-01&end_date=2025-01-31" +<IfModule mod_rewrite.c> 
-</pre>+RewriteEngine On
  
-==== Comparer deux périodes ====+# Bloquer MJ12bot 
 +RewriteCond %{HTTP_USER_AGENT} MJ12bot [NC] 
 +RewriteRule .* - [F,L] 
 +</IfModule> 
 +</code>
  
-<pre> +**Avantages** Blocage effectif, le bot reçoit une erreur 403. 
-curl -H "X-GEO-Bot-API-Keygbm_xxx" \ +**Limites** Nécessite Apache avec mod_rewrite.
-  "https://example.com/wp-json/geo-bot-monitor/v1/compare?period1_start=2025-01-01&period1_end=2025-01-15&period2_start=2025-01-16&period2_end=2025-01-31" +
-</pre>+
  
-=== Paramètres des endpoints ===+=== llms.txt ===
  
-==== /stats ====+Format spécifique pour les crawlers IA (standard llmstxt.org).
  
-{| class="wikitable" +<code> 
-! Paramètre !! Type !! Défaut !! Description +# Bots IA bloqués 
-|+User-agent: GPTBot 
-| start_date || string || -30 jours || Date de début (YYYY-MM-DD) +User-agent: CCBot
-|- +
-| end_date || string || aujourd'hui || Date de fin (YYYY-MM-DD) +
-|}+
  
-==== /visits ====+# Règles 
 +Disallow: / 
 +</code>
  
-{| class="wikitable" +==== Détection automatique ====
-! Paramètre !! Type !! Défaut !! Description +
-|- +
-| start_date || string || -30 jours || Date de début (YYYY-MM-DD) +
-|- +
-| end_date || string || aujourd'hui || Date de fin (YYYY-MM-DD) +
-|- +
-| bot_name || string || (vide) || Filtrer par nom de robot +
-|- +
-| bot_category || string || (vide) || Filtrer par catégorie (seo, geo_ai, social, other) +
-|- +
-| page || integer || 1 || Numéro de page +
-|- +
-| per_page || integer || 100 || Résultats par page (max: 1000) +
-|}+
  
-==== /compare ====+Le plugin détecte les bots déjà bloqués dans votre ''robots.txt'' existant :
  
-{| class="wikitable" +  * Lecture du fichier robots.txt actuel 
-! Paramètre !! Type !! Requis !! Description +  * Analyse des directives User-agent / Disallow 
-|+  * Affichage du statut "Bloqué" ou "Autorisé" pour chaque bot
-| period1_start || string || Oui || Début période 1 (YYYY-MM-DD) +
-|- +
-| period1_end || string || Oui || Fin période 1 (YYYY-MM-DD) +
-|- +
-| period2_start || string || Oui || Début période 2 (YYYY-MM-DD) +
-|- +
-| period2_end || string || Oui || Fin période 2 (YYYY-MM-DD) +
-|}+
  
-== Robots détectés ==+---
  
-=== SEO ===+===== Intégration GEO Authority Suite =====
  
-Googlebot, Googlebot-Image, Googlebot-News, Googlebot-Video +Si **GEO Authority Suite** est installé sur le même site :
-Googlebot-Mobile, Google-InspectionTool +
-Bingbot, BingPreview +
-YandexBot, YandexImages, YandexMobileBot +
-* Baiduspider, Baiduspider-image +
-* DuckDuckBot, DuckDuckGo-Favicons-Bot +
-* Applebot +
-* Sogou web spider +
-* Exabot +
-* facebot, facebookexternalhit +
-* ia_archiver +
-* MJ12bot +
-* AhrefsBot +
-* SemrushBot +
-* DotBot +
-* Screaming Frog +
-* SEOkicks +
-* Seobility +
-* SISTRIX +
-* rogerbot, Moz+
  
-=== GEO / IA ===+==== Synchronisation llms.txt ====
  
-* GPTBot (OpenAI) +Quand vous bloquez un bot IA via GEO Bot Monitor :
-* ChatGPT-User +
-* Claude-Web, ClaudeBot (Anthropic) +
-* anthropic-ai +
-* PerplexityBot +
-* Google-Extended +
-* Cohere-ai +
-* CCBot (Common Crawl) +
-* Bytespider (ByteDance/TikTok) +
-* PetalBot +
-* YouBot +
-* Diffbot +
-* OAI-SearchBot +
-* Meta-ExternalAgent +
-* Meta-ExternalFetcher +
-* Amazonbot +
-* ImagesiftBot +
-* omgili, omgilibot +
-* webzio+
  
-=== Réseaux sociaux ===+  - Le plugin détecte GEO Authority Suite 
 +  - Propose d'ajouter le blocage dans le ''llms.txt'' généré 
 +  - Les directives sont ajoutées dans la section "Crawlers IA bloqués"
  
-* Twitterbot +==== Exemple de sortie llms.txt ====
-* LinkedInBot +
-* Pinterest, Pinterestbot +
-* Slackbot +
-* TelegramBot +
-* WhatsApp +
-* Discordbot +
-* Snapchat+
  
-=== Autres ===+<code> 
 +## Crawlers IA bloques
  
-* UptimeRobot +Les crawlers IA suivants ne sont pas autorises a indexer ce site :
-* Pingdom +
-* StatusCake +
-* Netcraft +
-* W3C_Validator +
-* Validator.nu +
-* GTmetrix +
-* WebPageTest +
-* Chrome-Lighthouse +
-* archive.org_bot +
-* Feedfetcher+
  
-== Structure des fichiers ==+- **GPTBot** (User-Agent: `GPTBot`) 
 +- **CCBot** (User-Agent: `CCBot`)
  
-<pre> +### Directives de blocage
-geo-bot-monitor/ +
-├── geo-bot-monitor.php         Fichier principal +
-├── includes/ +
-│   ├── bot-signatures.php      Signatures des robots +
-│   ├── class-bot-api.php       API REST +
-│   ├── class-bot-dashboard.php # Pages admin +
-│   ├── class-bot-detector.php  # Détection des robots +
-│   ├── class-bot-exporter.php  # Exports CSV/PDF/MD +
-│   ├── class-bot-logger.php    # Logging en BDD +
-│   └── class-bot-settings.php  # Page paramètres API +
-├── assets/ +
-│   ├── css/admin.css           # Styles admin +
-│   └── js/admin.js             # Scripts admin +
-└── readme.md +
-</pre>+
  
-== Base de données ==+User-agent: GPTBot 
 +Disallow: /
  
-=== Table {prefix}_geo_bot_visits ===+User-agent: CCBot 
 +Disallow: /
  
-{| class="wikitable" +Ces directives sont egalement presentes dans le fichier robots.txt. 
-! Colonne !! Type !! Description +Gere par : GEO Bot Monitor v1.1.0 
-|- +</code>
-| id || BIGINT || ID unique auto-incrémenté +
-|- +
-| visit_date || DATETIME || Date et heure de la visite +
-|- +
-| bot_name || VARCHAR(100) || Nom du robot détecté +
-|- +
-| bot_category || VARCHAR(20) || Catégorie (seo, geo_ai, social, other) +
-|- +
-| user_agent || TEXT || User-Agent complet +
-|- +
-| ip_address || VARCHAR(45) || Adresse IP du robot +
-|- +
-| url_visited || TEXT || URL visitée +
-|- +
-| http_status || SMALLINT || Code de statut HTTP +
-|- +
-| response_time || FLOAT || Temps de réponse en secondes +
-|}+
  
-=== Index ===+---
  
-* <code>idx_date</code> : sur visit_date +===== API REST =====
-* <code>idx_bot</code> : sur bot_name +
-* <code>idx_category</code> : sur bot_category +
-* <code>idx_date_category</code> : composite sur visit_date et bot_category+
  
-== Désinstallation ==+==== Endpoints disponibles ====
  
-La désinstallation du plugin supprime automatiquement :+<code> 
 +GET /wp-json/geo-bot-monitor/v1/stats 
 +GET /wp-json/geo-bot-monitor/v1/bots 
 +GET /wp-json/geo-bot-monitor/v1/visits 
 +</code>
  
-* La table <code>{prefix}_geo_bot_visits</code> +==== Exemple de réponse ====
-* L'option <code>geo_bot_monitor_db_version</code> +
-* L'option <code>geo_bot_monitor_api_key</code>+
  
-== Changelog ==+<code javascript> 
 +
 +  "total_visits": 12474, 
 +  "categories":
 +    "seo": 6500, 
 +    "geo_ai": 1, 
 +    "social": 2, 
 +    "other": 5971 
 +  }, 
 +  "top_bots":
 +    {"name": "Moz", "visits": 6179}, 
 +    {"name": "Unknown Bot", "visits": 5960} 
 +  ] 
 +
 +</code>
  
-=== 1.0.1 ===+---
  
-* Corrections de sécurité (sanitization, escaping) +===== Signatures de bots =====
-* Génération de clé API côté serveur +
-* Ajout index composite pour performance +
-* Nettoyage automatique à la désinstallation+
  
-=== 1.0.0 ===+Le plugin inclut des signatures pour 80+ robots :
  
-* Version initiale+==== Moteurs de recherche (SEO) ====
  
-== Informations techniques ==+  * Googlebot, Googlebot-Image, Googlebot-Video, Googlebot-News 
 +  * Bingbot, BingPreview 
 +  * YandexBot, YandexImages 
 +  * Baiduspider 
 +  * DuckDuckBot 
 +  * Applebot
  
-* **Requires at least:** WordPress 6.0 +==== Bots IA (GEO) ====
-* **Tested up to:** WordPress 6.7 +
-* **Requires PHP:** 7.4 +
-* **License:** GPLv2 or later+
  
-== Auteur ==+  * GPTBot, ChatGPT-User (OpenAI) 
 +  * Claude-Web, ClaudeBot (Anthropic) 
 +  * PerplexityBot 
 +  * Google-Extended 
 +  * CCBot (Common Crawl) 
 +  * Bytespider (ByteDance) 
 +  * Meta-ExternalAgent 
 +  * Amazonbot
  
-Erwan Tanguy+==== Outils SEO ====
  
-[[Category:Plugins WordPress]] +  * MozBot, rogerbot 
-[[Category:SEO]] +  * AhrefsBot 
-[[Category:GEO]] +  * SemrushBot 
-[[Category:Monitoring]]+  * MJ12bot (Majestic) 
 +  * DotBot 
 +  * Screaming Frog 
 +  * SEOkicks, Seobility, Sistrix 
 + 
 +==== Réseaux sociaux ==== 
 + 
 +  * Twitterbot 
 +  * LinkedInBot 
 +  * facebot, FacebookBot 
 +  * WhatsApp 
 +  * Discordbot 
 +  * TelegramBot 
 +  * Slackbot 
 +  * Pinterest 
 + 
 +==== Podcast ==== 
 + 
 +  * Podchaser 
 +  * Spotify 
 +  * Apple-Podcasts (AppleCoreMedia, iTunes) 
 +  * Google-Podcasts 
 +  * Overcast 
 +  * Pocket Casts 
 +  * Castro 
 +  * Deezer 
 + 
 +==== Internes ==== 
 + 
 +  * WordPress-Cron 
 +  * GEO-Audit-Bot 
 +  * Jetpack 
 + 
 +--- 
 + 
 +===== Cas d'utilisation ===== 
 + 
 +==== Surveiller l'activité IA ==== 
 + 
 +Identifiez quels crawlers IA visitent votre site et à quelle fréquence. 
 + 
 +==== Bloquer les bots indésirables ==== 
 + 
 +Bloquez les bots SEO tiers (Moz, Ahrefs, MJ12bot) qui consomment de la bande passante sans apporter de valeur directe. 
 + 
 +==== Optimiser pour le GEO ==== 
 + 
 +Vérifiez que les bots IA (GPTBot, Claude-Web) accèdent correctement à vos contenus optimisés. 
 + 
 +==== Mesurer l'impact ==== 
 + 
 +Comparez l'activité des bots avant/après modifications pour valider l'effet de vos optimisations GEO. 
 + 
 +--- 
 + 
 +===== Changelog ===== 
 + 
 +==== Version 1.1.0 (Février 2026) ==== 
 + 
 +  * **Nouveau** : Système de blocage des bots 
 +  * **Nouveau** : Génération de règles robots.txt, .htaccess, llms.txt 
 +  * **Nouveau** : Application directe au robots.txt du site 
 +  * **Nouveau** : Détection des bots déjà bloqués 
 +  * **Nouveau** : Intégration avec GEO Authority Suite (llms.txt) 
 +  * **Nouveau** : Catégorie Podcast (Podchaser, Spotify, Apple Podcasts...) 
 +  * **Nouveau** : Signatures MozBot et MJ12bot améliorées 
 +  * **Amélioration** : Détection Unknown Bot (distinction WP-Cron, internes) 
 +  * **Amélioration** : Interface de blocage avec statut en temps réel 
 + 
 +==== Version 1.0.0 (Janvier 2026) ==== 
 + 
 +  * Version initiale 
 +  * Détection et catégorisation des bots 
 +  * Tableau de bord et statistiques 
 +  * Export CSV, PDF, Markdown 
 +  * API REST 
 + 
 +--- 
 + 
 +===== Ressources ===== 
 + 
 +  * [[https://schema.org/|Documentation Schema.org]] 
 +  [[https://developers.google.com/search/docs/crawling-indexing/robots/intro|Spécification robots.txt]] 
 +  [[https://llmstxt.org/|llms.txt Standard]] 
 + 
 +--- 
 + 
 +===== Support ===== 
 + 
 +**Auteur** : Erwan Tanguy - Ticoët\\ 
 +**Site** : [[https://www.ticoet.fr/|ticoet.fr]]\\ 
 +**Wiki** : [[https://wiki.ticoet.me/doku.php?id=geo-bot-monitor|wiki.ticoet.me]]
  
geo-bot-monitor.1769450789.txt.gz · Dernière modification : de erwan