geo-bot-monitor
Différences
Ci-dessous, les différences entre deux révisions de la page.
| Les deux révisions précédentesRévision précédenteProchaine révision | Révision précédente | ||
| geo-bot-monitor [26/01/2026 19:06] – erwan | geo-bot-monitor [23/02/2026 12:08] (Version actuelle) – [GEO Bot Monitor] erwan | ||
|---|---|---|---|
| Ligne 1: | Ligne 1: | ||
| ====== GEO Bot Monitor ====== | ====== GEO Bot Monitor ====== | ||
| - | Plugin WordPress | + | > Plugin WordPress |
| * [[https:// | * [[https:// | ||
| + | * [[https:// | ||
| - | == Description == | + | * **Version** : 1.1.0 |
| + | * **Licence** : GPL2+ | ||
| + | * **Compatibilité** : WordPress 5.8+, PHP 7.4+ | ||
| - | GEO Bot Monitor détecte et enregistre automatiquement les visites des robots sur votre site WordPress. Il catégorise les robots en quatre groupes : SEO, GEO/IA, Réseaux sociaux et Autres. | ||
| - | === Fonctionnalités | + | ===== Description ===== |
| - | * **Détection automatique** de 50+ robots (Googlebot, Bingbot, GPTBot, Claude-Web, PerplexityBot...) | + | **GEO Bot Monitor** surveille, catégorise et permet |
| - | * **Catégorisation** : SEO, GEO/IA, Réseaux | + | |
| - | * **Tableau de bord** avec statistiques en temps réel et graphiques | + | |
| - | * **Comparaison de périodes** pour mesurer l' | + | |
| - | * **Exports** : CSV (Excel), PDF, Markdown | + | |
| - | * **API REST** pour connexion avec applications externes | + | |
| - | * **Maintenance** : purge des données anciennes | + | |
| - | == Installation | + | ===== Fonctionnalités principales ===== |
| - | 1. Télécharger le dossier `geo-bot-monitor` | + | ==== Surveillance des bots ==== |
| - | 2. Le copier dans `wp-content/ | + | |
| - | 3. Activer le plugin dans l' | + | |
| - | 4. Accéder au menu **Bot Monitor** | + | |
| - | == Configuration == | + | * **Détection automatique** de 80+ robots avec signatures actualisées |
| + | * **Catégorisation** : SEO, GEO/IA, Réseaux sociaux, Outils SEO, Podcast, Interne, Autres | ||
| + | * **Tableau de bord** avec statistiques en temps réel | ||
| + | * **Graphiques d' | ||
| + | * **Historique** des visites par bot et par page | ||
| - | === Configuration API === | + | ==== Catégories de bots détectés ==== |
| - | Pour connecter une application externe (comme | + | ^ Catégorie ^ Exemples ^ |
| + | | **SEO** | Googlebot, Bingbot, Applebot, YandexBot, DuckDuckBot | | ||
| + | | **GEO / IA** | GPTBot, Claude-Web, PerplexityBot, | ||
| + | | **Outils SEO** | MozBot, AhrefsBot, SemrushBot, MJ12bot, Screaming Frog | | ||
| + | | **Réseaux sociaux** | Twitterbot, LinkedInBot, | ||
| + | | **Podcast** | Podchaser, Spotify, Apple-Podcasts, | ||
| + | | **Interne** | WordPress-Cron, | ||
| - | 1. Aller dans **Bot Monitor > API** | + | ==== Blocage des bots ==== |
| - | 2. Cliquer sur **Générer une nouvelle clé** | + | |
| - | 3. Enregistrer | + | |
| - | 4. Utiliser cette clé dans votre application | + | |
| - | == Utilisation == | + | * **Interface de gestion** pour bloquer/ |
| + | * **Génération automatique** des règles de blocage : | ||
| + | * '' | ||
| + | * '' | ||
| + | * '' | ||
| + | * **Application directe** au fichier robots.txt du site | ||
| + | * **Détection** des bots déjà bloqués dans robots.txt existant | ||
| - | === Tableau de bord === | + | ==== Intégration GEO Authority Suite ==== |
| - | Le tableau de bord affiche | + | Si le plugin **GEO Authority Suite** est installé |
| - | * Nombre total de visites sur la période sélectionnée | + | |
| - | * Répartition par catégorie de robots | + | * Ajout des directives de blocage IA dans la section dédiée |
| - | * Graphique d'évolution journalière | + | * Cohérence entre robots.txt et llms.txt |
| - | * Top 20 des robots les plus actifs | + | |
| - | * Top 10 des pages les plus visitées par les robots | + | |
| - | === Comparaison de périodes | + | ==== Export des données ==== |
| - | Cette fonctionnalité permet de comparer deux périodes pour mesurer l' | + | * **CSV** : Export complet |
| + | * **PDF** : Rapport formaté | ||
| + | * **Markdown** : Format texte structuré | ||
| + | * **API REST** | ||
| - | 1. Sélectionner la période 1 (référence) | + | --- |
| - | 2. Sélectionner la période 2 (à comparer) | + | |
| - | 3. Cliquer sur **Comparer** | + | |
| - | Le résultat affiche la variation en nombre absolu et en pourcentage, | + | ===== Installation ===== |
| - | === Exports === | + | - Téléchargez le plugin |
| + | - Uploadez dans ''/ | ||
| + | - Activez depuis **Extensions > Extensions installées** | ||
| + | - Accédez au menu **Bot Monitor** dans l' | ||
| - | Trois formats d' | + | --- |
| - | * **CSV** : Compatible Excel, séparateur point-virgule, | + | ===== Pages d' |
| - | * **PDF** : Rapport HTML stylisé avec résumé et tableaux | + | |
| - | * **Markdown** : Format texte pour documentation | + | |
| - | === Maintenance === | + | ^ Page ^ Description ^ |
| + | | **Tableau de bord** | Vue d' | ||
| + | | **Liste des bots** | Historique détaillé par robot | | ||
| + | | **Blocage** | Gestion des autorisations et génération de règles | | ||
| + | | **Export** | Export des données (CSV, PDF, Markdown) | | ||
| + | | **Réglages** | Configuration du plugin | | ||
| - | La page de maintenance permet de : | + | --- |
| - | * Voir la taille de la base de données | + | ===== Blocage |
| - | * Sélectionner et supprimer | + | |
| - | == API REST == | + | ==== Interface de blocage ==== |
| - | === Endpoints === | + | La page **Bot Monitor > Blocage** permet de : |
| - | {| class=" | + | * Voir la liste de tous les bots détectés |
| - | ! Endpoint !! Méthode !! Description | + | * Identifier leur statut actuel (Autorisé |
| - | |- | + | * Bloquer ou autoriser individuellement chaque |
| - | | < | + | * Générer les codes de blocage |
| - | |- | + | |
| - | | < | + | |
| - | |- | + | |
| - | | < | + | |
| - | |- | + | |
| - | | < | + | |
| - | |- | + | |
| - | | < | + | |
| - | |- | + | |
| - | | < | + | |
| - | |- | + | |
| - | | < | + | |
| - | |- | + | |
| - | | < | + | |
| - | |- | + | |
| - | | < | + | |
| - | |- | + | |
| - | | < | + | |
| - | |} | + | |
| - | === Authentification | + | ==== Méthodes de blocage ==== |
| - | ==== Option 1 : Header HTTP (recommandé) ==== | + | === robots.txt |
| - | < | + | Le fichier '' |
| - | X-GEO-Bot-API-Key: | + | |
| - | </ | + | |
| - | ==== Option 2 : Paramètre URL ==== | + | < |
| + | # Règles de blocage générées par GEO Bot Monitor | ||
| + | # Date: 2026-02-23 10:00:00 | ||
| - | <pre> | + | # Bloquer MJ12bot |
| - | ? | + | User-agent: MJ12bot |
| - | </pre> | + | Disallow: |
| - | === Exemples de requêtes === | + | # Bloquer AhrefsBot |
| + | User-agent: AhrefsBot | ||
| + | Disallow: / | ||
| + | </ | ||
| - | ==== Statistiques des 30 derniers jours ==== | + | **Avantages** : Simple, standard, respecté par les bots légitimes. |
| + | **Limites** : Les bots malveillants peuvent ignorer ces directives. | ||
| - | < | + | === .htaccess (Apache) === |
| - | curl -H " | + | |
| - | " | + | |
| - | </ | + | |
| - | ==== Statistiques personnalisées ==== | + | Blocage au niveau serveur, plus strict. |
| - | <pre> | + | <code apache> |
| - | curl -H "X-GEO-Bot-API-Key: gbm_xxx" | + | # Règles de blocage générées par GEO Bot Monitor |
| - | " | + | <IfModule mod_rewrite.c> |
| - | </pre> | + | RewriteEngine On |
| - | ==== Comparer deux périodes ==== | + | # Bloquer MJ12bot |
| + | RewriteCond %{HTTP_USER_AGENT} MJ12bot [NC] | ||
| + | RewriteRule .* - [F,L] | ||
| + | </ | ||
| + | </ | ||
| - | < | + | **Avantages** |
| - | curl -H " | + | **Limites** |
| - | " | + | |
| - | </ | + | |
| - | === Paramètres des endpoints | + | === llms.txt |
| - | ==== /stats ==== | + | Format spécifique pour les crawlers IA (standard llmstxt.org). |
| - | {| class=" | + | < |
| - | ! Paramètre !! Type !! Défaut !! Description | + | # Bots IA bloqués |
| - | |- | + | User-agent: GPTBot |
| - | | start_date || string || -30 jours || Date de début (YYYY-MM-DD) | + | User-agent: CCBot |
| - | |- | + | |
| - | | end_date || string || aujourd' | + | |
| - | |} | + | |
| - | ==== /visits ==== | + | # Règles |
| + | Disallow: | ||
| + | </ | ||
| - | {| class=" | + | ==== Détection automatique ==== |
| - | ! Paramètre !! Type !! Défaut !! Description | + | |
| - | |- | + | |
| - | | start_date || string || -30 jours || Date de début (YYYY-MM-DD) | + | |
| - | |- | + | |
| - | | end_date || string || aujourd' | + | |
| - | |- | + | |
| - | | bot_name || string || (vide) || Filtrer par nom de robot | + | |
| - | |- | + | |
| - | | bot_category || string || (vide) || Filtrer par catégorie (seo, geo_ai, social, other) | + | |
| - | |- | + | |
| - | | page || integer || 1 || Numéro de page | + | |
| - | |- | + | |
| - | | per_page || integer || 100 || Résultats par page (max: 1000) | + | |
| - | |} | + | |
| - | ==== /compare ==== | + | Le plugin détecte les bots déjà bloqués dans votre '' |
| - | {| class=" | + | * Lecture du fichier robots.txt actuel |
| - | ! Paramètre !! Type !! Requis !! Description | + | * Analyse des directives User-agent / Disallow |
| - | |- | + | * Affichage du statut " |
| - | | period1_start || string || Oui || Début période 1 (YYYY-MM-DD) | + | |
| - | |- | + | |
| - | | period1_end || string || Oui || Fin période 1 (YYYY-MM-DD) | + | |
| - | |- | + | |
| - | | period2_start || string || Oui || Début période 2 (YYYY-MM-DD) | + | |
| - | |- | + | |
| - | | period2_end || string || Oui || Fin période 2 (YYYY-MM-DD) | + | |
| - | |} | + | |
| - | == Robots détectés == | + | --- |
| - | === SEO === | + | ===== Intégration GEO Authority Suite ===== |
| - | * Googlebot, Googlebot-Image, | + | Si **GEO Authority Suite** est installé sur le même site : |
| - | * Googlebot-Mobile, | + | |
| - | * Bingbot, BingPreview | + | |
| - | * YandexBot, YandexImages, | + | |
| - | * Baiduspider, | + | |
| - | * DuckDuckBot, | + | |
| - | * Applebot | + | |
| - | * Sogou web spider | + | |
| - | * Exabot | + | |
| - | * facebot, facebookexternalhit | + | |
| - | * ia_archiver | + | |
| - | * MJ12bot | + | |
| - | * AhrefsBot | + | |
| - | * SemrushBot | + | |
| - | * DotBot | + | |
| - | * Screaming Frog | + | |
| - | * SEOkicks | + | |
| - | * Seobility | + | |
| - | * SISTRIX | + | |
| - | * rogerbot, Moz | + | |
| - | === GEO / IA === | + | ==== Synchronisation llms.txt ==== |
| - | * GPTBot (OpenAI) | + | Quand vous bloquez un bot IA via GEO Bot Monitor : |
| - | * ChatGPT-User | + | |
| - | * Claude-Web, ClaudeBot (Anthropic) | + | |
| - | * anthropic-ai | + | |
| - | * PerplexityBot | + | |
| - | * Google-Extended | + | |
| - | * Cohere-ai | + | |
| - | * CCBot (Common Crawl) | + | |
| - | * Bytespider (ByteDance/ | + | |
| - | * PetalBot | + | |
| - | * YouBot | + | |
| - | * Diffbot | + | |
| - | * OAI-SearchBot | + | |
| - | * Meta-ExternalAgent | + | |
| - | * Meta-ExternalFetcher | + | |
| - | * Amazonbot | + | |
| - | * ImagesiftBot | + | |
| - | * omgili, omgilibot | + | |
| - | * webzio | + | |
| - | === Réseaux sociaux === | + | - Le plugin détecte GEO Authority Suite |
| + | - Propose d' | ||
| + | - Les directives sont ajoutées dans la section " | ||
| - | * Twitterbot | + | ==== Exemple de sortie llms.txt ==== |
| - | * LinkedInBot | + | |
| - | * Pinterest, Pinterestbot | + | |
| - | * Slackbot | + | |
| - | * TelegramBot | + | |
| - | + | ||
| - | * Discordbot | + | |
| - | * Snapchat | + | |
| - | === Autres === | + | < |
| + | ## Crawlers IA bloques | ||
| - | * UptimeRobot | + | Les crawlers IA suivants ne sont pas autorises a indexer ce site : |
| - | * Pingdom | + | |
| - | * StatusCake | + | |
| - | * Netcraft | + | |
| - | * W3C_Validator | + | |
| - | * Validator.nu | + | |
| - | * GTmetrix | + | |
| - | * WebPageTest | + | |
| - | * Chrome-Lighthouse | + | |
| - | * archive.org_bot | + | |
| - | * Feedfetcher | + | |
| - | == Structure des fichiers == | + | - **GPTBot** (User-Agent: |
| + | - **CCBot** (User-Agent: | ||
| - | < | + | ### Directives de blocage |
| - | geo-bot-monitor/ | + | |
| - | ├── geo-bot-monitor.php | + | |
| - | ├── includes/ | + | |
| - | │ | + | |
| - | │ | + | |
| - | │ | + | |
| - | │ | + | |
| - | │ | + | |
| - | │ | + | |
| - | │ | + | |
| - | ├── assets/ | + | |
| - | │ | + | |
| - | │ | + | |
| - | └── readme.md | + | |
| - | </ | + | |
| - | == Base de données == | + | User-agent: GPTBot |
| + | Disallow: / | ||
| - | === Table {prefix}_geo_bot_visits === | + | User-agent: CCBot |
| + | Disallow: / | ||
| - | {| class=" | + | Ces directives sont egalement presentes dans le fichier robots.txt. |
| - | ! Colonne !! Type !! Description | + | Gere par : GEO Bot Monitor v1.1.0 |
| - | |- | + | </ |
| - | | id || BIGINT || ID unique auto-incrémenté | + | |
| - | |- | + | |
| - | | visit_date || DATETIME || Date et heure de la visite | + | |
| - | |- | + | |
| - | | bot_name || VARCHAR(100) || Nom du robot détecté | + | |
| - | |- | + | |
| - | | bot_category || VARCHAR(20) || Catégorie (seo, geo_ai, social, other) | + | |
| - | |- | + | |
| - | | user_agent || TEXT || User-Agent complet | + | |
| - | |- | + | |
| - | | ip_address || VARCHAR(45) || Adresse IP du robot | + | |
| - | |- | + | |
| - | | url_visited || TEXT || URL visitée | + | |
| - | |- | + | |
| - | | http_status || SMALLINT || Code de statut HTTP | + | |
| - | |- | + | |
| - | | response_time || FLOAT || Temps de réponse en secondes | + | |
| - | |} | + | |
| - | === Index === | + | --- |
| - | * < | + | ===== API REST ===== |
| - | * < | + | |
| - | * < | + | |
| - | * < | + | |
| - | == Désinstallation | + | ==== Endpoints disponibles ==== |
| - | La désinstallation du plugin supprime automatiquement : | + | < |
| + | GET / | ||
| + | GET / | ||
| + | GET / | ||
| + | </ | ||
| - | * La table < | + | ==== Exemple de réponse ==== |
| - | * L' | + | |
| - | * L' | + | |
| - | == Changelog == | + | <code javascript> |
| + | { | ||
| + | " | ||
| + | " | ||
| + | " | ||
| + | " | ||
| + | " | ||
| + | " | ||
| + | }, | ||
| + | " | ||
| + | {" | ||
| + | {" | ||
| + | ] | ||
| + | } | ||
| + | </ | ||
| - | === 1.0.1 === | + | --- |
| - | * Corrections | + | ===== Signatures |
| - | * Génération de clé API côté serveur | + | |
| - | * Ajout index composite pour performance | + | |
| - | * Nettoyage automatique à la désinstallation | + | |
| - | === 1.0.0 === | + | Le plugin inclut des signatures pour 80+ robots : |
| - | * Version initiale | + | ==== Moteurs de recherche (SEO) ==== |
| - | == Informations techniques == | + | * Googlebot, Googlebot-Image, |
| + | * Bingbot, BingPreview | ||
| + | * YandexBot, YandexImages | ||
| + | * Baiduspider | ||
| + | * DuckDuckBot | ||
| + | * Applebot | ||
| - | * **Requires at least:** WordPress 6.0 | + | ==== Bots IA (GEO) ==== |
| - | * **Tested up to:** WordPress 6.7 | + | |
| - | * **Requires PHP:** 7.4 | + | |
| - | * **License: | + | |
| - | == Auteur == | + | * GPTBot, ChatGPT-User (OpenAI) |
| + | * Claude-Web, ClaudeBot (Anthropic) | ||
| + | * PerplexityBot | ||
| + | * Google-Extended | ||
| + | * CCBot (Common Crawl) | ||
| + | * Bytespider (ByteDance) | ||
| + | * Meta-ExternalAgent | ||
| + | * Amazonbot | ||
| - | Erwan Tanguy | + | ==== Outils SEO ==== |
| - | [[Category:Plugins WordPress]] | + | * MozBot, rogerbot |
| - | [[Category:SEO]] | + | * AhrefsBot |
| - | [[Category:GEO]] | + | * SemrushBot |
| - | [[Category:Monitoring]] | + | * MJ12bot (Majestic) |
| + | * DotBot | ||
| + | * Screaming Frog | ||
| + | * SEOkicks, Seobility, Sistrix | ||
| + | |||
| + | ==== Réseaux sociaux ==== | ||
| + | |||
| + | * Twitterbot | ||
| + | * LinkedInBot | ||
| + | * facebot, FacebookBot | ||
| + | |||
| + | * Discordbot | ||
| + | * TelegramBot | ||
| + | * Slackbot | ||
| + | |||
| + | |||
| + | ==== Podcast ==== | ||
| + | |||
| + | * Podchaser | ||
| + | * Spotify | ||
| + | * Apple-Podcasts (AppleCoreMedia, | ||
| + | * Google-Podcasts | ||
| + | * Overcast | ||
| + | * Pocket Casts | ||
| + | * Castro | ||
| + | * Deezer | ||
| + | |||
| + | ==== Internes ==== | ||
| + | |||
| + | * WordPress-Cron | ||
| + | * GEO-Audit-Bot | ||
| + | * Jetpack | ||
| + | |||
| + | --- | ||
| + | |||
| + | ===== Cas d' | ||
| + | |||
| + | ==== Surveiller l' | ||
| + | |||
| + | Identifiez quels crawlers IA visitent votre site et à quelle fréquence. | ||
| + | |||
| + | ==== Bloquer les bots indésirables ==== | ||
| + | |||
| + | Bloquez les bots SEO tiers (Moz, Ahrefs, MJ12bot) qui consomment de la bande passante sans apporter de valeur directe. | ||
| + | |||
| + | ==== Optimiser pour le GEO ==== | ||
| + | |||
| + | Vérifiez que les bots IA (GPTBot, Claude-Web) accèdent correctement à vos contenus optimisés. | ||
| + | |||
| + | ==== Mesurer l' | ||
| + | |||
| + | Comparez l' | ||
| + | |||
| + | --- | ||
| + | |||
| + | ===== Changelog ===== | ||
| + | |||
| + | ==== Version 1.1.0 (Février 2026) ==== | ||
| + | |||
| + | * **Nouveau** : Système de blocage des bots | ||
| + | * **Nouveau** : Génération de règles robots.txt, .htaccess, llms.txt | ||
| + | * **Nouveau** : Application directe au robots.txt du site | ||
| + | * **Nouveau** : Détection des bots déjà bloqués | ||
| + | * **Nouveau** : Intégration avec GEO Authority Suite (llms.txt) | ||
| + | * **Nouveau** : Catégorie Podcast (Podchaser, Spotify, Apple Podcasts...) | ||
| + | * **Nouveau** : Signatures MozBot et MJ12bot améliorées | ||
| + | * **Amélioration** : Détection Unknown Bot (distinction WP-Cron, internes) | ||
| + | * **Amélioration** : Interface de blocage avec statut en temps réel | ||
| + | |||
| + | ==== Version 1.0.0 (Janvier 2026) ==== | ||
| + | |||
| + | * Version initiale | ||
| + | * Détection et catégorisation des bots | ||
| + | * Tableau de bord et statistiques | ||
| + | * Export CSV, PDF, Markdown | ||
| + | * API REST | ||
| + | |||
| + | --- | ||
| + | |||
| + | ===== Ressources ===== | ||
| + | |||
| + | * [[https:// | ||
| + | | ||
| + | | ||
| + | |||
| + | --- | ||
| + | |||
| + | ===== Support ===== | ||
| + | |||
| + | **Auteur** : Erwan Tanguy - Ticoët\\ | ||
| + | **Site** : [[https:// | ||
| + | **Wiki** : [[https:// | ||
geo-bot-monitor.1769450789.txt.gz · Dernière modification : de erwan
