Cette page documente l’architecture technique et la méthodologie employées par Waikay.

Architecture du système d’interrogation LLM

Infrastructure technologique de base

Waikay s’appuie sur la technologie InLinks existantes :

  • Graphe de connaissances contenant 100 millions d’entités et 10 milliards de relations dans 13 langues
  • Algorithme propriétaire de reconnaissance d’entités nommées (NER) offrant des performances 5 fois supérieures à celles de Google NLP
  • Structure de graphe semi-orienté à relations sémantiques unidirectionnelles
  • Synchronisation quotidienne avec Wikipédia, DBpedia et Google Knowledge Graph
  • Processus automatisés de vérification et de filtrage garantissant la qualité des données

Adaptation du Knowledge Graph pour le monitoring IA

Waikay applique la même technologie de graphe de connaissances qu’InLinks, mais dans une architecture multi-instance :

  • Graphe de connaissances principal : représentation du site / de la marque analysé(e)
  • Graphes de connaissances LLM : application de la même technologie pour modéliser la perception de chaque LLM (ChatGPT, Gemini, Claude, Sonar)

Cette approche multi-KG permet de comparer précisément les écarts entre la réalité de la marque et la perception de chaque modèle.

Méthodologie d’interrogation multi-modèles

Modèles d’IA cibles

Waikay interroge simultanément quatre modèles d’IA principaux :

  • ChatGPT (OpenAI)
  • Gemini (Google)
  • Claude (anthropic)
  • Sonar/perplexity
Visibilité de marque

Stratégie de la double requête

Pour chaque modèle, le système exécute deux requêtes distinctes par prompt engineering :

  1. Requête explicite limitant les réponses aux seules données d’entraînement
  2. Requête de recherche ancrée autorisant la recherche en temps réel (grounded search)

Méthodologie d’analyse comparative

Analyse bidirectionnelle marque/sujet

Waikay implémente une approche bidirectionnelle d’analyse, inspirée des travaux de recherche sur l’association des marques dans les réseaux de modèles de langage. Cette méthodologie interroge les LLM dans deux directions :

  1. Marque → Entités : Quelles entités/sujets/topics les LLM associent-ils à votre marque ?
  2. Entité → Marques : Quelles marques les LLM associent-ils à des entités/sujets/topics spécifiques ?

Cette double interrogation génère des données riches et exploitables sur les associations sémantiques, et permet une analyse plus complète du positionnement de marque dans l’univers IA.

Cette approche s’inspire des recherches de Dan Petrovic sur l’analyse bidirectionnelle de l’association de marques dans les réseaux de modèles linguistiques.

Processus d’analyse tripartite

Waikay analyse systématiquement :

  • Le site/la marque principal(e)
  • Deux sites concurrents sélectionnés
  • Analyse comparative des réponses pour les trois entités

Extraction et classification des informations

Définition des « faits »

Un fait est une phrase complète d’affirmation que les LLM utilisent pour décrire une marque à partir d’un prompt associant marque et contexte sectoriel. Ces faits permettent d’identifier les informations exactes, erronées ou manquantes dans la représentation IA d’une marque. Chaque fait peut être sourcé pour correction directe ou auprès de sites tiers. Waikay distingue les faits commerciaux des faits informationnels.

Exemple correct : « Nissan Motor Company est un constructeur automobile multinational japonais dont le siège social est situé à Yokohama, au Japon. »

Exemple incorrect : « InLinks a été racheté par Semrush » (source : commentaires YouTube, corrigés par la suite).

Suivi des faits

Classification automatique des écarts

L’analyse des faits permet d’identifier les écarts : les divergences entre la perception de l’IA et la réalité organisationnelle. Ces écarts se manifestent par des faits manquants, incorrects ou insuffisants.

Le système catégorise automatiquement les écarts identifiés :

  • Critical Topic Gaps (écarts critiques)
  • Significant Topic Gap (écarts importants)
  • Moderate Topic Gaps (écarts modérés)

Infrastructure et performances

Architecture du système

Gestion des appels multi-API

Le système s’appuie sur une architecture microservices pour gérer les interactions simultanées avec les différents LLM. Les détails spécifiques de l’infrastructure font l’objet d’un brevet en cours et demeurent confidentiels.

Absence de limitation de débit

Le système ne rencontre aucune “rate limit” dans ses interactions avec les modèles d’IA, permettant des analyses fluides et continues.

Fréquences d’analyse configurables

  • Analyses planifiées : quotidiennes, hebdomadaires ou mensuelless
  • Analyses à la demande : exécution manuelle selon les besoins

Algorithmes propriétaires de notation

Méthodologie du calcul des scores

Le système construit différents Knowledge Graphs comparatifs et calcule un score d’alignement basé sur des métriques NLP spécifiques appliquées au graphe de 100 millions d’entités. L’algorithme propriétaire utilise la désambiguïsation contextuelle pour analyser les 10 milliards de relations sémantiques. Les détails de scoring font l’objet d’un brevet en cours.

Tableau de bord des rapports thématiques
Score de connaissances de l’IA

Classification automatique des écarts

La catégorisation (Critical, Significant, Moderate) s’effectue selon une hiérarchisation confidentielle des types d’entités nommées manquantes dans les réponses des LLM. Les seuils et critères sont directement déduits des non-alignements entre les différents Graphes de connaissance.

Outputs et caractéristiques techniques

Génération automatisée de plans d’action

Transformation des écarts en recommandations

Le système analyse les lacunes identifiées et génère automatiquement des plans d’action structurés classés par priorité et impact. Ces “GEO Action Plans” transforment les données d’analyse en étapes concrètes d’optimisation de contenu.

Traçabilité des sources

Mapping complet des URL

  • Identification de toutes les sources (URL) utilisées par chaque LLM dans la génération de réponses
  • Classement par récurrence : nombre et fréquence des citations
  • Répartition détaillée par modèle (par exemple, 9 citations au total : 4 de ChatGPT, 2 de Sonar, 1 de Claude, 1 de Gemini)
  • Classification par domaine source avec affichage des URL

Validation granulaire

Gestion des hallucinations

La détection des hallucinations dans les facts s’appuie sur l’expertise métier du client, seul en mesure de valider l’exactitude des informations concernant sa marque, ses produits et services spécifiques. Le système fournit tous les éléments nécessaires au jugement (sources, contexte, historique) via l’interface de validation, mais la décision finale revient logiquement à l’expertise humaine.

Système de validation “fait par fait”

Chaque affirmation extraite peut être :

  • CHECK : validée comme correcte
  • FLAG : signalée comme incorrecte et ajoutée à la file d’attente de révision
  • DELETED : supprimée de l’analyse

Compteur de progression : l’interface affiche le nombre de faits examinés (par exemple, 2/77 faits traités)

Traceur de faits

Scoring et métrique

Performances par modèle

  • Scores de performance temporels (dernier score, score moyen, historique des scores)
  • Attribution précise par modèle et date de récupération
  • Comparaison des performances relatives entre les marques

Architecture de navigation

Organisation modulaire

L’interface Waikay s’organise en modules spécialisés :

  • Visibilité de marque – Brand visibility : analyse globale de la marque avec suivi des mentions par prompt. Le Prompt Tracking associé permet de surveiller si et quand votre marque apparaît dans les réponses à des requêtes spécifiques, offrant une vue granulaire de votre visibilité IA
  • Rapports thématiques – Topic Reports : analyse par sujets spécifiques
  • Suivi des faits – Fact tracker : validation des affirmations individuelles
  • Suivi des sources – Source Tracking : traçabilité des sources utilisées
  • Plans d’action GEO/AIO – GEO Action Plans : recommandations d’optimisation basées sur l’analyse des écarts identifiés

Workflow d’utilisation

  1. Analyse initiale de la visibilité de marque (tripartite : marque + 2 concurrents)
  2. Accès aux résultats via des onglets dédiés
  3. Capacité d’exploration des détails spécifiques selon le module choisi
  4. Actions de validation ou de correction selon les besoins

Spécifications techniques

Formats de données

Capacités d’importation/exportation

  • Format CSV pour les données tabulaires
  • Format JSON pour les structures complexes
  • Intégration Looker Studio (en cours de développement)

API en developpement

API actuellement en développement pour :

  • Plans d’action
  • Rapports thématiques
  • Suivi des prompts

Capacités et limitations

Capacités illimitées

  • Nombre de sujets/entités/topics analysés : illimité
  • Fréquence d’analyse : configurable (quotidienne/hebdomadaire/mensuelle/manuelle)

Performance de traitement et métriques comparatives

  • Rapports thématiques et plans d’action : ~1 minute de temps de traitement
  • Suivi de prompt : ~30 secondes de temps de traitement
  • Les tests sur plus d’un million de pages web révèlent des performances moyennes 5x supérieures à Google NLP dans la détection d’entités, avec des variations sectorielles (facteur 4 en immobilier/tourisme, facteur 12 en électroménager/outillage)
  • Précision desextraction des faits : >99 % (validation interne)

Couverture linguistique

Le système prend en charge 13 langues avec des performances optimisées en anglais et en français (langues natives). L’architecture unifiée permet un déploiement sans coût de langues supplémentaires sur demande du client.

Validation de précision

La précision d’extraction des faits dépasse 99 %, validée par une analyse interne utilisant des outils de comparaison propriétaires.

Positionnement concurrentiel

Différenciation technologique

Fonctionnalités et capacités uniques

Waikay propose plusieurs innovations sans équivalent sur le marché :

  • Rapports thématiques : analyse structurée basée sur les sujets/topics/entités
  • Plans d’action GEO/AIO : recommandations d’amélioration automatisées et exploitables
  • Suivi de faits : validation granulaire des affirmations
  • Visibilité de marque : surveillance complète de la perception IA
  • Suivi des sources : traçabilité exhaustive des sources

Suivi comparatif des prompts

Il est à noter que le suivi de prompt comparatif est la seule fonctionnalité existant à ce jour chez des concurrents, avec des performances similaires aux diverses solutions du marché. Les autres capacités de Waikay demeurent pour le moment sans équivalent.