Esta documentación describe la arquitectura técnica y la metodología empleada por Waikay.

Arquitectura del Sistema de Interrogación de LLM

Infraestructura Tecnológica Central

Waikay aprovecha las bases tecnológicas existentes de InLinks:

  • Grafo de Conocimiento con 100 millones de entidades y 10 mil millones de relaciones en 17 idiomas.
  • Algoritmo propietario de Reconocimiento de Entidades Nombradas (NER) con un rendimiento 5 veces superior al de Google NLP.
  • Estructura de grafo semidirigido con relaciones semánticas unidireccionales.
  • Sincronización diaria con Wikipedia, DBpedia y Google Knowledge Graph.
  • Procesos de verificación y filtrado automatizados que garantizan la calidad de los datos.

Adaptación del Grafo de Conocimiento para la Monitorización de IA

Waikay aplica la misma tecnología de Grafo de Conocimiento que InLinks dentro de una arquitectura multi-instancia:

  • Grafo de Conocimiento Primario: representa el sitio/marca analizado.
  • Grafos de Conocimiento de LLMs: utilizan la misma tecnología para modelar la percepción de cada LLM (ChatGPT, Gemini, Claude, Sonar).

Este enfoque multi-KG permite identificar con precisión las brechas entre la realidad de la marca y las percepciones individuales de los modelos.

Metodología de Interrogación Multimodelo

Modelos de IA Objetivo

Waikay interroga simultáneamente cuatro modelos principales:

  • ChatGPT (OpenAI)
  • Gemini (Google)
  • Claude (Anthropic)
  • Sonar/Perplexity
Visibilidad de marca

Estrategia de Doble Consulta

Para cada modelo, el sistema ejecuta dos consultas distintas mediante prompt engineering:

  1. Consulta explícita restringida solo a datos de entrenamiento.
  2. Consulta con búsqueda fundamentada, habilitando capacidades de búsqueda web en tiempo real.

Metodología de Análisis Comparativo

Análisis Bidireccional Marca/Tema

Waikay implementa un enfoque de análisis bidireccional, inspirado en la investigación sobre asociaciones de marca en redes de modelos de lenguaje. Este método interroga a los LLMs en dos direcciones:

  1. Marca → Entidades: ¿Con qué entidades/temas asocian los LLMs a tu marca?
  2. Entidad → Marcas: ¿Qué marcas asocian los LLMs con temas específicos?

Este doble interrogatorio genera datos exhaustivos sobre asociaciones semánticas, lo que permite un análisis profundo del posicionamiento de la marca dentro del ecosistema de IA.

Este enfoque se inspira en la investigación de Dan Petrovic sobre el análisis bidireccional de asociaciones de marca en redes de modelos de lenguaje.

Proceso de Análisis Tripartito

Waikay analiza sistemáticamente:

  • El sitio/marca principal.
  • Dos sitios competidores seleccionados.
  • Análisis comparativo de respuestas entre las tres entidades.

Extracción y Clasificación de Información

Definición de “Hechos”

Un hecho representa una afirmación declarativa completa que los LLMs utilizan para describir una marca dentro de los prompts de contexto sectorial. Estos hechos permiten identificar información precisa, errónea o ausente en la representación de la marca por parte de la IA. Cada hecho puede rastrearse hasta sus fuentes para una corrección directa u optimización en sitios de terceros.

Ejemplo correcto: “Nissan Motor Company es un fabricante multinacional japonés de automóviles con sede en Yokohama, Japón.”

Ejemplo incorrecto: “InLinks fue adquirida por Semrush” (fuente: comentarios en YouTube, posteriormente corregido).

Seguimiento de hechos

Clasificación Automática de Brechas

El análisis de hechos permite identificar discrepancias entre la percepción de la IA y la realidad organizativa. Estas brechas pueden ser hechos ausentes, incorrectos o insuficientes.

El sistema clasifica automáticamente las brechas detectadas en:

  • Brechas Críticas de Tema (brechas críticas)
  • Brechas Significativas de Tema (brechas importantes)
  • Brechas Moderadas de Tema (brechas moderadas)

Infraestructura y Rendimiento

Arquitectura del Sistema

Gestión de múltiples llamadas API

arquitectura de microservicios que permite interacciones simultáneas con distintos LLMs (detalles confidenciales por patente en curso).

Eliminación de límites de tasa

No existen limitaciones de frecuencia en las interacciones con modelos de IA.

Frecuencias de Análisis Configurables

  • Análisis programados: diarios, semanales o mensuales.
  • Análisis bajo demanda: ejecución manual cuando se requiera.

Algoritmos de Puntuación Propietarios

Metodología de Cálculo de Puntuación

El sistema construye Grafos de Conocimiento comparativos y calcula puntuaciones de alineación utilizando métricas específicas de PLN aplicadas al grafo de 100 millones de entidades. El algoritmo propietario emplea desambiguación contextual para analizar 10 mil millones de relaciones semánticas. Los detalles de la metodología de puntuación permanecen confidenciales debido al estado pendiente de patente.

Panel de Informes Temáticos
Puntuación de conocimiento por IA

Clasificación Automática de Brechas

La categorización (Crítica, Significativa, Moderada) sigue una jerarquización confidencial de tipos de entidades nombradas ausentes en las respuestas de los LLM. Los umbrales y criterios se derivan directamente de las no-alineaciones entre distintos Grafos de Conocimiento.

Resultados y Funcionalidades Técnicas

Generación Automática de Planes de Acción

Transformación de Brecha a Recomendación

El sistema analiza las brechas identificadas y genera automáticamente planes de acción estructurados clasificados por prioridad e impacto. Estos Planes de Acción GEO transforman los datos analíticos en pasos concretos de optimización de contenido.

Trazabilidad de la fuente

Mapeo Integral de URLs

  • Identificación completa de todas las fuentes (URLs) utilizadas por cada LLM en la generación de respuestas
  • Clasificación de recurrencia (frecuencia de uso)
  • Desglose por modelo (ejemplo: 9 citas en total: 4 de ChatGPT, 2 de Sonar, 1 de Claude, 1 de Gemini)
  • Estructura organizada por dominios con URLs precisas

Validación Granular

Gestión de Alucinaciones

La detección de alucinaciones en hechos se basa en la experiencia del negocio del cliente, ya que solo expertos del dominio pueden validar la precisión de la información sobre su marca, productos y servicios. El sistema proporciona todos los elementos necesarios de validación (fuentes, contexto, historial) mediante la interfaz de validación, mientras que las decisiones finales recaen, de forma adecuada, en la experiencia humana.

Sistema de Validación Hecho por Hecho

Cada afirmación extraída puede:

  • CHECK: validarse como correcta
  • FLAG: marcarse como incorrecta y añadirse a la cola de revisión
  • DELETE: eliminarse del análisis

Seguimiento de Progreso: la interfaz muestra el número de hechos revisados (ejemplo: 2/77 hechos procesados).

Señales de Hechos

Puntuaciones y Métricas

Rendimiento Específico por Modelo

  • Temporal performance scores (Latest Score, Average Score, Score History)
  • Atribución precisa por modelo con marcas de tiempo de recuperación
  • Comparación relativa de rendimiento entre marcas

Arquitectura de Navegación

Organización Modular

La interfaz de Waikay se organiza en módulos especializados:

  • Visibilidad de Marca: análisis integral de marca con seguimiento de menciones en prompts. El sistema de Seguimiento de Prompts Asociados controla si y cuándo aparece tu marca en respuestas a consultas específicas, ofreciendo visibilidad detallada.
  • Informes Temáticos: análisis específico por tema
  • Fact Tracker: validación individual de afirmaciones
  • Source Tracking: trazabilidad de fuentes utilizadas.
  • Planes de Acción GEO/AIO: recomendaciones de optimización basadas en análisis de brechas identificadas

Flujo de Uso

  1. Análisis inicial de visibilidad de marca (tripartito: marca + 2 competidores)
  2. Acceso a resultados mediante pestañas dedicadas
  3. Posibilidad de profundizar en detalles específicos según módulo elegido
  4. Acciones de validación o corrección según necesidad

Especificaciones Técnicas

Formatos de Datos

Capacidades de importación/exportación

  • CSV para datos tabulares
  • JSON para estructuras complejas
  • Integración con Looker Studio (en desarrollo)

Pipeline de Desarrollo de API

Actualmente en desarrollo APIs para:

  • Planes de Acción
  • Informes de temas
  • Seguimiento de Prompts

Capacidades y Limitaciones

Capacidades Ilimitadas

  • Temas analizados: ilimitados
  • Frecuencia de análisis: configurable (diario/semanal/mensual/manual)

Rendimiento de Procesamiento y Métricas Comparativas

  • Informes Temáticos y Planes de Acción: ~1 minuto de tiempo de procesamiento
  • Seguimiento de Prompts: ~30 segundos de procesamiento
  • Pruebas en más de 1 millón de páginas web demuestran un rendimiento promedio 5 veces superior al de Google NLP en detección de entidades, con variaciones por sector (factor 4x en inmobiliario/turismo, factor 12x en electrodomésticos/herramientas)

  • Precisión en extracción de hechos: >99% (validación interna)

Cobertura de Idiomas

El sistema soporta 13 idiomas con rendimiento optimizado en inglés y francés (idiomas nativos). La arquitectura unificada permite el despliegue de nuevos idiomas sin coste adicional bajo solicitud del cliente.

Validación de Precisión

La precisión en la extracción de hechos supera el 99%, validada mediante análisis interno con herramientas de comparación propietarias.

Posicionamiento Competitivo

Diferenciación Tecnológica

Capacidades Únicas de Mercado

Waikay ofrece varias innovaciones sin equivalente en el mercado:

  • Informes Temáticos: análisis estructurado por temas
  • Planes de Acción GEO/AIO: recomendaciones automáticas y accionables
  • Fact Tracker: validación granular de afirmaciones
  • Visibilidad de Marca: monitorización integral de la percepción por IA
  • Source Tracking: trazabilidad exhaustiva de fuentes

Seguimiento Comparativo de Prompts

Debe señalarse que el Seguimiento Comparativo de Prompts representa la única funcionalidad actualmente disponible también en competidores, con un rendimiento similar a soluciones existentes en el mercado. Las demás capacidades de Waikay permanecen, por el momento, sin equivalente en el mercado.