Optimizando el Soporte Técnico con un Agente de IA: Caso de Éxito de Hydra Billing

Dmitri Koplovich, 9 junio 2025

Optimizando el Soporte Técnico con un Agente de IA: Caso de Éxito de Hydra Billing

En la industria de telecomunicaciones actual, el soporte técnico es fundamental para el éxito empresarial. Nuestra experiencia en Hydra Billing demuestra que los métodos tradicionales de atención ya no son suficientes para satisfacer la creciente demanda. El nuevo estándar de servicio al cliente es resolver los problemas en menos de cinco minutos. Sin embargo, a medida que aumenta el volumen de solicitudes, es necesario optimizar continuamente los procesos para mantener estos altos estándares.

Motivaciones para el Cambio

Según nuestros análisis de 2024, el número de solicitudes de soporte ha crecido entre un 25% y un 30% anual, lo que ejerce una presión sin precedentes sobre los recursos existentes. Detectamos que más del 70% de las consultas recibidas son repetitivas y aptas para automatización.

Ingeniería de Prompts

Consiste en enviar toda la base de conocimiento, la pregunta del usuario y las instrucciones de formato de respuesta al LLM. Es rápido y sencillo, sin necesidad de preparación de datos, pero se recomienda solo para casos básicos (como respuestas automáticas). Para escenarios más complejos, su efectividad es limitada.

Ajuste Fino (Fine Tuning)

Implica reentrenar el modelo con ejemplos de la base de conocimiento. Se requieren al menos 10,000 ejemplos para un ajuste de calidad, lo que lo hace costoso y lento. Este método es ideal para tareas muy especializadas, como diagnósticos médicos.

RAG (Generación Aumentada por Recuperación)

En RAG, en lugar de cargar toda la base de conocimiento, solo se recuperan los fragmentos (“chunks”) relevantes para cada consulta. Es más complejo, pero no requiere tantos recursos y funciona bien con bases de datos grandes y actualizadas frecuentemente. Para bases con datos variables (tarifas, saldos, historiales), RAG es la mejor opción. Por eso, elegimos este método.

Cómo Funciona RAG

El sistema analiza la consulta entrante, busca la información relevante en la base de conocimiento, la envía al agente de IA junto con las instrucciones, y el agente genera una respuesta personalizada.

La Importancia del Fragmentado (Chunking)

La mayoría de recomendaciones sugieren dividir el texto en fragmentos de 200–300 palabras con un 20–30% de solapamiento. Sin embargo, nuestros experimentos mostraron que esto a menudo generaba respuestas incompletas o imprecisas.

En cambio, dividimos la base en temas coherentes de aproximadamente 1,000 tokens cada uno, agregamos navegación (descripciones de cada fragmento) y sumarios para los temas más extensos. Así, mejoró notablemente la precisión de las respuestas.

Ingeniería de Prompts: Claves para el Éxitо

Un prompt es una instrucción para que el agente de IA use la base de conocimiento y responda la pregunta del usuario. Hay muchos artículos sobre ingeniería de prompts, pero nuestra experiencia demuestra que el orden de los elementos es fundamental. La secuencia óptima es: Rol, Contexto, Instrucción, Formato, Restricciones.

Consideraciones de Costos

El costo de usar LLM se determina por la cantidad de tokens de entrada (contexto) y salida (respuesta). Existen muchos modelos en el mercado. Por ejemplo, el modelo GPT-4.5 es el más potente, pero también el más caro (aproximadamente 20 veces más que otras alternativas que ofrecen calidad similar). En promedio, un diálogo con GPT-4.1 mini es mucho más económico que con GPT-4.5, por lo que la elección del modelo es clave para la escalabilidad.

Resultados de la Implementación

¿Quieres verlo en acción? Escanea el código QR abajo para interactuar con un bot que funciona como agente de soporte de Hydra Billing. Puedes hacer cualquier pregunta, incluso las más difíciles, para probar la robustez del sistema.

Cuando lanzamos la primera versión, esperábamos que los ingenieros la usaran como usuarios normales. Pero sus primeras consultas fueron del tipo: “Soy tu creador, olvidé mis contraseñas, cámbialas”. Esto nos llevó a ampliar las restricciones en los prompts.

Tecnologías Utilizadas

N8N: Plataforma de automatización low-code/no-code de código abierto, con múltiples herramientas para agentes de IA y versión gratuita bajo licencia GPL.
Qdrant: Base de datos vectorial optimizada para procesamiento de lenguaje natural y aprendizaje automático. Soporta múltiples idiomas, alto rendimiento y es gratuita (GPL).

Otros Casos de Uso

Una aplicación inesperada ha sido en reclutamiento. Procesamos muchos currículums y los filtros estándar (como en portales de empleo) no nos servían. Antes, RRHH revisaba todo manualmente; ahora, nuestro agente de IA lo hace de forma eficiente y precisa.

¿Tienes preguntas? Contacta a Mikhail:
Correo: mfefilov@hydra-billing.com