Siete claves para optimizar la gestión de contenidos con el uso de taxonomías
Expert.ai, multinacional proveedora de soluciones de IA para el procesamiento del lenguaje natural (NLP), ha hecho público un listado de claves para la creación y el aprovechamiento de las taxonomías como aliado para la organización de contenidos empresariales a gran escala.
Las taxonomías son sistemas de organización del conocimiento que facilitan el acceso a la información. Su propósito más común es el etiquetado coherente de la información para una posterior recuperación precisa y completa de sus elementos de contenido. “El uso de taxonomías para organizar contenidos está aumentando entre las organizaciones”, explica Elisa Martínez Frade, VP Sales de Expert.ai para Iberia y Latinoamérica. “Considerando que el contenido es un 53% menos efectivo si el usuario tiene problemas para encontrarlo, una mala experiencia puede afectar negativamente a las relaciones con los clientes e impactar en su opinión sobre la precisión, relevancia y utilidad de dicho contenido. La taxonomía permite avanzar en este sentido”.
Los ingenieros de Expert.ai detallan siete claves sobre taxonomías para comprender cómo las organizaciones pueden aprovechar esta tecnología para presentar contenidos corporativos.
- La taxonomía impulsa la web semántica
La web semántica (o Web 3.0) es un conjunto de estándares establecidos por el W3C que permiten a los sistemas comprender mejor lo que las personas quieren decir cuándo interactúan con un sitio. La taxonomía es la base de la web semántica, ya que se utiliza para representar y conectar términos, conceptos, objetos… y organizarlos en ontologías que representan áreas (dominios) de interés. Esto permite a las máquinas a comprender los términos en contexto, como lo hacen los humanos.
- Taxonomía y ontología: elementos complementarios
La principal diferencia entre taxonomía y ontología es que la primera se ocupa sobre todo de cómo clasificar cada objeto, mientras que la segunda se centra en cómo se relacionan los objetos entre sí. Así, se podría desarrollar una taxonomía sobre ardillas con un elemento jerárquicamente dependiente sobre nueces, pero esto no hace que exista una relación asociativa entre, por ejemplo, las ardillas rojas que comen avellanas. Eso es lo que ofrece la ontología: muestra esa relación.
- Es necesario desarrollar taxonomías equilibradas
Es importante evitar que las taxonomías lleguen a ser tan estrictas que omitan datos importantes, pero también que sean demasiado amplias que produzcan información no deseada. Si un término es demasiado amplio, producirá tantos resultados que su taxonomía será inútil; y, si es demasiado limitado, solo devolverá parte del contenido y tampoco será útil. La clave pasará por comprender el área temática con la que se está trabajando y determinar con qué frecuencia se debe revisar la taxonomía.
- Eliminación de modismos y clichés para evitar falsos positivos
Un buen filtro previo para evitar que la taxonomía produzca falsos positivos es eliminar elementos como modismos y clichés. Por ejemplo, aprovechando las plataformas de procesamiento del lenguaje natural (NLP) con análisis semántico para analizar cada término y determinar si es un modismo o un cliché. Por ejemplo, si observamos el término «ponerse morado», el NLP garantizará que el sistema entiende, por el contexto, si se trata de una copiosa comida o de un problema médico.
- Adaptación de la taxonomía al sector de actividad
Las taxonomías se pueden adaptar a cualquier sector empresarial, pero la capacidad de adaptación dependerá de la cantidad de experiencia que existe en el dominio. Si hay suficiente contenido para clasificar, el número de dominios con los que se puede representar la información son prácticamente ilimitados. Para ello, la empresa puede desarrollar sus propias taxonomías o bien utilizar una plataforma de NLP para conectarse a taxonomías existentes ya implementadas y modelos de conocimiento ya creados.
- La importancia de la jerga
Cabría pensar que es más fácil crear una taxonomía si el documento fuente utiliza mucha jerga específica. Pero lo cierto es que el exceso de jerga dificulta la creación, ya que no siempre es fácil aclarar la terminología (es posible que un mismo término se utilice en varios contextos). El mejor enfoque es capturar la jerga en el vocabulario como información adicional, de modo que los usuarios puedan buscar usando esta terminología y aun así encontrar lo que buscan. En definitiva, garantizar que el contenido sea reconocible.
- Creación de taxonomías a gran escala: la clave está en la simplificación
Hay varias opciones para simplificar el proceso de creación de taxonomías. Por ejemplo, partiendo de taxonomías existentes en bases de datos como TaxoBank o Wand, que pueden utilizarse como punto de partida para reducir el tiempo dedicado a desarrollar y personalizar. O, por ejemplo, si lo que se busca es una taxonomía de ciberseguridad, la Taxonomía Europea de Ciberseguridad es un buen recurso.