martes, 28 de febrero de 2023

Taxonomías vs Ontologías

 A menudo surge la pregunta: ¿en qué se diferencian las taxonomías y las ontologías? Si bien hay algunas respuestas cortas y simples (como: las taxonomías son jerarquías y las ontologías son redes semánticas), es comprensible que la distinción no sea tan clara. Hay una superposición considerable. Las ontologías pueden contener taxonomías, y las taxonomías pueden enriquecerse semánticamente para convertirse en ontologías. Las mismas herramientas de software, por ejemplo PoolParty , admiten la creación de ambos.

Una de las tendencias en la gestión de datos/información/conocimiento en la convergencia de sistemas, métodos y tecnologías, incluyendo la convergencia de taxonomías y ontologías. Se ha llegado al punto de que algunas personas se refieren a taxonomías y ontologías casi indistintamente, como si fueran esencialmente lo mismo. No lo son, aunque cada vez se combinan más. Es interesante que uno de los canales de discusión más activos dentro de la comunidad de Taxonomy Talk en Discord sea sobre ontologías.

Taxonomía frente a ontología ( https://graphviews.poolparty.biz/GraphViews )

Usos

Aunque tanto las taxonomías como las ontologías son tipos de sistemas de organización del conocimiento que respaldan el acceso a la información, sus usos específicos tienden a diferir. El uso principal de las taxonomías de información es el etiquetado coherente y la recuperación precisa y completa de los elementos de contenido . Estos pueden ser documentos, componentes (secciones) de documentos, páginas web o intranet, o activos digitales (archivos de imagen, audio, video, etc.). Las ontologías, con su inclusión o vínculos con instancias/individuos, con sus diversos atributos, se centran más en los detalles de los datos : recuperación de datos, comparación de datos y análisis de datos. Las taxonomías son principalmente para lo que trata un elemento de contenido(aunque los tipos de contenido/documento también pueden ser parte de la taxonomía), como en "obtén todos los recursos de información sobre..." o "obténme una lista de productos con..." y especificando un conjunto de características y rango de precios como filtros. Las ontologías, por otro lado, pueden admitir consultas más complejas y de varios pasos, como "consígame una lista de productos con..." un conjunto de características y rango de precios, cuyos proveedores se encuentran en Canadá y tienen un ingreso anual mínimo de 50 dólares canadienses. millón.

Al comparar la recuperación de contenido y datos, por ejemplo, las taxonomías pueden recuperar un archivo de hoja de cálculo, mientras que las ontologías pueden recuperar datos de celdas individuales en la hoja de cálculo. Las ontologías pueden atravesar datos en una base de datos. Si bien esta podría ser una base de datos relacional, cada vez más se utilizan ontologías con bases de datos de gráficos, ya que las ontologías también están estructuradas como gráficos.

Orígenes

Otra gran diferencia entre taxonomías y ontologías es su origen. Las taxonomías de información (no taxonomías biológicas) se originaron en la disciplina de la biblioteconomía. Específicamente, diría que las taxonomías han evolucionado como una especie de híbrido flexible de sistemas de clasificación y tesauros. Las ontologías, por otro lado, (cuando no están en la filosofía) tienden a enseñarse e investigarse como parte de la informática. Una vez más, también ha habido una convergencia de la bibliotecología y la informática en el campo de la ciencia de la información. Sin embargo, la biblioteconomía/ciencias de la información y la informática/ciencias de la información son enfoques diferentes.

Las taxonomías también se han convertido en un área de interés en la arquitectura de la información, el diseño de la experiencia del usuario, la gestión de contenido y la gestión de activos digitales. Las taxonomías también están relacionadas con la gestión terminológica y la búsqueda y recuperación de información. Las ontologías, por otro lado, se han convertido en un área de interés en la ciencia de datos, la ingeniería de datos y la gestión de datos gráficos. Las ontologías también toman prestados conceptos de la teoría de conjuntos en matemáticas y la lógica de la filosofía.

Las taxonomías y ontologías siguen diferentes estándares, pero los estándares también han convergido en cierto modo. Las taxonomías no tienen un estándar propio, pero siguen los estándares del tesauro (ANSI/NISO Z.39.19 e ISO 25964) para las mejores prácticas recomendadas. Las ontologías se basan en los estándares W3C de RDF , RDF-Schema y el lenguaje formal de OWL (Web Ontology Language). Luego, el W3C publicó una recomendación para taxonomías, tesauros y otros sistemas de organización del conocimiento llamados SKOS.(Sistema simple de organización del conocimiento) en 2009, y desde entonces se ha adoptado ampliamente. SKOS se basa en RDF, al igual que los estándares de ontología RSF-S. Como resultado, las sentencias o espacios de nombres de SKOS y RDF-S se pueden combinar en el mismo sistema de organización del conocimiento y, por lo tanto, se pueden combinar taxonomías y ontologías.

Características

Tanto las taxonomías como las ontologías pretenden describir un dominio de conocimiento con colecciones de entidades estructuradas en grupos o tipos, con relaciones entre ellas. Las ontologías van más allá al describir las relaciones con más detalle. Los atributos también son más extensos en ontologías. Ambos admiten las opciones de notas o definiciones.

Conceptos o Entidades

Las taxonomías se componen de conceptos (a veces llamados términos), que son cosas. Los conceptos pueden ser genéricos o específicos e incluso pueden incluir entidades nombradas (nombres propios únicos). Las taxonomías no diferencian entre conceptos genéricos y entidades nombradas, que corresponden a “individuos” en una ontología. Las ontologías, por otro lado, distinguen entre dos tipos de entidades: clases e individuos. Las clases pueden ser amplias o específicas, pero, como su nombre lo indica, están destinadas a contener algo, ya sea subclases o individuos. Por el contrario, los nodos de hoja (los conceptos más estrechos en una jerarquía) en una taxonomía en realidad podrían tener un significado bastante amplio.

Los individuos, tal como los define una ontología, tienden a ser entidades nombradas (sustantivos propios) y deben ser únicamente individuales. Esto puede no ser obvio. Un producto de marca es un nombre propio, pero técnicamente no es un individuo, porque existen numerosas instancias específicas del producto que pertenecen a diferentes personas. Puede haber algunas diferencias de opinión sobre cómo definir a los individuos.

Relaciones

Las taxonomías siguen los estándares de los tesauros para las relaciones. Las relaciones jerárquicas de Thesaurus comprenden tres tipos: genérico-específico o "es un" tipo de relación, genérico-instancia (donde la instancia es una entidad nombrada o un nombre propio) y todo-parte. Las ontologías solo tienen relaciones jerárquicas "es un" genéricas y específicas, que son entre clases y subclases. La relación entre un individuo y una clase no se considera jerárquica en una ontología sino más bien una relación clase-miembro. Además, la relación todo-parte no se considera jerárquica en ontologías (pero podría crearse como una relación semántica).

Si bien la instancia genérica es un tipo de relación jerárquica permitida en una taxonomía, los conceptos de entidad nombrada (nombres propios) no suelen ser más estrechos a un concepto genérico correspondiente, sino que tienden a agruparse en su propio esquema de concepto separado para servir como una búsqueda separada. faceta o filtro.

Puede existir una relación asociativa ("relacionada") genérica en las taxonomías, aunque es más una característica de los tesauros. Es bidireccional y recíproco, y tiende a usarse entre conceptos dentro del mismo esquema de conceptos, que a menudo corresponde a una clase en una ontología. Las ontologías no tienen una relación asociativa genérica. En cambio, las ontologías tienen relaciones semánticas que son designadas por el creador de la ontología, tal como se designan las clases, y no se usan dentro de las clases sino en un par específico de clases. Las sugerencias de lo que podría ser de interés relacionado para el usuario final no están dentro del alcance del propósito de una ontología que está más estructurada y basada en reglas. Las ontologías pueden tener otras relaciones recíprocas bidireccionales, como "va con", "tiene un hermano", "acompaña", etc.

Equivalencia y etiquetas alternativas

En una taxonomía, cada concepto tiene una sola etiqueta preferida en cada idioma para mostrar y cualquier cantidad de etiquetas alternativas y etiquetas ocultas por idioma para ayudar a buscar o etiquetar. En el modelo de tesauro tradicional, los términos "no preferidos" redirigen a términos "preferidos". Las etiquetas alternativas son lo suficientemente equivalentes en el contexto de la taxonomía y el contenido que se utilizará para un concepto determinado y, por lo tanto, es posible que no sean sinónimos exactos. Las etiquetas alternativas incluyen sinónimos, casi sinónimos y posiblemente incluso términos más específicos que no se consideran necesarios como conceptos con etiquetas preferidas.

En ontologías, el elemento OWL sameAs está pensado para la equivalencia de individuos, y equivalenteClass es para la equivalencia de clases, y significan equivalencia exacta. Pero no hay designación de un nombre preferido y otro alternativo. Todos ellos son los preferidos. El uso de sameAs y equivalenteClass no está destinado a usarse dentro de una sola ontología, sino entre diferentes ontologías. Por lo tanto, esos elementos OWL son similares a la relación de coincidencia exacta de SKOS, que se utiliza en esquemas conceptuales o taxonomías. No admiten la búsqueda dentro del mismo conjunto de datos que las etiquetas alternativas.

Cumplimiento de las reglas

SKOS es un modelo de datos para taxonomías y tesauros, pero no especifica ninguna regla de uso. Más bien, el creador de la taxonomía debe intentar seguir las pautas, no exactamente las reglas, en los estándares del tesauro (ANSI/NISO Z39.19 e ISO 25964-1). Los estándares de calidad incluyen etiquetas disjuntas (una etiqueta puede usarse solo una vez para un concepto, preferido o alternativo, y solo para un concepto), relaciones simples (un par de conceptos pueden tener relaciones jerárquicas o asociativas entre ellos, pero no ambas), y sin ciclos jerárquicos. El estándar para ontologías, por otro lado, OWL, tiene muchas reglas integradas. Esto hace que las ontologías OWL sean más poderosas al admitir la inferencia y el razonamiento.

Conclusiones

Las taxonomías y ontologías comparten algunas características, pero cada una tiene sus propias características adicionales. Por lo tanto, una combinación de una taxonomía SKOS con una ontología OWL combina las características de ambos. Además, la combinación de una taxonomía con una ontología también permite una combinación de usos, es decir, la búsqueda y recuperación de contenido y datos juntos. En lugar de una convergencia de taxonomías y ontologías, se combinan cuidadosa y deliberadamente para maximizar sus beneficios.

FUENTE

No hay comentarios:

Follow Us @soratemplates