martes, 28 de febrero de 2023

Gráficos de conocimiento

febrero 28, 2023 0

 

Taxonomías para datos

Como tengo experiencia en contenido editorial, siempre he valorado las taxonomías para hacer que el contenido se pueda encontrar, pero más recientemente he llegado a apreciar cómo las taxonomías también pueden desempeñar un papel en hacer que los datos sean accesibles y útiles.

Las taxonomías han ayudado con éxito a las personas a encontrar y recuperar el contenido deseado desde la década de 1990 e incluso décadas antes, si consideramos los tesauros dentro del alcance de las taxonomías. Sin embargo, el foco siempre ha estado en el contenido: originalmente contenido impreso como artículos de periódicos, páginas web, páginas de intranet o CMS y documentos adjuntos, etc., y luego contenido multimedia, como imágenes, animaciones o videoclips, archivos de audio. Cada elemento de contenido se etiqueta con términos de taxonomía de diferentes tipos para lo que trata y el tipo de contenido que es. Las taxonomías se han vuelto cada vez más importantes a medida que aumentan el volumen y los tipos de contenido, especialmente a medida que más personas en diversos roles crean contenido.

Tablero de datos en la pantalla de la computadora
Mientras tanto, los datos han crecido aún más rápido en volumen y valor potencial. Cada vez escuchamos más sobre big data, almacenes de datos, lagos de datos, estructuras de datos, catálogos de datos, análisis de datos, gestión de datos maestros, gobierno de datos, datos FAIR, arquitectura centrada en datos, empresas basadas en datos y ciencia de datos en general. . Las herramientas y tecnologías para hacer uso de los datos han incluido programación/secuencias de comandos, aprendizaje automático, algoritmos, procesamiento de lenguaje natural y otras formas de inteligencia artificial.

Sin embargo, estas herramientas y tecnologías para datos no reemplazan las taxonomías y otros vocabularios controlados, que aún tienen un papel importante que desempeñar para conectar a las personas con los datos y la información deseados y, en última instancia, con el conocimiento. Veo dos formas en que las taxonomías están vinculadas a los datos:

1. Gestionar y comprender los datos de forma estandarizada con mejores metadatos, que depende de vocabularios controlados.

2. Conectar los datos con bases de datos de gráficos, gráficos de conocimiento, ontologías y, en última instancia, taxonomías.


Taxonomías y metadatos


Los metadatos se refieren a los tipos de datos, propiedades, campos o elementos estandarizados y los valores individuales específicos que completan esos tipos o propiedades. Desde la perspectiva del contenido, consideramos que los metadatos sirven para la gestión y recuperación de contenido, como el tipo de formato del contenido, el título, la fuente, el creador, la fecha, el idioma, los temas, la categoría, la audiencia, etc. Pero los metadatos también existen en las bases de datos y las hojas de cálculo. , donde los encabezados de columna son las propiedades de los metadatos. Por ejemplo, los metadatos del contacto incluirían nombre, número de teléfono, dirección de correo electrónico, ciudad/estado, país, tipo de contacto, fecha de contacto inicial, propietario del contacto, etc. Los metadatos del producto incluirían el número de SKU, el nombre del producto, el tipo/categoría del producto, el precio, color, características, fuente de suministro, disponibilidad minorista, etc. Los metadatos transaccionales incluirían el nombre del producto comprado, el comprador, la fecha de compra,

Los datos pueden administrarse y analizarse mejor si las propiedades y los valores de los metadatos están estandarizados y controlados. Los vocabularios controlados deben usarse para estandarizar los metadatos para muchas de las propiedades: formato, tipo, fuente, temas, categoría, propósito, país, tipo de contacto, nombre del producto, categoría del producto, color, características, disponibilidad, etc. Las taxonomías jerárquicas sirven para algo de esto. metadatos, como categorías de productos.

Como ejemplo, planeo asistir a una conferencia en Austin, TX, y quería buscar contactos en el área de Austin en mi sistema CRM (administración de relaciones con los clientes). Filtrando resultados por ciudad, encontré algunos con la ciudad de Austin, pero otros tenían la ciudad de Round Rock. Filtrando en Austin, me los habría perdido, si no hubiera sabido que Round Rock era un suburbio de Austin. Lo que se necesitaba era una propiedad de metadatos para "área metropolitana", en lugar de "Ciudad", una lista controlada de áreas metropolitanas, y Round Rock como una etiqueta alternativa para el área de Austin en ese vocabulario controlado.

Taxonomías y ontologías


Las taxonomías, los vocabularios controlados y los metadatos por sí solos son buenos para filtrar o realizar consultas para encontrar contenido que cumpla con un conjunto de criterios (basados ​​en propiedades de metadatos o selecciones de taxonomía facetadas). Pero, ¿qué sucede si desea descubrir y explorar las relaciones entre los datos? En lugar de simplemente buscar todos los contactos en el área de Austin que tienen el estado de cliente o cliente potencial calificado para ventas y tienen un propietario de contacto, quiero limitarlo aún más a los contactos cuyos empleadores a su vez cumplan con ciertos criterios, como pertenecer a industrias o cumplir con un mínimo de ingresos anuales. Otro ejemplo de consulta sería encontrar las ubicaciones en los últimos 10 años de eventos de la industria en los que ha participado una organización específica. Estas conexiones entre diferentes tipos de metadatos, vocabularios o categorías se realizan con una ontología.

Una ontología tiene, además de las relaciones jerárquicas características de una taxonomía, relaciones semánticas adicionales que conectan tipos o clases de entidades. Las clases pueden ser para el área metropolitana, el nombre de la empresa, el nombre de la persona, el nombre del evento de la industria, etc. Las relaciones semánticas entre estas clases pueden incluir es-empleado-por-empresa/emplea-empleado, patrocinadores-evento/tiene-patrocinador, está-ubicado- en/es-ubicación-de. Los atributos son metadatos adicionales para las entidades de cada clase, como la dirección. “Ontología” generalmente se refiere solo al modelo de conocimiento de clases, relaciones y tipos de atributos. Pero para volverse útil en la recuperación de información y el análisis de datos, una ontología se conecta a una taxonomía u otro vocabulario controlado para extender esas relaciones semánticas y atributos a todos los conceptos/términos.  

Taxonomías y grafos de conocimiento


Un uso creciente de ontologías es en grafos de conocimiento. Los gráficos de conocimiento amplían aún más el sistema de organización del conocimiento de ontología + taxonomía al integrar datos de instancia que son demasiado grandes para caber en vocabularios controlados y tienden a residir en bases de datos o celdas de hojas de cálculo. Esto podría ser los 10,000 de contactos en un CRM o productos y partes de productos en un sistema PIM (gestión de información de productos). El gráfico de conocimiento trae, real o virtualmente, los datos de estos diferentes sistemas a una base de datos de gráficos. Una base de datos de gráficos está estructurada por nodos y bordes (conexiones entre nodos), en lugar de tablas de filas y columnas características de una base de datos relacional. Las entidades de datos están en los nodos y las conexiones de relaciones o tipos de propiedades se designan a lo largo de los bordes de conexión.

¿Por qué gráficos de conocimiento? Las taxonomías, los vocabularios controlados y los metadatos por sí solos son buenos para encontrar información en un solo repositorio de contenido/datos, base de datos o sistema de administración de contenido. Pero a menudo la misma información, similar o relacionada existe en múltiples fuentes o sistemas diferentes, como datos o como "silos" de contenido, como la información del producto que reside en el PIM, la plataforma de comercio electrónico web, el sistema de gestión de contenido de marketing y las ventas. sistema de gestión. Al extraer los datos de estas diferentes fuentes y almacenarlos en una única base de datos de gráficos, se pueden realizar las conexiones entre los datos de todas las fuentes.

Los gráficos de conocimiento vinculan datos que se encuentran en diferentes repositorios y sistemas, tanto datos estructurados como no estructurados y, como tales, brindan una vista unificada de los datos. Además, con taxonomías etiquetadas adicionalmente al contenido, datos relevantes y contenido y estar vinculados entre sí.

Oportunidades para taxonomías y datos juntos

En conclusión, las taxonomías por sí solas están enfocadas al contenido, pero si combinas taxonomías con ontologías y/o metadatos diversos, extiendes el uso de las taxonomías a los datos. También estoy viendo las conexiones de taxonomías y datos en más lugares.

El título de mi trabajo actual es Ingeniero de datos y conocimiento, que refleja la combinación de los ámbitos de la gestión del conocimiento y la ciencia de datos. En realidad, no soy ingeniero de datos en absoluto, pero mi departamento en Semantic Web Company ha estandarizado los títulos de los puestos, ya que los ingenieros de conocimiento y los ingenieros de datos trabajamos muy de cerca en los mismos equipos. Esto es para proporcionar servicios y soluciones combinadas a nuestros clientes.

En otras formas, los datos y la taxonomía se combinan en trabajos. El año pasado tuve un trabajo de taxonomía por contrato que estaba muy relacionado con los datos (gestionados en hojas de cálculo). En la otra dirección, las publicaciones de trabajo relacionadas con datos tienen taxonomías en sus descripciones de trabajo. Una búsqueda hoy sobre "taxonomía" en las descripciones de los trabajos de LinkedIn arrojó Data Governance Consultant, Data Analyst II - Taxonomy, Taxonomy Data Architect, Data Custodian, Data Governance Lead en los 25 resultados principales, y en Indeed arrojó Data Analyst, Junior Analista de datos, Anotador de datos y Especialista en ingreso de datos entre los 15 primeros resultados.

He notado con mayor atención esta combinación de taxonomías y datos al participar recientemente en más conferencias relacionadas con datos. En 2021, entre otras conferencias, he hablado sobre taxonomías en Data-Centric Architecture Forum en febrero, European Data Conference on Reference Data and Semantics (ENDORSE) en marzo, Knowledge Graph Conference en mayo y Data Con LA en septiembre. Otros incluyen mi clase magistral " Fundamentos para un gráfico de conocimiento: mejores prácticas de diseño de taxonomías " en la conferencia virtual Connected Data World el 2 de diciembre, y un tutorial " Introducción a las taxonomías para científicos de datos " y la presentación " El futuro de las taxonomías: vincular los datos con el conocimiento". ambos en Data Day Texas en Austin, TX, a fines de la primavera de 2022 (pospuesto desde el 22 de enero de 2022).

jueves, 30 de mayo de 2019

Gráficos de conocimiento y ontologías


Esquema DBpedia 2010 de Wikimedia Commons atribuido a la Universidad Charles Sturt (licencia Creative Commons)
Últimamente he oído hablar mucho de los gráficos de conocimiento. Las implementaciones corporativas y académicas han ido en aumento en los últimos años, y ahora la comunidad de taxonomía también se está interesando. Los proveedores de software de taxonomía están hablando de gráficos de conocimiento en seminarios web, blogs y conferencias, y los gráficos de conocimiento estaban en la lista de temas de propuesta de presentación sugeridos para la conferencia Taxonomy Boot Camp London de este otoño .

Propósitos y definiciones del gráfico de conocimiento


Un gráfico de conocimiento es la organización y representación de una base de conocimiento como un gráfico, con una red de nodos y enlaces, no como tablas de filas y columnas. Como tal, generalmente se basa en datos de una base de datos de gráficos, en lugar de una base de datos relacional, y las bases de datos de gráficos son cada vez más populares. Un gráfico de conocimiento generalmente incluye (pero no se limita a) visualizaciones de datos, como una salida de análisis de gráficos, una visualización de nodos y enlaces interconectados, o una visualización de datos vinculados en un "cuadro de hechos".

Los gráficos de conocimiento pueden cumplir varias funciones y proporcionar muchos beneficios. Son compatibles con la búsqueda, los motores de recomendación, el comercio electrónico y la gestión del conocimiento empresarial. Pueden integrar conocimiento, servir al gobierno de datos, proporcionar enriquecimiento semántico al contenido, reunir datos estructurados y no estructurados, proporcionar una vista unificada de diversas fuentes de datos no conectadas, proporcionar una capa semántica sobre la capa de metadatos, mejorar los resultados de búsqueda más allá de los simples algoritmos, y responda consultas complejas de los usuarios en lugar de simplemente devolver contenido sobre un tema específico. Un ejemplo de una consulta compleja, que puede manejarse fácilmente mediante un gráfico de conocimiento vinculado a los datos correctos, pero que requeriría mucho tiempo, si no imposible, con los métodos tradicionales de búsqueda y consulta sería: "¿Cuál de las 10 principales revistas académicas ( por los más citados),

Ejemplo de cuadro de datos de Google Knowledge Graph
Ejemplo de gráfico de conocimiento de Google
Al igual que "taxonomía" u "ontología", la definición de "gráfico de conocimiento" no es clara ni acordada. Los gráficos de conocimiento tienen diferentes significados desde diferentes perspectivas, como aquellos con antecedentes en ciencias de la computación versus administración de la información. A veces, una base de conocimiento, o al menos una base de conocimiento que se representa como un gráfico, se considera lo mismo que un gráfico de conocimiento. Incluso hubo una presentación de conferencia, convertida en artículo, dedicada a este tema de la definición de grafos de conocimiento:  "Hacia una definición de grafos de conocimiento", de Lisa Eherlinger y Wolfram Wöß, CEURWorkshop Proceedings .

Una búsqueda en Google con los resultados de Wikipedia en la parte superior devuelve el artículo que describe el propio "Gráfico de conocimiento" de Google (introducido en 2012 y mostrado como cuadros de hechos, como en la captura de pantalla de ejemplo aquí para Boston) y también "Gráfico de conocimiento" (en minúsculas), que redirige al artículo de Wikipedia "Ontología (ciencia de la información)".

Grafos de conocimiento y taxonomías, ontologías y otros sistemas de organización del conocimiento


Los gráficos de conocimiento, como las taxonomías, comprenden cosas/nodos/conceptos y las relaciones entre ellos. Los gráficos de conocimiento pueden comprender múltiples dominios y, por lo tanto, contener múltiples taxonomías, tesauros, ontologías u otros sistemas de organización del conocimiento. Los gráficos de conocimiento pueden vincular fuentes dispares de vocabularios y datos controlados.

Ejemplo triple de RDF
Ejemplo triple de RDF
Los grafos de conocimiento se parecen a las ontologías (un tipo de sistema de organización del conocimiento que se basa en taxonomías, pero es más complejo), pero, a pesar de lo que afirma Wikipedia, no son lo mismo. Los gráficos de conocimiento y las ontologías están representados por nodos (cosas, conceptos) y tienen relaciones semánticas personalizadas entre ellos. Como ambos se pueden representar visualmente de la misma manera en los nodos y las relaciones, pueden tener el mismo aspecto en las visualizaciones. Ambos se basan en triples RDF (Resource Description Framework) (que comprenden sujeto-predicado-objeto) y, por lo general, también se basan en el estándar OWL de la Web Semántica. Todos los nodos deben tener sus propios URI exclusivos. Las herramientas de software especializadas están disponibles para crear ontologías y gráficos de conocimiento.

Los gráficos de conocimiento pueden considerarse ontologías y más. Según los autores, Eherlinger y Wöß, "un gráfico de conocimiento adquiere e integra información en una ontología y aplica un razonador para obtener nuevos conocimientos". Un gráfico de conocimiento puede comprender múltiples ontologías de dominio, o una ontología y otro sistema de organización de vocabulario/conocimiento. Cierto tipo de ontología muy general llamada ontología superior u ontología fundamental también puede servir como modelo de datos para un gráfico de conocimiento.

Conferencias que incluyen gráficos de conocimiento


Hay muchas conferencias que ahora tienen sesiones sobre gráficos de conocimiento. No puedo explorarlos todos, pero he asistido y asistiré a varias conferencias este año que incluyen gráficos de conocimiento en sus programas. VOGIN-IP-lezing 2019 "Search and Findability" en el que hablé en Amsterdam en marzo tuvo una sesión sobre el gráfico de conocimiento de un minorista de moda y un taller de 2 horas " Gráficos de conocimiento empresarial ". Cumbre de datos , a la que asistí a principios de este mes en Boston, tuvo varias sesiones que mencionaron gráficos de conocimiento, una se centró en el tema, " Del texto estructurado a los gráficos de conocimiento". , pero no como algo nuevo por definir, sino como una tecnología aceptada. Estoy emocionado de ser copresentador (presentando la primera parte sobre taxonomías y ontologías) en un taller de día completo previo a la conferencia " Fast Track to Knowledge Graphs and Semantic AI ", en la conferencia SEMANTiCS en Karlsruhe, Alemania, el 9 de septiembre. Luego presentaré "Una breve introducción a los gráficos de conocimiento", entre otras presentaciones, en  Taxonomy Boot Camp London en octubre.
Read more...

Taxonomías vs Ontologías

febrero 28, 2023 0

 A menudo surge la pregunta: ¿en qué se diferencian las taxonomías y las ontologías? Si bien hay algunas respuestas cortas y simples (como: las taxonomías son jerarquías y las ontologías son redes semánticas), es comprensible que la distinción no sea tan clara. Hay una superposición considerable. Las ontologías pueden contener taxonomías, y las taxonomías pueden enriquecerse semánticamente para convertirse en ontologías. Las mismas herramientas de software, por ejemplo PoolParty , admiten la creación de ambos.

Una de las tendencias en la gestión de datos/información/conocimiento en la convergencia de sistemas, métodos y tecnologías, incluyendo la convergencia de taxonomías y ontologías. Se ha llegado al punto de que algunas personas se refieren a taxonomías y ontologías casi indistintamente, como si fueran esencialmente lo mismo. No lo son, aunque cada vez se combinan más. Es interesante que uno de los canales de discusión más activos dentro de la comunidad de Taxonomy Talk en Discord sea sobre ontologías.

Taxonomía frente a ontología ( https://graphviews.poolparty.biz/GraphViews )

Usos

Aunque tanto las taxonomías como las ontologías son tipos de sistemas de organización del conocimiento que respaldan el acceso a la información, sus usos específicos tienden a diferir. El uso principal de las taxonomías de información es el etiquetado coherente y la recuperación precisa y completa de los elementos de contenido . Estos pueden ser documentos, componentes (secciones) de documentos, páginas web o intranet, o activos digitales (archivos de imagen, audio, video, etc.). Las ontologías, con su inclusión o vínculos con instancias/individuos, con sus diversos atributos, se centran más en los detalles de los datos : recuperación de datos, comparación de datos y análisis de datos. Las taxonomías son principalmente para lo que trata un elemento de contenido(aunque los tipos de contenido/documento también pueden ser parte de la taxonomía), como en "obtén todos los recursos de información sobre..." o "obténme una lista de productos con..." y especificando un conjunto de características y rango de precios como filtros. Las ontologías, por otro lado, pueden admitir consultas más complejas y de varios pasos, como "consígame una lista de productos con..." un conjunto de características y rango de precios, cuyos proveedores se encuentran en Canadá y tienen un ingreso anual mínimo de 50 dólares canadienses. millón.

Al comparar la recuperación de contenido y datos, por ejemplo, las taxonomías pueden recuperar un archivo de hoja de cálculo, mientras que las ontologías pueden recuperar datos de celdas individuales en la hoja de cálculo. Las ontologías pueden atravesar datos en una base de datos. Si bien esta podría ser una base de datos relacional, cada vez más se utilizan ontologías con bases de datos de gráficos, ya que las ontologías también están estructuradas como gráficos.

Orígenes

Otra gran diferencia entre taxonomías y ontologías es su origen. Las taxonomías de información (no taxonomías biológicas) se originaron en la disciplina de la biblioteconomía. Específicamente, diría que las taxonomías han evolucionado como una especie de híbrido flexible de sistemas de clasificación y tesauros. Las ontologías, por otro lado, (cuando no están en la filosofía) tienden a enseñarse e investigarse como parte de la informática. Una vez más, también ha habido una convergencia de la bibliotecología y la informática en el campo de la ciencia de la información. Sin embargo, la biblioteconomía/ciencias de la información y la informática/ciencias de la información son enfoques diferentes.

Las taxonomías también se han convertido en un área de interés en la arquitectura de la información, el diseño de la experiencia del usuario, la gestión de contenido y la gestión de activos digitales. Las taxonomías también están relacionadas con la gestión terminológica y la búsqueda y recuperación de información. Las ontologías, por otro lado, se han convertido en un área de interés en la ciencia de datos, la ingeniería de datos y la gestión de datos gráficos. Las ontologías también toman prestados conceptos de la teoría de conjuntos en matemáticas y la lógica de la filosofía.

Las taxonomías y ontologías siguen diferentes estándares, pero los estándares también han convergido en cierto modo. Las taxonomías no tienen un estándar propio, pero siguen los estándares del tesauro (ANSI/NISO Z.39.19 e ISO 25964) para las mejores prácticas recomendadas. Las ontologías se basan en los estándares W3C de RDF , RDF-Schema y el lenguaje formal de OWL (Web Ontology Language). Luego, el W3C publicó una recomendación para taxonomías, tesauros y otros sistemas de organización del conocimiento llamados SKOS.(Sistema simple de organización del conocimiento) en 2009, y desde entonces se ha adoptado ampliamente. SKOS se basa en RDF, al igual que los estándares de ontología RSF-S. Como resultado, las sentencias o espacios de nombres de SKOS y RDF-S se pueden combinar en el mismo sistema de organización del conocimiento y, por lo tanto, se pueden combinar taxonomías y ontologías.

Características

Tanto las taxonomías como las ontologías pretenden describir un dominio de conocimiento con colecciones de entidades estructuradas en grupos o tipos, con relaciones entre ellas. Las ontologías van más allá al describir las relaciones con más detalle. Los atributos también son más extensos en ontologías. Ambos admiten las opciones de notas o definiciones.

Conceptos o Entidades

Las taxonomías se componen de conceptos (a veces llamados términos), que son cosas. Los conceptos pueden ser genéricos o específicos e incluso pueden incluir entidades nombradas (nombres propios únicos). Las taxonomías no diferencian entre conceptos genéricos y entidades nombradas, que corresponden a “individuos” en una ontología. Las ontologías, por otro lado, distinguen entre dos tipos de entidades: clases e individuos. Las clases pueden ser amplias o específicas, pero, como su nombre lo indica, están destinadas a contener algo, ya sea subclases o individuos. Por el contrario, los nodos de hoja (los conceptos más estrechos en una jerarquía) en una taxonomía en realidad podrían tener un significado bastante amplio.

Los individuos, tal como los define una ontología, tienden a ser entidades nombradas (sustantivos propios) y deben ser únicamente individuales. Esto puede no ser obvio. Un producto de marca es un nombre propio, pero técnicamente no es un individuo, porque existen numerosas instancias específicas del producto que pertenecen a diferentes personas. Puede haber algunas diferencias de opinión sobre cómo definir a los individuos.

Relaciones

Las taxonomías siguen los estándares de los tesauros para las relaciones. Las relaciones jerárquicas de Thesaurus comprenden tres tipos: genérico-específico o "es un" tipo de relación, genérico-instancia (donde la instancia es una entidad nombrada o un nombre propio) y todo-parte. Las ontologías solo tienen relaciones jerárquicas "es un" genéricas y específicas, que son entre clases y subclases. La relación entre un individuo y una clase no se considera jerárquica en una ontología sino más bien una relación clase-miembro. Además, la relación todo-parte no se considera jerárquica en ontologías (pero podría crearse como una relación semántica).

Si bien la instancia genérica es un tipo de relación jerárquica permitida en una taxonomía, los conceptos de entidad nombrada (nombres propios) no suelen ser más estrechos a un concepto genérico correspondiente, sino que tienden a agruparse en su propio esquema de concepto separado para servir como una búsqueda separada. faceta o filtro.

Puede existir una relación asociativa ("relacionada") genérica en las taxonomías, aunque es más una característica de los tesauros. Es bidireccional y recíproco, y tiende a usarse entre conceptos dentro del mismo esquema de conceptos, que a menudo corresponde a una clase en una ontología. Las ontologías no tienen una relación asociativa genérica. En cambio, las ontologías tienen relaciones semánticas que son designadas por el creador de la ontología, tal como se designan las clases, y no se usan dentro de las clases sino en un par específico de clases. Las sugerencias de lo que podría ser de interés relacionado para el usuario final no están dentro del alcance del propósito de una ontología que está más estructurada y basada en reglas. Las ontologías pueden tener otras relaciones recíprocas bidireccionales, como "va con", "tiene un hermano", "acompaña", etc.

Equivalencia y etiquetas alternativas

En una taxonomía, cada concepto tiene una sola etiqueta preferida en cada idioma para mostrar y cualquier cantidad de etiquetas alternativas y etiquetas ocultas por idioma para ayudar a buscar o etiquetar. En el modelo de tesauro tradicional, los términos "no preferidos" redirigen a términos "preferidos". Las etiquetas alternativas son lo suficientemente equivalentes en el contexto de la taxonomía y el contenido que se utilizará para un concepto determinado y, por lo tanto, es posible que no sean sinónimos exactos. Las etiquetas alternativas incluyen sinónimos, casi sinónimos y posiblemente incluso términos más específicos que no se consideran necesarios como conceptos con etiquetas preferidas.

En ontologías, el elemento OWL sameAs está pensado para la equivalencia de individuos, y equivalenteClass es para la equivalencia de clases, y significan equivalencia exacta. Pero no hay designación de un nombre preferido y otro alternativo. Todos ellos son los preferidos. El uso de sameAs y equivalenteClass no está destinado a usarse dentro de una sola ontología, sino entre diferentes ontologías. Por lo tanto, esos elementos OWL son similares a la relación de coincidencia exacta de SKOS, que se utiliza en esquemas conceptuales o taxonomías. No admiten la búsqueda dentro del mismo conjunto de datos que las etiquetas alternativas.

Cumplimiento de las reglas

SKOS es un modelo de datos para taxonomías y tesauros, pero no especifica ninguna regla de uso. Más bien, el creador de la taxonomía debe intentar seguir las pautas, no exactamente las reglas, en los estándares del tesauro (ANSI/NISO Z39.19 e ISO 25964-1). Los estándares de calidad incluyen etiquetas disjuntas (una etiqueta puede usarse solo una vez para un concepto, preferido o alternativo, y solo para un concepto), relaciones simples (un par de conceptos pueden tener relaciones jerárquicas o asociativas entre ellos, pero no ambas), y sin ciclos jerárquicos. El estándar para ontologías, por otro lado, OWL, tiene muchas reglas integradas. Esto hace que las ontologías OWL sean más poderosas al admitir la inferencia y el razonamiento.

Conclusiones

Las taxonomías y ontologías comparten algunas características, pero cada una tiene sus propias características adicionales. Por lo tanto, una combinación de una taxonomía SKOS con una ontología OWL combina las características de ambos. Además, la combinación de una taxonomía con una ontología también permite una combinación de usos, es decir, la búsqueda y recuperación de contenido y datos juntos. En lugar de una convergencia de taxonomías y ontologías, se combinan cuidadosa y deliberadamente para maximizar sus beneficios.

FUENTE

Read more...

Conceptos relacionados en taxonomías

febrero 28, 2023 0

 


Conceptos relacionados en una taxonomía
A y B están relacionados; C y D están relacionados.
Las taxonomías y los tesauros se caracterizan por tener relaciones jerárquicas que vinculan sus términos. La relación asociativa (para conceptos relacionados, Término relacionado o RT), por otro lado, es una característica fundamental de los tesauros, pero es simplemente una característica opcional de las taxonomías. 

Una distinción demasiado simplista entre taxonomías y tesauros es la presencia de relaciones asociativas, aunque no estoy de acuerdo, porque las taxonomías pueden tener relaciones asociativas y existen otras diferencias de diseño estructural entre taxonomías y tesauros. (Consulte mis publicaciones de blog anteriores Taxonomías frente a tesauros y Taxonomías frente a tesauros: implementaciones prácticas )

La relación asociativa es una relación recíproca genérica, no jerárquica, simétrica (igual en ambas direcciones) entre pares de términos/conceptos en un tesauro o taxonomía. La siguiente figura ilustra que la protección de datos y la privacidad están relacionadas.


Es cierto que muchas taxonomías no tienen relaciones asociativas. Esto es por varias razones. La función de la taxonomía en la interfaz de usuario puede no requerir los conceptos relacionados con el soporte, como cuando la taxonomía se muestra solo como facetas para refinar los resultados o como sugerencias de términos de taxonomía de escritura anticipada cuando un usuario ingresa una cadena de búsqueda en un cuadro de búsqueda. La taxonomía se puede implementar en un sistema (como un sistema comercial de administración de contenido estándar o SharePoint) que no admita los enlaces o la navegación a conceptos relacionados en la interfaz de usuario. Una taxonomía puede ser demasiado pequeña para hacer un uso beneficioso de las relaciones asociativas, si la mayor parte de la taxonomía se puede explorar y ver rápidamente. Finalmente, y quizás de mayor importancia potencial, es que las relaciones entre diferentes tipos de conceptos (procesos, agentes, acciones,

No es tanto la presencia sino más bien la extensión de las relaciones asociativas lo que también distingue a los tesauros de las taxonomías.   En un diccionario de sinónimos tradicional, las relaciones asociativas son tan prolíficas como las relaciones jerárquicas, y quizás incluso más, y se dan entre términos de todo tipo y diferentes tipos de relación. Los estándares del tesauro (ANSI/NISO Z39.19 e ISO 25964-1) proporcionan una lista de posibles tipos de relaciones asociativas (proceso y agente, acción y objetivo, causa y efecto, objeto y propiedad, objeto y orígenes, y disciplina y objeto). , Entre muchos otros). Cuando las taxonomías tienen relaciones asociativas, tienden a limitarse solo a ciertas categorías, facetas o esquemas conceptuales de la taxonomía.

Conceptos relacionados y esquemas conceptuales de SKOS

La mayoría de las taxonomías en estos días, si son de un tamaño significativo (cientos o miles de conceptos) y están destinadas a usarse en más de una aplicación, se crean en el SKOS .(Sistema Simple de Organización del Conocimiento) modelo de datos. (Las taxonomías más pequeñas pueden crearse en una hoja de cálculo e importarse a un sistema de administración de contenido). El nivel más alto de estructura organizativa en SKOS es el esquema conceptual. El software de administración de taxonomía basado en SKOS agrupará y mostrará múltiples esquemas de conceptos en un solo "proyecto" o "modelo de conocimiento", que está diseñado para un solo uso comercial, conjunto de contenido, audiencia de usuarios o implementación (con cierta superposición de múltiples casos de uso aceptables). Si bien SKOS no brinda ninguna recomendación sobre para qué debe usar los esquemas de conceptos, se ha convertido en una práctica común designar un esquema de conceptos para una faceta de taxonomía o una propiedad/campo de metadatos.  Incluso cuando los esquemas conceptuales no se implementan actualmente como facetas, podrían implementarse en el futuro, por lo que es una buena práctica crear esquemas conceptuales para representar facetas. La estructura de esquemas de conceptos que representan facetas también es un buen principio organizador para construir cualquier taxonomía. Los esquemas conceptuales también tienden a reflejar "clases" de ontologías de alto nivel (aunque no la muy esotérica clase superior de "Cosa").

SKOS permite la creación de relaciones de conceptos relacionados tanto dentro como entre esquemas de conceptos. SKOS también tiene relaciones de mapeo denominadas propiedades coincidentes, incluido relatedMatch, para usar entre esquemas conceptuales, ya sea que estén en el mismo "proyecto" (compartiendo la misma parte de dominio inicial de un URI) o no. La opción de usar related o relatedMatch entre esquemas de concepto del mismo proyecto puede ser una fuente de confusión.

Mejores prácticas para conceptos relacionados con SKOS

Si está implementando esquemas de concepto cada uno como una faceta/filtro/refinamiento en una interfaz de usuario, entonces es una buena práctica no crear relaciones asociativas (relacionadas) entre conceptos en diferentes esquemas de concepto. Las facetas funcionan como aspectos o dimensiones mutuamente excluyentes de elementos de contenido y consultas. Cualquier "relación" está implícita en función de los resultados de la búsqueda, pero no de la taxonomía en sí, que debe ser flexible para permitir cualquier combinación de conceptos de facetas y no prescribir la relación. Por ejemplo, un usuario puede querer filtrar una búsqueda de películas por las cuales las películas cumplen con los criterios seleccionados (facetas) de un género, actor, director, tema de actualidad y país de producción elegidos, y el conjunto de resultados indicará implícitamente en qué películas se encuentran. estos aspectos están relacionados.

Enriquecer una taxonomía con la semántica de una ontología, además de admitir atributos de datos adicionales (como el año de producción de la película, la nacionalidad y la fecha de nacimiento del actor, etc.), admite conexiones entre tipos de conceptos que se pueden utilizar en una aplicación front-end. El usuario puede buscar no solo películas, sino también buscar otras entidades, como actores (que aparecen en películas de cierto género dirigidas por cierto director), o directores (que dirigieron películas sobre ciertos temas de ciertos países), etc. Esto  implicó la creación de relaciones semánticas personalizadas entre clases que corresponden a los esquemas conceptuales: El actor actúa en el título de la película y el título de la película tiene Actor Actor , título de la película isProducedIn Country y Country isOriginOf Movie title , etc. Estas relaciones semánticas, por supuesto, hacen que cualquier relación genérica relacionada con SKOS en los esquemas de conceptos sea innecesaria, redundante y sin sentido.

Por lo tanto, independientemente del uso de sus esquemas de conceptos, es mejor no utilizar la relación de conceptos relacionados entre conceptos en diferentes esquemas de conceptos. Más bien, la relación de conceptos relacionados se usa mejor entre conceptos dentro de un esquema de conceptos, especialmente conceptos de actualidad (materia), por ejemplo, relacionando los conceptos Calidad de datos y Gestión de calidad . Por otro lado, es mejor dejar que la relación entre entidades nombradas dentro de un esquema conceptual, como los esquemas conceptuales de Personas, Organizaciones y Lugares geográficos, quede implícita a partir del contenido recuperado y no prescrita en una taxonomía, que puede depender de la contenido, cambiar con el tiempo y ser demasiado subjetivo.

Incluso si la aplicación de usuario final actual de una taxonomía no admite la interacción del usuario con enlaces relacionados, las relaciones asociativas pueden admitir el etiquetado, tanto manual como automatizado. Por último, una taxonomía suele tener una vida más larga que una sola aplicación, por lo que la incorporación de relaciones de conceptos relacionados mientras se construye la taxonomía y se mantiene regularmente es una buena práctica para el uso futuro de la taxonomía.

FUENTE

Read more...

Follow Us @soratemplates