Conocimiento Declarativo

3.3.3 Hipergrafos canalizados y RDF

El Marco de Descripción de Recursos (RDF) modela la información a través de gráficos dirigidos (Refs. son buenas discusiones de tecnologías de la Web Semántica desde una perspectiva gráfica teórica), cuyos bordes están etiquetados con conceptos que, en contextos bien estructurados, se extraen de Ontologías publicadas (estas etiquetas juegan un papel similar a los «clasificadores» en CHs). En principio, todos los datos expresados a través de gráficos RDF se definen por conjuntos desordenados de aristas etiquetadas, también llamados «triples» («Subject Sujeto, Predicado, Objeto Object», donde el «Predicado» es la etiqueta). En la práctica, sin embargo, las notaciones de RDF de alto nivel como TTL (Tortuga o «Lenguaje Triple de RDF Conciso») y Notación3 (N3) se ocupan de grupos agregados de datos, como contenedores y colecciones de RDF.

Por ejemplo, imagine una representación del hecho de que «(A/La persona nombrada) Nathaniel, de 46 años, ha vivido en Brooklyn, Búfalo y Montreal» (se muestra en la Fig. 3.2 como a CH y en RDF). Si consideramos a Turtle o N3 como lenguajes y no solo notaciones, parecería que su semántica está construida alrededor de hiperedges en lugar de triples. Parecería que estos lenguajes codifican aserciones de muchos a muchos o de uno a muchos, graficadas como aristas que tienen más de un sujeto y/o predicado. De hecho, el propio Tim Berners-Lee sugiere que «las implementaciones pueden tratar a list como un tipo de datos en lugar de solo una escalera de propiedades rdf: first y rdf: rest». Es decir, la especificación para estructuras de datos de tipo lista RDF nos invita a considerar que pueden considerarse unidades integrales en lugar de simplemente agregados que se separan en la interpretación semántica.

Fig. 3.2. Colecciones CH versus RDF.

Técnicamente, tal vez, esto es una ilusión. A pesar de su expresividad de mayor nivel, los lenguajes de expresión RDF se consideran, tal vez, «azúcar sintáctica» para una lista más primitiva de triples: la semántica de Turtle y N3 se concibe para ser definida mediante la traducción de expresiones a los conjuntos triples que implican lógicamente (véase también ). Esta intención acepta el paradigma de que proporcionar semántica para un lenguaje formal está estrechamente relacionado con definir qué proposiciones están lógicamente implicadas por sus declaraciones.

Hay, sin embargo, una tradición divergente en la semántica formal que está orientada a la teoría de tipos más que a la lógica. Es consistente con este enfoque alternativo ver una semántica diferente para un lenguaje como Turtle, donde los agregados a mayor escala se convierten en valores de «primera clase». Tan, lang⌈Nathaniel⌉, ⌈46⌉〉 puede ser visto como un (único, integral) valor cuyo tipo es una 〈nombre, edad〉 par. Tal valor tiene una «estructura interna» que subsume múltiples puntos de datos. La versión RDF está organizada, en cambio, en torno a un nodo en blanco que une puntos de datos dispares, como mi nombre y mi edad. Este nodo en blanco también está conectado a otro nodo en blanco que une place y party. Los nodos en blanco desempeñan un papel organizativo, ya que los nodos se agrupan en la medida en que se conectan al mismo nodo en blanco. Pero la organización implícita está menos estrictamente implicada; uno podría asumir que los nodos Brooklyn Brooklyn Democrat, Democrat Democrat could podrían estar unidos individualmente al espacio en blanco «nombre/edad» (es decir, vivo en Brooklyn y voto Demócrata).

¿Por qué, es decir, Brooklyn y Democratic están agrupados juntos? ¿Qué concepto tiene este modelo de fusión? Hay un supuesto fundamento para el espacio en blanco nombre / edad (p. ej., el nombre de fusión/edad uniéndolos a un nodo en blanco en lugar de permitirles tomar bordes de forma independiente): posiblemente hay varios niños de 46 años llamados Nathaniel, de modo que el nodo en blanco desempeña un papel semántico clave (análogo al cuantificador en «Hay un Nathaniel, de 46 años age»); proporciona un nexo inequívoco para que se puedan unir más predicados a un Nathaniel específico de 46 años en lugar de cualquier viejo Nath Nathaniel Nath, 4 46.. Pero no se sugiere un papel semántico similar para la agrupación» lugar/partido». El nombre no se puede burlar lógicamente aparte del espacio en blanco nombre/edad (porque hay varios Nataniels), pero parece que no hay un significado lógico para la agrupación de lugar / grupo. Sin embargo, el emparejamiento de estos valores puede estar motivado por una convención de modelos, que refleja que los datos geográficos y de afiliación a partidos se agrupan en un conjunto de datos o modelo de datos. La semántica lógica de RDF hace que sea más difícil expresar este tipo de supuestos de modelado que están impulsados por la convención más que por la lógica, una abstracción del entorno de modelado de datos que puede ser deseable en algunos contextos pero no en otros.

Entonces, ¿por qué la comunidad de la Web Semántica insiste efectivamente en una interpretación semántica de Turtle y N3 como una conveniencia notacional para N-Triples en lugar de como lenguajes de nivel superior con una semántica de nivel superior diferente, y a pesar de declaraciones como la cita anterior de Tim Berners-Lee insinuando que incluso aquellos que están en el corazón de las especificaciones de la Web Semántica han contemplado una interpretación alternativa? Además, la definición de jerarquías de composición de materiales u organización estructural—y por extensión, potencialmente, escalas distintas de resolución de modelado—ha sido identificada como una parte intrínseca del diseño de Ontología específica de dominio (ver Referencias. o Ref. ). Los defensores de la Web semántica, sin embargo, no han promovido la estructura multiple como una característica de los modelos semánticos fundamentalmente, a diferencia de la criteriología dentro de Ontologías específicas. En la medida en que esto tenga una explicación, probablemente tenga algo que ver con los motores de razonamiento: las herramientas que evalúan las consultas SPARQL operan en un triplestore. Por lo tanto, la interpretación semántica» reductiva » se justifica a través de una garantía de que los criterios definitivos para las representaciones de la Web semántica no son su elegancia conceptual frente a los juicios humanos, sino su utilidad en las inferencias cross-ontológicas y cross-contextuales.

Como contra-argumento, sin embargo, tenga en cuenta que muchos motores de inferencia en Resolución de Restricciones, Visión por Computadora, etc., se basan en algoritmos especializados y no se pueden reducir a un formato de consulta canónica. Las bibliotecas como GeCODE e ITK son importantes porque la resolución de problemas en muchos dominios exige una ingeniería a nivel de aplicación ajustada. Podemos pensar en estas bibliotecas como soporte de motores de razonamiento especiales o específicos de dominio, a menudo construidos para proyectos específicos, mientras que los razonadores basados en OWL como Fact++ son motores generales que funcionan con datos RDF de propósito general sin mayor calificación. Para aplicar reasoners «especiales» a RDF, se debe seleccionar un contingente de nodos que sea consistente con los requisitos de tiempo de ejecución de reasoners.

Por supuesto, no se puede esperar que los razonadores especiales se ejecuten en el dominio de toda la Web semántica, o incluso en conjuntos de datos «muy grandes» en general. Un análisis típico subdividirá su problema en partes más pequeñas que son cada una manejable a razonadores personalizados: en radiología, por ejemplo, un diagnóstico puede proceder seleccionando primero una serie de imágenes médicas y luego realizando una segmentación imagen por imagen. Aplicado a RDF, este proceso de dos pasos se puede considerar una combinación de razonadores generales y especiales: un lenguaje general como SPARQL filtra muchos nodos hasta un subconjunto más pequeño, que luego se asigna / deserializa a representaciones específicas de dominio (incluida la memoria de tiempo de ejecución). Por ejemplo, la RDF puede vincular a un paciente a una prueba de diagnóstico, ordenada en una fecha determinada por un médico en particular, cuyos resultados se pueden obtener como un conjunto de imágenes, seleccionando así la serie particular relevante para una tarea de diagnóstico. Los razonadores generales pueden encontrar las imágenes de interés y luego pasarlas a razonadores especiales (como algoritmos de segmentación) para analizarlas. En la medida en que esta arquitectura está en efecto, los datos de la Web Semántica son un sitio para muchos tipos de motores de razonamiento. Algunos de estos motores necesitan funcionar transformando los datos y recursos RDF en una representación interna optimizada. Además, la semántica de estas representaciones estará típicamente más cerca de una semántica N3 de alto nivel tomada como sui generis, en lugar de interpretarse reductivamente como una conveniencia notacional para formatos de nivel inferior como N-Triple. Esto parece socavar la justificación de la semántica reductiva en términos de razonadores de BÚHOS.

Quizás el paradigma más preciso es que los datos de la Web Semántica tienen dos interpretaciones diferentes, que difieren en ser consistentes con la semántica especial y general, respectivamente. Tiene sentido etiquetarlas como» interpretación semántica especial «o» interpretación semántica para razonadores de propósito especial «(SSI, tal vez) y» interpretación semántica general » (GSI), respectivamente. Se debe considerar que ambas interpretaciones tienen un papel en la «semántica» de la Web Semántica.

Otro orden de consideraciones involucra la semántica de nodos RDF e hipernodos CH, particularmente con respecto a la unicidad. Los nodos en RDF se dividen en tres clases: nodos en blanco; nodos con valores de un pequeño conjunto de tipos básicos como cadenas e enteros; y nodos con direcciones URL que se entienden únicas en toda la World Wide Web. No hay nodos en blanco en CH, e intrínsecamente tampoco URLs, aunque ciertamente se puede definir un tipo de URL. No hay nada en la semántica de las URL que garantice que cada URL designe un recurso de Internet distinto; esta es solo una convención que esencialmente se cumple de facto porque estructura una red de prácticas comerciales y legales, no solo digitales; por ejemplo, la propiedad se otorga de manera única para cada nombre de dominio de Internet. En CH, un tipo de datos puede estructurarse para reflejar prácticas institucionales que garanticen la singularidad de los valores en algún contexto: los libros tienen códigos ISBN únicos; los lugares tienen ubicaciones SIG distintas, etc. Estos requisitos de unicidad, sin embargo, no son intrínsecamente parte de CH, y necesitan expresarse con axiomas adicionales. En general, un hipernodo CH es una tupla de valores relativamente simples y cualquier semántica adicional está determinada por definiciones de tipos (puede ser útil ver los hipernodos CH como aproximadamente análogos a las estructuras C, que no tienen un mecanismo de singularidad a priori).

Además, los tipos RDF son menos intrínsecos a la semántica RDF que en CH . Los elementos fundamentales de CH son tuplas de valor (a través de nodos que expresan valores, cuyas tuplas a su vez son hipernodos). Las tuplas están indexadas por posición, no por etiquetas: la tupla Nath Nathaniel., 4 46. no dibuja en sí misma las etiquetas «name» o «age», que en su lugar se definen a nivel de tipo (en la medida en que las definiciones de tipo puedan estipular que la etiqueta «age» es un alias para el nodo en su segunda posición, etc.). Por lo tanto, no hay forma de determinar la intención semántica/conceptual de los hipernodos sin considerar los tipos hiponodo e hipernodo. Por el contrario, RDF no tiene tuplas reales (aunque se pueden representar como colecciones, si se desea); y los nodos siempre se unen a otros nodos a través de conectores etiquetados: no hay un equivalente directo a la unidad de modelado CH de un hiponodo que se incluye en un hipernodo por posición.

En su núcleo, entonces, la semántica RDF se basa en la proposición de que muchos nodos pueden ser declarados globalmente únicos por fiat. Esto no tiene que ser cierto para todos los nodos: los tipos RDF como enteros y flotadores son más etéreos; el número 46 en un gráfico es indistinguible de 46 en otro gráfico. Esto se puede formalizar diciendo que algunos nodos pueden ser objetos, pero nunca sujetos. Si no se aplicaran tales restricciones, los gráficos RDF podrían llegar a ser en algún sentido sobredeterminados, lo que implicaría relaciones en virtud de magnitudes cuantitativas carentes de contenido semántico. Esto abriría la puerta a juicios extraños como «mi edad no es prima» o «Soy mayor que los totales de objetivos de Mohamed Salah para 2018.»Una forma de bloquear estas inferencias es evitar que nodos como «el número 46» sean tanto sujetos como objetos. Pero los nodos que no son valores primitivos—por ejemplo, aquellos que designan al propio Mohamed Salah en lugar de los totales de sus objetivos—son, con razón, únicos a nivel mundial, ya que tenemos razones convincentes para adoptar un modelo en el que hay exactamente una cosa que es que Mohamed Salah. Así que la semántica RDF básicamente combina algunos tipos primitivos que son objetos pero nunca sujetos con una red de valores globalmente únicos pero internamente no estructurados que pueden ser sujeto u objeto.

En CH, los tipos «primitivos» son efectivamente hipotipos; los hiponodos son (al menos indirectamente) análogos a los nodos RDF de solo objeto en la medida en que solo pueden representarse mediante inclusión dentro de los hipernodos. Pero los hipernodos CH no son (en sí mismos) únicos globalmente ni carecen de estructura interna. En esencia, una semántica RDF basada en la unicidad garantizada para primitivas similares a átomos es reemplazada por una semántica basada en bloques de construcción estructurados sin una unicidad garantizada. Esta alternativa puede considerarse en el contexto de razonadores generales o especiales: dado que los razonadores generales potencialmente toman toda la Web Semántica como su dominio, la singularidad global es una propiedad más deseada que la estructura interna. Sin embargo, dado que los razonadores especiales solo se ejecutan en datos especialmente seleccionados, la singularidad global es menos importante que la asignación eficiente a representaciones específicas de dominio. No es computacionalmente óptimo deserializar datos ejecutando consultas SPARQL.

Finalmente, como último punto de la comparación entre la semántica RDF y CH, vale la pena considerar la distinción entre» conocimiento declarativo «y» conocimiento procedimental » (véase, por ejemplo, ). De acuerdo con esta distinción, los datos canónicos de RDF ejemplifican el conocimiento declarativo porque afirman hechos aparentes sin tratar explícitamente de interpretarlos o procesarlos. El conocimiento declarativo circula entre el software en formatos de datos canónicos y reutilizables, lo que permite que los componentes individuales utilicen o hagan inferencias de los datos de acuerdo con sus propios fines.

En contra de este paradigma, vuelva a ejemplos hipotéticos ciberfísicos, como la conversión de datos de voltaje en datos de aceleración, que es un requisito previo para que las lecturas de los acelerómetros sean útiles en la mayoría de los contextos. Por lo tanto, el software que posee capacidades para procesar acelerómetros revela lo que se puede llamar conocimiento de procedimientos, porque el software así caracterizado no solo recibe datos, sino que también los procesa de manera estandarizada.

La distinción declarativa / procedimental quizás no logra captar cómo las transformaciones procedimentales pueden entenderse como intrínsecas a algunos dominios semánticos, de modo que incluso la información que percibimos como «declarativa» tiene un elemento procedimental. Por ejemplo, el hecho de que los » acelerómetros «no se llamen» Voltímetros » (que son otra cosa) sugiere cómo la comunidad informática Ubicua percibe los cálculos de voltaje a aceleración como intrínsecos a los datos de los acelerómetros. Pero estrictamente hablando, los componentes que participan en las redes USH no solo participan en el intercambio de datos; son partes funcionales de la red porque pueden realizar varios cálculos ampliamente reconocidos que se entienden como centrales para el dominio relevante, en otras palabras, tienen (y comparten con sus pares) cierto «conocimiento de procedimientos».»

RDF está estructurado como si el intercambio de datos estáticos fuera el único árbitro de las interacciones semánticamente informadas entre diferentes componentes, que pueden tener una variedad de diseños y razones, es decir, una Web Semántica. Pero una explicación exhaustiva de la semántica formal de la comunicación tiene que tener en cuenta cómo los modelos semánticos están informados por la suposición implícita, a veces inconsciente, de que los productores y / o consumidores de datos tendrán ciertas capacidades operativas: los procesos dinámicos previstos como parte del intercambio de datos son difíciles de separar conceptualmente de los datos estáticos que se transfieren literalmente. Para continuar con el ejemplo del acelerómetro, los diseñadores pueden pensar en tales instrumentos como» medir la aceleración», aunque físicamente esto no es estrictamente cierto; su salida debe ser transformada matemáticamente para que se interprete en estos términos. Ya sea que se representen a través de gráficos RDF o Hipergrafías Dirigidas, la semántica de los datos compartidos está incompleta a menos que las operaciones que pueden acompañar el envío y la recepción de datos se reconozcan como precondiciones para una alineación semántica legítima.

Mientras que las ontologías son valiosas para coordinar e integrar modelos semánticos dispares, la Web semántica quizás ha influenciado a los ingenieros a concebir el intercambio de datos semánticamente informado como una cuestión de presentación de datos estáticos conformes a Ontologías publicadas (es decir, alineación de «conocimiento declarativo»). En realidad, el intercambio sólido de datos también necesita una «alineación de conocimientos procedimentales»: en una Red semántica ideal, las capacidades procedimentales se delimitan entre los componentes, promoviendo un «conocimiento procedimental colectivo» emergente impulsado por la transparencia sobre el código y las bibliotecas, así como sobre los datos y formatos. El modelo CH podría decirse que apoya esta posibilidad porque hace que las afirmaciones de tipo sean fundamentales para la semántica. La tipificación rigurosa sienta las bases para la alineación de los procedimientos y exige que las capacidades de los procedimientos se tengan en cuenta en las evaluaciones de los componentes de la red, porque una atribución de tipos no tiene sentido sin bibliotecas y código adecuados para construir e interpretar valores específicos de tipos.

A pesar de sus diferencias, la Web Semántica, por un lado, y los marcos basados en hipergrafía, por el otro, pertenecen al espacio general de los modelos semánticos orientados a gráficos. Los hipergrafos se pueden emular en RDF, y los gráficos RDF se pueden mapear orgánicamente a una representación de Hipergrafos (en la medida en que los Hipergrafos Dirigidos con anotaciones son un superespacio apropiado de Gráficos Etiquetados Dirigidos). Las ontologías de la Web Semántica para el código fuente de la computadora también se pueden modelar mediante DHs con un tipo adecuado, incluso mientras también podemos formular Ontologías de Código Fuente basadas en Hipergrafía. Por lo tanto, estamos justificados en asumir que existe una ontología suficiente para la mayoría o todos los lenguajes de programación. Esto significa que, para cualquier procedimiento dado, podemos suponer que hay una representación de DH correspondiente que encarna la implementación de ese procedimiento.

Los procedimientos, por supuesto, dependen de entradas que se fijan para cada llamada, y producen «salidas» una vez que terminan. En el contexto de una representación gráfica, esto implica que algunos hipernodos representan y / o expresan valores que son entradas, mientras que otros representan y / o expresan sus salidas. Estos hipernodos son abstractos en el sentido (como en el Cálculo Lambda) de que no tienen un valor asignado específico dentro del cuerpo, como estructura formal. En su lugar, una manifestación en tiempo de ejecución de un DH (o, de manera equivalente, un CH, una vez que se introducen los tipos canalizados) rellena los hipernodos abstractos con valores concretos, lo que a su vez permite evaluar las expresiones descritas por el CH.

Estos puntos sugieren una estrategia para unificar cálculos Lambda con Ontologías de Código Fuente. La construcción esencial en los cálculos λ es que las fórmulas matemáticas incluyen «símbolos libres» que se abstraen: sitios donde una fórmula puede dar lugar a un valor concreto, suministrando valores a incógnitas; o dar lugar a nuevas fórmulas, a través de expresiones anidadas. Análogamente, los nodos en una representación de código fuente basada en gráficos se abstraen efectivamente de λ si modelan los parámetros de entrada, a los que se les dan valores concretos cuando se ejecuta el procedimiento. La conexión de la salida de un procedimiento a la entrada de otro, que se puede modelar como una operación gráfica, vinculando dos nodos, es entonces un análogo basado en gráficos para incrustar una expresión compleja en una fórmula (a través de un símbolo libre en esta última).

Llevando esta analogía más allá, mencioné anteriormente diferentes extensiones de cálculo λ inspiradas en características del lenguaje de programación, como la orientación de objetos, las excepciones y las capturas por referencia o por valor. Estos, también, se pueden incorporar a una Ontología de Código Fuente: por ejemplo, la conexión entre un nodo que contiene un valor pasado a un nodo de parámetro de entrada, en una firma de procedimiento, es semánticamente distinta de los nodos que contienen » Objetos «que son remitentes y receptores de» mensajes», en lenguaje Orientado a objetos. Los protocolos de entrada/salida de variantes, incluidos objetos, capturas y excepciones, son sin duda construcciones semánticas (en el dominio de código informático) que las Ontologías de código Fuente deberían reconocer. Así que podemos ver una convergencia en el modelado de múltiples protocolos de entrada/salida a través del Cálculo λ y a través de Ontologías de Código Fuente. Ahora discutiré una expansión correspondiente en el reino de la Teoría de Tipos aplicada, con el objetivo de finalmente plegar la teoría de tipos en esta convergencia también.

Deja una respuesta

Tu dirección de correo electrónico no será publicada.