Declarative Knowledge

3.3.3 Channelized hypergraphs and RDF

the Resource Description Framework (RDF) models information via directed graphs (Refs. são boas discussões de tecnologias Web semânticas a partir de uma perspectiva teórica de grafos), cujas bordas são rotuladas com conceitos que, em contextos bem estruturados, são desenhados a partir de ontologias publicadas (estas etiquetas desempenham um papel semelhante a “classificadores” em CHs). Em princípio, todos os dados expressos através de grafos RDF são definidos por conjuntos não ordenados de arestas rotuladas, também chamados de “triplos” (“Subject Subject, Predicate, Object〉,” where the “Predicate” is the label). Na prática, porém, as notações FTR de nível superior, tais como TTL (Turtle or “terse RDF Triple Language”) e Notation3 (N3), tratam de grupos agregados de dados, tais como contentores e coleções RDF.

por exemplo, imagine uma representação do fato “(a/a pessoa nomeada) Nathaniel, 46, viveu em Brooklyn, Buffalo e Montreal” (mostrado na Fig. 3.2 como CH e em RDF). Se considerarmos Turtle ou N3 como línguas e não apenas anotações, pareceria como se sua semântica fosse construída em torno de hiperedges ao invés de triplos. It would seem that these languages encode many-to-many or one-to-man assertions, graphed as edges having more than one subject and/or predicate. Na verdade, o próprio Tim Berners-Lee sugere que “implementações podem tratar a lista como um tipo de dados ao invés de apenas uma escada de rdf:first and rdf:rest properties” . Isto é, a especificação para estruturas de dados do tipo de lista RDF convida-nos a considerar que elas podem ser consideradas unidades integrais em vez de apenas agregados que são separados em interpretação semântica.

Fig. 3.2. Coleções de CH contra RDF.

tecnicamente, talvez, isto seja uma ilusão. Apesar de sua expressividade de alto nível, as linguagens de expressão RDF são, talvez, supostamente consideradas “açúcar sintático” para uma lista mais primitiva de triplos.: a semântica de Turtle e N3 é concebida para ser definida traduzindo expressões para os conjuntos triplos que logicamente implicam (veja também ). Esta intenção aceita o paradigma de que fornecer semântica para uma linguagem formal está intimamente relacionado com a definição de quais proposições são logicamente envolvidas por suas declarações.

há, no entanto, uma tradição divergente na semântica formal que é orientada para a teoria dos tipos mais do que a lógica. É consistente com esta abordagem alternativa para ver uma semântica diferente para uma linguagem como a tartaruga, onde agregados de maior escala se tornam valores de “primeira classe”. Assim, 〈⌈Nathaniel⌉, ⌈46⌉〉 pode ser visto como uma (única, integral) valor cujo tipo é um 〈nome, idade〉 par. Tal valor tem uma “estrutura interna” que contém vários pontos de dados. A versão RDF é organizada, em vez disso, em torno de um nó em branco que une pontos de dados díspares, como meu nome e minha idade. Este nó em branco também está conectado a outro nó em branco que une lugar e partido. Os nós em branco desempenham um papel organizacional, uma vez que os nós são agrupados em conjunto, na medida em que eles se conectam ao mesmo nó em branco. Mas a organização implícita é menos estritamente implicada; pode-se assumir que os nós Brooklyn Brooklyn Brooklyn, Democrat Democrata could poderia tão facilmente ser anexado individualmente ao “nome/idade” em branco (ou seja, eu vivo no Brooklyn, e eu voto democrático).Porque é que o Brooklyn e o Democratic estão agrupados? Que conceito faz este modelo de fusão? Há uma razão presumível para o nome / idade em branco (i.e. a fusão nome/idade, associando-os a um nó em branco ao invés de lhes permitir tomar as bordas de forma independente): teoricamente existem várias 46 anos de idade chamado Nathaniel, de modo que em branco nó desempenha um importante papel semântico (análogo para o quantificador em “Há uma Nathaniel, 46 anos de idade…”); fornece uma inequívoca do nexo de modo que mais predicados pode ser anexado a um específico de 46 anos Nathaniel, ao invés de incluir qualquer idade 〈⌈Nathaniel⌉, ⌈46⌉〉. Mas não há um papel semântico igualmente sugerido para o agrupamento” lugar/partido”. O nome não pode ser provocado logicamente além do nome/idade em branco (porque existem vários Nathaniels), mas parece não haver significado lógico para o agrupamento local / partido. No entanto, emparelhar esses valores pode ser motivado por uma convenção de modelagem—refletindo que os dados de afiliação geográfica e partidária são agrupados em um conjunto de dados ou modelo de dados. A semântica lógica do RDF torna mais difícil expressar esses tipos de pressupostos de modelagem que são impulsionados pela Convenção mais do que pela lógica—uma abstração do ambiente de modelagem de dados que pode ser desejável em alguns contextos, mas não em outros.

Então, por que a Web Semântica comunidade efetivamente insistir em uma interpretação semântica de Tartaruga e N3 apenas como uma conveniência de notação para N-Triples, ao invés de incluir como linguagens de alto nível com um diferente nível superior semântica—e, apesar de afirmações como a anterior, Tim Berners-Lee citação insinuando que uma interpretação alternativa tem sido contemplado, mesmo por aqueles no coração de Web Semântica especificações? Além disso, a definição de hierarquias de composição material ou organização estrutural—e assim por extensão, potencialmente, escalas distintas de resolução de modelagem—tem sido identificada como uma parte intrínseca do design ontológico específico de Domínio (Ver Refs. , ou árbitro. ). Os defensores da Web semântica não têm, no entanto, promovido a estrutura multitier como uma característica dos modelos semânticos fundamentalmente, ao contrário de critérios dentro de ontologias específicas. Na medida em que isto tem uma explicação, provavelmente tem algo a ver com motores de raciocínio: as ferramentas que avaliam as consultas SPARQL operam numa base triplestor. Assim, a interpretação semântica” redutiva ” é indiscutivelmente justificada através de um mandado de que os critérios definitivos para as representações Web semânticas não são a sua elegância conceitual em relação aos julgamentos humanos, mas a sua utilidade em ontologia cruzada e inferências de contexto.

como um contra-argumento, no entanto, note que muitos motores de inferência em resolução de restrições, visão de computador, e assim por diante, dependem de algoritmos especializados e não podem ser reduzidos a um formato de consulta canônica. Bibliotecas como GeCODE e ITK são importantes porque a resolução de problemas em muitos domínios exige uma engenharia de nível de aplicação bem afinada. Podemos pensar nestas bibliotecas como apoiando motores de raciocínio especiais ou específicos do domínio, muitas vezes construídos para projetos específicos, enquanto os reasoners baseados em coruja, como Fact++, são motores gerais que trabalham em dados RDF de propósito geral sem mais qualificação. Para aplicar reasonadores “Especiais” ao RDF, um contingente de nós deve ser selecionado que seja consistente com os requisitos de tempo de execução do reasoners.

é claro que não se pode esperar que os raciocínios especiais sejam executados no domínio de toda a Web semântica, ou mesmo em conjuntos de dados “muito grandes” em geral. Uma análise típica irá subdividir o seu problema em partes menores que são cada tractable para os reasonadores personalizados—em Radiologia, por exemplo, um diagnóstico pode proceder pela primeira seleção de uma série de imagens médicas e, em seguida, executar a segmentação imagem-a-imagem. Aplicado ao FTR, este processo em duas fases pode ser considerado uma combinação de motivos gerais e especiais: uma linguagem geral como o SPARQL filtra muitos nós para um subconjunto menor, que são então mapeados / deserializados para representações específicas de domínio (incluindo memória de tempo de execução). Por exemplo, o RDF pode ligar um paciente a um teste de diagnóstico, encomendado em uma determinada data por um determinado médico, cujos resultados podem ser obtidos como um conjunto de imagens—selecionando assim a série específica relevante para uma tarefa de diagnóstico. Os reasonadores gerais podem encontrar as imagens de interesse e, em seguida, passá-las para os reasonadores especiais (como algoritmos de segmentação) para analisar. Na medida em que esta arquitetura está em vigor, os dados da Web Semântica são um site para muitos tipos de motores de raciocínio. Alguns destes motores precisam operar transformando dados e recursos RDF em uma representação interna otimizada. Além disso, a semântica dessas representações será tipicamente mais próxima a uma semântica de alto nível N3 tomada como sui generis, ao invés de interpretada redutivamente como uma conveniência notacional para formatos de baixo nível como N-Triple. Isto parece minar a justificação para a semântica redutiva em termos de racionadores de coruja.

Perhaps the most accurate paradigm is that Semantic Web data have two different interpretations, differing in being consistent with special and general semantics, respectively. Faz sentido rotulá-los de “interpretação semântica especial” ou “interpretação semântica para raciocínios de propósito especial” (SSI, talvez) e “interpretação semântica geral” (GSI), respectivamente. Ambas as interpretações devem ser consideradas como tendo um papel na “semântica” da Web Semântica.

outra ordem de considerações envolve a semântica de nós RDF e hipernodos de CH particularmente no que diz respeito à singularidade. Nós em RDF caem em três classes: nós em branco; nós com valores de um pequeno conjunto de tipos básicos como strings e inteiros; e nós com URLs que são entendidos como únicos em toda a World Wide Web. Não existem nós em branco em CH, e intrinsecamente também não há URLs, embora se possa certamente definir um tipo de URL. Não há nada na semântica dos URLs que garanta que cada URL designe um recurso de internet distinto; esta é apenas uma convenção que essencialmente se cumpre de facto porque estrutura uma web de práticas comerciais e legais, não apenas as digitais; por exemplo, a propriedade é concedida exclusivamente para cada nome de domínio da internet. In CH, a data type may be structured to reflect institutional practices that guarantee the uniqueness of values in some context: books have unique ISBN codes; places have distinct Sig locations, etc. Estes requisitos de singularidade, no entanto, não são intrinsecamente parte de CH, e precisam ser expressos com axiomas adicionais. Em geral, um hipernodo de CH é uma tupla de valores relativamente simples e qualquer semântica adicional é determinada por definições de tipo (pode ser útil ver os hipernodos de CH como aproximadamente análogo a estruturas C—que não têm um mecanismo a priori unicidade).

também, os tipos FTR são menos intrínsecos à semântica FTR do que em CH . Os elementos fundamentais de CH são as tuplas de valor (via nós expressando valores, cujas tuplas por sua vez são hipernodos). Tuplas são indexadas por posição, não por etiquetas: a tuple 〈 ⌈Nathaniel,, 46 46 46 não desenha por si só nos rótulos ” nome “ou” idade”, que em vez disso são definidos ao nível do tipo (na medida em que as definições de tipo podem estipular que o rótulo” idade ” é um pseudônimo para o nó em sua segunda posição, etc.). Portanto, não há maneira de determinar a intenção semântica / conceitual de hipernodos sem considerar tanto os tipos hiponódicos e hipernódicos. Inversamente, RDF não tem tuplas reais (embora estas possam ser representadas como coleções, se desejado); e nós são sempre Unidos a outros nós através de conectores etiquetados-não há nenhum equivalente direto à unidade de modelagem de CH de um hyponode sendo incluído em um hypernode por posição.

em seu núcleo, então, a semântica RDF é construída sobre a proposição de que muitos nós podem ser declarados globalmente únicos pela fiat. Isto não precisa ser verdade para todos os tipos de nós—RDF como inteiros e flutuadores são mais etéreos; o número 46 em um grafo é indistinguível de 46 em outro grafo. Isto pode ser formalizado dizendo que alguns nós podem ser objetos, mas nunca sujeitos. Se tais restrições não fossem aplicadas, então grafos RDF poderiam tornar-se, em algum sentido, sobredeterminados, implicando relações em virtude de magnitudes quantitativas desprovidas de conteúdo semântico. Isso abriria a porta para julgamentos bizarros como “minha idade não é primo” ou “eu sou mais velho do que os totais de gols de Mohamed Salah em 2018. Uma maneira de bloquear essas inferências é evitar que nós como” o número 46 ” sejam sujeitos, bem como objetos. Mas nós que não são valores primitivos—uns, digamos, designando o próprio Mohamed Salah em vez de seus totais objetivos—são justificadamente globalmente únicos, uma vez que temos razões convincentes para adotar um modelo onde há exatamente uma coisa que é que Mohamed Salah. Então a semântica RDF basicamente casa com alguns tipos primitivos que são objetos, mas nunca sujeitos com uma rede de valores globalmente únicos, mas internamente não estruturados que podem ser sujeitos ou objetos.

em CH, os tipos “primitivos” são efetivamente hipotipos; hyponodes são (pelo menos indiretamente) análogos aos nós RDF somente para objetos, na medida em que eles só podem ser representados através da inclusão dentro de hipernodes. Mas os hipernodos de CH não são (em si) globalmente únicos nem carentes de estrutura interna. Em essência, uma semântica RDF baseada na singularidade garantida para primitivos semelhantes a átomos é substituída por uma semântica baseada em blocos estruturados sem singularidade garantida. Esta alternativa pode ser considerada no contexto de razões gerais versus especiais: uma vez que os raciocínios gerais potencialmente tomam toda a Web semântica como seu domínio, a singularidade global é uma propriedade mais desejada do que a estrutura interna. No entanto, uma vez que os reasonadores especiais só funcionam com dados especialmente selecionados, a singularidade global é menos importante do que o mapeamento eficiente para representações específicas de domínio. Não é computacionalmente ideal para deserializar dados executando consultas SPARQL.

Finalmente, como último ponto na comparação entre RDF e CH semântica, vale a pena considerar a distinção entre “conhecimento declarativo” e “conhecimento processual” (ver, por exemplo, ). De acordo com esta distinção, os dados FTR canônicos exemplificam o conhecimento declarativo porque eles afirmam fatos aparentes sem explicitamente tentar interpretá-los ou processá-los. O conhecimento declarativo circula entre software em formatos canônicos e reutilizáveis de dados, permitindo que componentes individuais utilizem ou façam inferências de dados de acordo com seus próprios propósitos.

contraria este paradigma, retornando a exemplos Cyber-físicos hipotéticos, como a conversão de dados de tensão para dados de aceleração, que é um pré-requisito para que leituras de acelerômetros sejam úteis na maioria dos contextos. Software possuindo capacidades para processar acelerômetros, portanto, revela o que pode ser chamado de conhecimento processual, porque software tão caracterizado não só recebe dados, mas também processa esses dados de forma padronizada.

a distinção declarativa/processual talvez não consiga captar como as transformações processuais podem ser entendidas como intrínsecas a alguns domínios semânticos-de modo que mesmo as informações que percebemos como “declarativas” têm um elemento processual. Por exemplo, o próprio fato de que “acelerômetros” não são chamados “Voltímetros” (que são outra coisa) sugere como a comunidade onipresente de computação percebe os cálculos de voltagem a aceleração como intrínsecos aos dados dos acelerômetros. Mas, estritamente falando, os componentes que participam de DESCARGA de redes não estão apenas envolvidos no compartilhamento de dados; eles estão funcionando partes da rede, pois eles podem executar várias amplamente reconhecido cálculos que entendem ser central para o domínio relevante—em outras palavras, eles têm (e compartilhar com seus pares) um certo “conhecimento processual.”

RDF é estruturado como se a partilha de dados estáticos fosse o único árbitro de interações semanticamente informadas entre diferentes componentes, que podem ter uma variedade de projetos e racionales—ou seja, uma Web Semântica. Mas um relato completo da semântica da comunicação formal tem de contar com a forma como os modelos semânticos são informados pelo pressuposto implícito, por vezes inconsciente, de que os produtores e / ou consumidores de dados terão certas capacidades operacionais.: os processos dinâmicos previstos como parte da partilha de dados são difíceis de separar conceptualmente dos dados estáticos que são literalmente transferidos. Para continuar o exemplo do acelerômetro, designers podem pensar em instrumentos como a” medição da aceleração ” mesmo que fisicamente isso não seja estritamente verdade; sua saída deve ser matematicamente transformada para que seja interpretada nestes Termos. Seja representada através de grafos RDF ou Hipergrafos direcionados, a semântica de dados compartilhados é incompleta, a menos que as operações que podem acompanhar o envio e recepção de dados sejam reconhecidas como pré-condições para o alinhamento semântico legítimo.Embora as ontologias sejam valiosas para coordenar e integrar modelos semânticos díspares, a Web Semântica talvez tenha influenciado os engenheiros a conceber o compartilhamento de dados semanticamente informados como uma questão de apresentar dados estáticos conformantes às ontologias publicadas (i.e., alinhamento do “conhecimento declarativo”). Na realidade, o compartilhamento robusto de dados também precisa de um “alinhamento do conhecimento processual”: em uma rede semântica ideal, as capacidades processuais são circuladas entre os componentes, promovendo um emergente” conhecimento processual coletivo ” impulsionado pela transparência sobre código e bibliotecas, bem como sobre dados e formatos. O modelo CH suporta esta possibilidade porque faz afirmações de tipo fundamentais para a semântica. Uma datilografia rigorosa tanto estabelece uma base para o alinhamento processual quanto exige que as capacidades processuais sejam tidas em conta nas avaliações dos componentes de rede, porque uma atribuição de tipo não tem significado sem bibliotecas adequadas e código para construir e interpretar valores específicos de tipo.

Apesar de suas diferenças, a Web Semântica, por um lado, e Hypergraph baseado em enquadramentos, e, de outro, ambos pertencem ao espaço total do gráfico orientado a modelos de semântica. Hypergraphs pode ser emulada em RDF e RDF gráficos podem ser organicamente mapeado para um Hypergraph representação (na medida em que Dirigiu Hypergraphs com as anotações são um bom superspace da Direcionado Rotulado Gráficos). Ontologias Web semânticas para código fonte de computador podem, portanto, ser modeladas por DHs devidamente tipados, bem como, mesmo enquanto nós também podemos formular ontologias de código fonte baseadas em Hipergrafos também. Então, nós somos justificados em assumir que uma ontologia suficiente existe para a maioria ou todas as linguagens de programação. Isto significa que, para um determinado procedimento, podemos partir do princípio de que existe uma representação DH correspondente que incorpora a implementação desse procedimento.

procedimentos, é claro, dependem de entradas que são fixas para cada chamada, e produzem “saídas” uma vez que terminam. No contexto de uma representação gráfica, isto implica que alguns hipernodos representam e/ou expressam valores que são entradas, enquanto outros representam e/ou expressam suas saídas. Estes hipernodos são abstratos no sentido (como no cálculo Lambda) de que eles não têm um valor atribuído específico dentro do corpo, a estrutura formal qua. Em vez disso, uma manifestação em tempo de execução de um DH (ou equivalentemente um CH, uma vez que tipos canalizados são introduzidos) popula os hipernodos abstratos com valores concretos, que por sua vez permite que expressões descritas pelo CH sejam avaliadas.

estes pontos sugerem uma estratégia para unificar o cálculo Lambda com ontologias de código fonte. A construção essencial no cálculo λ É que as fórmulas matemáticas incluem “símbolos livres” que são abstraídos: locais onde uma fórmula pode dar origem a um valor concreto, fornecendo valores a desconhecidos; ou dar origem a novas fórmulas, através de expressões aninhadas. Analogamente, nós em uma representação de código fonte baseado em grafos são efetivamente λ-abstrated se eles modelam parâmetros de entrada, que são dados valores concretos quando o procedimento é executado. Conectando a saída de um procedimento à entrada de outro—que pode ser modelado como uma operação de grafo, ligando dois nós—é então um analógico baseado em grafos para incorporar uma expressão complexa em uma fórmula (através de um símbolo livre no último).

levando esta analogia mais longe, eu mencionei anteriormente diferentes extensões λ-cálculo inspiradas por características da linguagem de programação, tais como orientação de objetos, exceções, e capturas por referência ou por valor. Estes, também, podem ser incorporados em uma ontologia de código fonte: por exemplo, a conexão entre um nó segurando um valor passado a um nó de parâmetro de entrada, em uma assinatura de procedimento, é semanticamente distinta dos nós segurando “objetos” que são remetentes e receptores para “mensagens”, em linguagem orientada a objetos. Protocolos de entrada/saída variante, incluindo objetos, capturas e exceções, são certamente construções semânticas (no domínio de código-computador) que ontologias de código fonte devem reconhecer. Então podemos ver uma convergência na modelagem de múltiplos protocolos de entrada/saída via cálculo λ e Via ontologias de código fonte. Vou agora discutir uma expansão correspondente no domínio da teoria dos tipos aplicada, com o objetivo de, em última análise, dobrar a teoria dos tipos para esta convergência também.

Deixe uma resposta

O seu endereço de email não será publicado.