Deklarativ Kunnskap

3.3.3 Kanaliserte hypergrafer og RDF

Ressursbeskrivelsesrammen (Rdf) modellerer informasjon via rettede grafer (Refs. Er gode diskusjoner Av Semantiske Webteknologier fra et grafteoretisk perspektiv), hvis kanter er merket med begreper som i velstrukturerte sammenhenger er hentet fra publiserte Ontologier(disse etikettene spiller en lignende rolle som «klassifikatorer» i CHs). I prinsippet er alle data uttrykt via RDF-grafer definert av uordnede sett med merkede kanter, også kalt «tripler» («〈Emne, Predikat, Objekt〉», hvor «Predikatet» er etiketten). I praksis behandler imidlertid HØYERE NIVÅ RDF-notasjoner som TTL (Turtle eller «Terse Rdf Triple Language») og Notation3 (N3) aggregerte grupper av data, for EKSEMPEL rdf-beholdere og samlinger.

forestill deg for eksempel en representasjon av det faktum At «(a / personen ved navn) Nathaniel, 46, har bodd I Brooklyn, Buffalo og Montreal» (vist I Fig. 3.2 SOM BÅDE EN CH og I RDF). Hvis Vi vurderer Skilpadde Eller N3 som språk og ikke bare notater, ser det ut som om deres semantikk er bygget rundt hyperedges i stedet for tripler. Det ser ut til at disse språkene koder for mange til mange eller en til mange påstander, grafert som kanter som har mer enn ett emne og/eller predikat. Faktisk Foreslår Tim Berners-Lee selv at «Implementeringer kan behandle list som en datatype i stedet for bare en stige av rdf:first og rdf: rest-egenskaper». Det vil si at spesifikasjonen for rdf listetype datastrukturer inviterer oss til å vurdere at de kan betraktes som integrerte enheter i stedet for bare aggregater som blir trukket fra hverandre i semantisk tolkning.

Fig. 3.2. CH versus RDF samlinger.

Teknisk Sett er dette Kanskje en illusjon. TIL tross for deres uttrykksevne på høyere nivå, ER RDF-uttrykksspråk kanskje ment å bli ansett som «syntaktisk sukker» for en mer primitiv liste over tripler: Semantikken Til Turtle Og N3 er tenkt å bli definert ved å oversette uttrykk ned til de tredoble settene som de logisk antyder (se også ). Denne intensjonen aksepterer paradigmet som gir semantikk for et formelt språk er nært knyttet til å definere hvilke proposisjoner er logisk innebar av sine uttalelser.

det er imidlertid en divergerende tradisjon i formell semantikk som er orientert for å skrive teori mer enn logikk. Det er i samsvar med denne alternative tilnærmingen å se en annen semantikk for et språk som Skilpadde, hvor større aggregater blir «førsteklasses» verdier. Så, 〈⌈Nathaniel⌉, ⌈46⌉〉 kan bli sett på som en (enkelt, integrert) verdi som type er en 〈navn, alder〉 par. En slik verdi har en «intern struktur» som utgjør flere datapunkter. RDF-versjonen er organisert, i stedet, rundt en tom node som knytter sammen ulike datapunkter, for eksempel mitt navn og min alder. Denne tomme noden er ogsa koblet til en annen tom node som knytter sammen sted og fest. De tomme nodene spiller en organisatorisk rolle, siden noder er gruppert sammen i den grad de kobler til samme tomme node. Men den underforståtte organisasjonen er mindre strengt medført; man kan anta At de 〈 ⌈ brooklyn⌉, ⌈Demokrat Noder like lett kan festes individuelt til «navn/alder» blank (dvs.jeg bor I brooklyn, Og jeg stemmer demokratisk).

Hvorfor Er Brooklyn og Democratic gruppert sammen? Hvilket konsept gjør denne fusjonsmodellen? Det er en presumptiv begrunnelse for navn / alder blank (dvs. det kan tenkes at det er flere 46-åringer som heter Nathaniel, slik at blank node spiller en viktig semantisk rolle( analogt med kvantifiseringen i » Det er En Nathaniel, alder 46…»); det gir en entydig nexus slik at ytterligere predikater kan knyttes til en bestemt 46-årig Nathaniel i stedet for noen gamle 〈 ⌈ nathaniel⌉, ⌈46⌉ 〉. Men det er ingen tilsvarende foreslått semantisk rolle for» sted/fest » gruppering. Navnet kan ikke logisk bli plaget bortsett fra name / age blank (fordi det er Flere Nathaniels), men det synes ikke å være noen logisk betydning for sted / festgruppering. Likevel kan paring av disse verdiene motiveres av en modelleringskonvensjon-som gjenspeiler at geografiske data og partitilhørighetsdata grupperes sammen i et datasett eller datamodell. DEN logiske semantikken til RDF gjør det vanskeligere å uttrykke slike modelleringsforutsetninger som er drevet av konvensjon mer enn logikk – en abstrahering fra datas modelleringsmiljø som kan være ønskelig i noen sammenhenger, men ikke i andre.

Så hvorfor insisterer Det Semantiske nettsamfunnet effektivt på en semantisk tolkning Av Turtle Og N3 som bare en notasjonell bekvemmelighet For N-Tripler i stedet for som høyere nivå språk med en annen semantikk på høyere nivå-og til tross for uttalelser som Tidligere Tim Berners—Lee sitat insinuerer at en alternativ tolkning har blitt overveid selv av de som ligger i Hjertet Av Semantiske webspesifikasjoner? Videre har definering av hierarkier av materiell sammensetning eller strukturell organisasjon-og så i forlengelse, potensielt forskjellige skalaer av modelleringsoppløsning-blitt identifisert som en iboende del av domenespesifikk Ontologidesign (Se Refs. Eller Ref. ). Semantisk web talsmenn har imidlertid ikke fremmet multitier struktur som et trekk Ved Semantiske modeller fundamentalt, i motsetning til kriteriologi innenfor spesifikke Ontologier. I den grad dette har en forklaring, har det sannsynligvis noe å gjøre med resonnementsmotorer: verktøyene som evaluerer SPARQL spørringer operere på en triplestore basis. Så den» reduktive » semantiske tolkningen er uten tvil berettiget via en garanti for at de endelige kriteriene for Semantiske webrepresentasjoner ikke er deres konseptuelle eleganse i forhold til menneskelige vurderinger, men deres nytte i kryss-ontologi og kryss-kontekst-slutninger.

som et motargument, vær imidlertid oppmerksom på at mange slutningsmotorer i Begrensningsløsning, Datasyn og så videre, stole på spesialiserte algoritmer og ikke kan reduseres til et kanonisk spørringsformat. Biblioteker som GeCODE OG ITK er viktig fordi problemløsning i mange domener krever finjustert programnivå engineering. Vi kan tenke på disse bibliotekene som støtter spesielle eller domenespesifikke resonnementsmotorer, ofte bygget for bestemte prosjekter, mens OWL-baserte reasoners som Fact++ er generelle motorer som arbeider med GENERELL RDF-data uten ytterligere kvalifisering. For å kunne bruke «spesielle» reasoners TIL RDF, må en kontingent av noder velges som er i samsvar med reasoners kjøretidskrav.

selvfølgelig kan spesielle resonnenter ikke forventes å kjøre på domenet til Hele Semantisk Web, eller til og med på» veldig store » datasett generelt. En typisk analyse vil dele opp problemet i mindre deler som hver kan tilpasses til tilpassede reasoners – i radiologi kan en diagnose fortsette ved først å velge en medisinsk bildeserie og deretter utføre bilde-for-bilde segmentering. Anvendt PÅ RDF, kan denne to-trinns prosessen betraktes som en kombinasjon av generelle og spesielle grunner: ET generelt språk som SPARQL filtrerer mange noder ned til et mindre delsett, som deretter tilordnes/deserialiseres til domenespesifikke representasjoner (inkludert runtime memory). FOR EKSEMPEL kan RDF koble en pasient til en diagnostisk test, bestilt på en bestemt dato av en bestemt lege, hvis resultater kan oppnås som en pakke med bilder-og dermed velge den aktuelle serien som er relevant for en diagnostisk oppgave. Generelle reasoners kan finne bildene av interesse og deretter sende dem til spesielle reasoners (for eksempel segmenteringsalgoritmer) for å analysere. I den grad denne arkitekturen er i kraft, Er Semantiske Webdata et nettsted for mange typer resonnementsmotorer. Noen av disse motorene må operere ved å transformere RDF-data og ressurser til en optimalisert, intern representasjon. Videre vil semantikken til disse representasjonene typisk være nærmere en n3-semantikk på Høyt Nivå tatt som sui generis, i stedet for å tolkes reduktivt som en notasjonell bekvemmelighet for formater på lavere nivå som N-Triple. Dette ser ut til å undergrave begrunnelsen for reduktiv semantikk i FORM AV UGLE reasoners.

Kanskje det mest nøyaktige paradigmet er At Semantiske Webdata har to forskjellige tolkninger, forskjellig i å være i samsvar med henholdsvis spesiell og generell semantikk. Det er fornuftig å merke disse henholdsvis» spesiell semantisk tolkning «eller» semantisk tolkning for spesielle formål «(SSI, kanskje) og» generell semantisk tolkning » (GSI). Begge disse tolkingene bør anses å ha en rolle i» semantikken » Av Semantisk Web.

En annen rekkefølge av hensyn involverer semantikken TIL RDF noder og CH hypernoder spesielt med hensyn til unikhet. Noder i RDF faller inn i tre klasser: tomme noder; noder med verdier fra et lite sett av grunnleggende typer som strenger og heltall; og noder med Nettadresser som forstås å være unike over Hele World Wide Web. DET er ingen tomme noder I CH, og egentlig ingen Nettadresser heller, selv om man sikkert kan definere EN URL-type. Det er ingenting i Semantikk Av Nettadresser som garanterer at hver URL betegner en distinkt internett ressurs; dette er bare en konvensjon som i hovedsak oppfyller seg de facto fordi den strukturerer et nett av kommersiell og juridisk praksis, ikke bare digitale; for eksempel er eierskap unikt gitt for hvert internett-domenenavn. I CH kan en datatype være strukturert for å gjenspeile institusjonelle praksiser som garanterer unikhet av verdier i noen sammenheng: bøker har unike ISBN-koder; steder har forskjellige GIS-steder, etc. Disse unike kravene er imidlertid ikke en del AV CH, og må uttrykkes med ytterligere aksiomer. GENERELT ER EN ch hypernode en tuple av relativt enkle verdier, og enhver ytterligere semantikk bestemmes av typedefinisjoner (DET kan være nyttig å se CH hypernoder som omtrent analog Med c structs—som ikke har noen a priori unikhetsmekanisme).

OGSÅ, rdf typer er mindre iboende TIL RDF semantikk enn I CH . De grunnleggende elementene I CH er verdi-tupler (via noder som uttrykker verdier, hvis tupler i sin tur er hypernoder). Tupler er indeksert etter posisjon, ikke av etiketter: den tuple 〈 ⌈ nathaniel, ⌈46 ⌉ 〉 trekker ikke i seg selv inn etikettene «navn» eller «alder», som i stedet er definert på typenivå (i den grad typedefinisjoner kan fastsette at etiketten «alder» er et alias for noden i sin andre posisjon, etc.). Så det er ingen måte å fastslå den semantiske/konseptuelle hensikten med hypernoder uten å vurdere både hyponode og hypernode typer. Omvendt har RDF ikke faktiske tuples (selv om disse kan representeres som samlinger, hvis ønskelig); og noder er alltid koblet til andre noder via merkede kontakter-det er ingen direkte ekvivalent MED CH-modelleringsenheten til en hyponode som blir inkludert i en hypernode etter posisjon.

i kjernen er RDF semantikk bygget på forslaget om at mange noder kan deklareres globalt unike av fiat. DETTE trenger ikke å være sant for alle noder—RDF-typer som heltall og flyter er mer eteriske; tallet 46 i en graf er uutslettelig fra 46 i en annen graf. Dette kan formaliseres ved å si at noen noder kan være objekter, men aldri fag. Hvis slike restriksjoner ikke ble håndhevet, KUNNE RDF-grafer på en eller annen måte bli overdefinerte, noe som innebærer forhold i kraft av kvantitative størrelser uten semantisk innhold. Dette ville åpne døren for bisarre dommer som «min alder er ikke-prime «eller» jeg er eldre enn Mohamed Salahs 2018 mål totalt.»En måte å blokkere disse avledningene på er å forhindre noder som «tallet 46» fra å være fag og objekter. Men noder som ikke er primitive verdier—de, sier å utpeke Mohamed Salah selv i stedet for hans måltall-er med rette globalt unike, siden vi har overbevisende grunner til å vedta en modell der det er akkurat En ting Som Er Mohamed Salah. SÅ RDF semantikk i utgangspunktet gifter seg med noen primitive typer som er objekter, men aldri fag med et nett av globalt unike, men internt ustrukturerte verdier som kan være enten emne eller objekt.

I CH er de «primitive» typene effektivt hypotyper; hyponoder er (i det minste indirekte) analoge med objekt-bare RDF noder i den grad de bare kan representeres via inkludering i hypernoder. Men CH hypernodes er verken (i seg selv) globalt unike eller mangler i intern struktur. I hovedsak er EN RDF semantikk basert på garantert unikhet for atomlignende primitiver erstattet av en semantikk basert på strukturerte byggeklosser uten garantert unikhet. Dette alternativet kan vurderes i sammenheng med generelle versus spesielle reasoners: siden generelle reasoners potensielt tar Hele Semantisk Web som sitt domene, er global unikhet en mer ønsket egenskap enn intern struktur. Men siden spesielle resonnenter bare kjører på spesielt utvalgte data, er global unikhet mindre viktig enn effektiv kartlegging til domenespesifikke representasjoner. Det er ikke beregningsmessig optimalt å deserialisere data ved å kjøre SPARQL-spørringer.

Endelig, som et siste punkt i sammenligningen MELLOM rdf og CH semantikk, er det verdt å vurdere skillet mellom «deklarativ kunnskap» og «prosessuell kunnskap» (se f. eks.). Ifølge dette skillet eksemplifiserer kanoniske RDF-data deklarativ kunnskap fordi de hevder tilsynelatende fakta uten eksplisitt å forsøke å tolke eller behandle dem. Deklarativ kunnskap sirkulerer mellom programvare i kanoniske, gjenbrukbare dataformater, slik at individuelle komponenter kan bruke eller gjøre slutninger fra data i henhold til egne formål.

Gå tilbake til hypotetiske Cyber-Fysiske eksempler, for eksempel konvertering av spenningsdata til akselerasjonsdata, noe som er en forutsetning for at akselerometers avlesninger er nyttige i de fleste sammenhenger. Programvare som har evner til å behandle akselerometre, avslører derfor hva som kan kalles prosessuell kunnskap, fordi programvare som karakteriseres ikke bare mottar data, men også behandler slike data på standardiserte måter.

den deklarative/prosessuelle forskjellen klarer kanskje ikke å fange opp hvordan prosessuelle transformasjoner kan forstås som iboende for noen semantiske domener – slik at selv informasjonen vi oppfatter som «deklarativ» har et prosessuelt element. For eksempel, det faktum at «akselerometre» ikke kalles «Voltmetre» (som er noe annet) antyder hvordan Allestedsnærværende Databehandling samfunnet oppfatter spenning-til-akselerasjon beregninger som iboende til akselerometre ‘ data. Men strengt tatt er komponentene som deltar I USH-nettverk ikke bare engasjert i datadeling; de fungerer deler av nettverket fordi de kan utføre flere anerkjente beregninger som forstås å være sentrale for det aktuelle domenet—med andre ord, de har (og deler med sine jevnaldrende) en viss «prosessuell kunnskap.»

RDF er strukturert som om statisk datadeling var den eneste arbiter av semantisk informerte interaksjoner mellom ulike komponenter, som kan ha en rekke design og rasjonaler—det vil si En Semantisk Web. Men en grundig redegjørelse for formell kommunikasjonssemantikk må regne med hvordan semantiske modeller blir informert av den implisitte, noen ganger ubevisste antagelsen om at produsenter og / eller forbrukere av data vil ha visse operasjonelle kapasiteter: de dynamiske prosessene som forventes som en del av deling av data, er vanskelig å skille konseptuelt fra de statiske dataene som bokstavelig talt overføres. For å fortsette akselerometer eksempel, kan designere tenke på slike instrumenter som «måle akselerasjon» selv om fysisk dette ikke er strengt sant; deres produksjon må matematisk transformeres for at den skal tolkes i disse vilkårene. Enten representert via RDF grafer eller Rettet Hypergraphs, semantikk av delte data er ufullstendig med mindre operasjoner som kan følge sending og mottak av data er anerkjent som forutsetninger for legitim semantisk justering.

mens ontologier er verdifulle for å koordinere og integrere ulike semantiske modeller, Har Semantisk Web kanskje påvirket ingeniører til å tenke på semantisk informert datadeling som for det meste et spørsmål om å presentere statiske data i samsvar med publiserte Ontologier (dvs.justering av «deklarativ kunnskap»). I virkeligheten trenger robust datadeling også en «justering av prosessuell kunnskap» : i et ideelt Semantisk Nettverk er prosessuelle evner sirklet mellom komponenter, og fremmer en fremvoksende «kollektiv prosessuell kunnskap» drevet av åpenhet om kode og biblioteker, samt om data og formater. CH-modellen støtter uten tvil denne muligheten fordi den gjør type påstander grunnleggende for semantikk. Rigorøs skriving legger både grunnlag for prosessuell justering og mandater at prosessuelle evner blir tatt med i vurderinger av nettverkskomponenter, fordi en typeattribusjon ikke har noen mening uten tilstrekkelige biblioteker og kode for å konstruere og tolke typespesifikke verdier.

Til tross for forskjellene tilhører Den Semantiske Weben på den ene side Og Hypergraph-baserte rammer på den annen side begge det generelle rommet til graforienterte semantiske modeller. Hypergraphs kan emuleres I RDF, OG RDF grafer kan organisk kartlagt Til En Hypergraph representasjon (i den grad Som Anvist Hypergraphs med merknader er en skikkelig superspace Av Rettet Merket Grafer). Semantiske Web-Ontologier for datakilde kode kan dermed modelleres av passende skrevet DHs også, selv om vi også kan formulere Hypergraphbaserte Kildekodeontologier også. Så, vi er berettiget til å anta at en tilstrekkelig ontologi eksisterer for de fleste eller alle programmeringsspråk. Dette betyr at for en gitt prosedyre kan vi anta at det er en tilsvarende DH-representasjon som legemliggjør prosedyrens implementering.

Prosedyrer avhenger selvfølgelig av innganger som er faste for hver samtale, og produserer» utganger » når de avsluttes. I sammenheng med en grafrepresentasjon innebærer dette at noen hypernoder representerer og / eller uttrykker verdier som er innganger, mens andre representerer og / eller uttrykker sine utganger. Disse hypernodene er abstrakte i den forstand (Som I Lambda-Kalkulus) at de ikke har en bestemt tildelt verdi i kroppen, qua formell struktur. I stedet fyller en runtime-manifestasjon av EN DH (eller tilsvarende EN CH, når kanaliserte typer er introdusert) de abstrakte hypernodene med konkrete verdier, som igjen gjør at uttrykk beskrevet av CH kan evalueres.

disse punktene foreslår en strategi for å forene Lambda calculi med Kildekode Ontologier. Den grunnleggende konstruksjonen i λ-calculi er at matematiske formler inkluderer «frie symboler» som er abstrahert: nettsteder der en formel kan gi opphav til en konkret verdi, ved å levere verdier til ukjente; eller gi opphav til nye formler, via nestede uttrykk. Analogt er noder i en grafbasert kildekoderepresentasjon effektivt λ-abstrahert hvis de modellerer inngangsparametere, som blir gitt konkrete verdier når prosedyren går. Koble utgangen av en prosedyre til inngangen til en annen—som kan modelleres som en grafoperasjon, koble to noder—er da en grafbasert analog for å legge inn et komplekst uttrykk i en formel (via et fritt symbol i sistnevnte).

Med denne analogien videre nevnte jeg tidligere forskjellige λ – Kalkulusutvidelser inspirert av programmeringsspråkfunksjoner som objektorientering, unntak og bi-referanse-eller by-verdi-fanger. Disse kan også bli inkorporert i En Kildekode Ontologi: for eksempel er forbindelsen mellom en node som holder en verdi overført til en inngangsparameter node, i en prosedyresignatur, semantisk forskjellig fra nodene som holder «Objekter» som er avsendere og mottakere for «meldinger», I Objektorientert språkbruk. Variant input / output protokoller, inkludert objekter, fanger, og unntak, er absolutt semantiske konstruksjoner (i datamaskin-kode domene) Som Kildekode Ontologier bør gjenkjenne. Så vi kan se en konvergens i modellering av mangfoldige input / output protokoller via λ-Kalkulus og Via Kildekode Ontologier. Jeg vil nå diskutere en tilsvarende utvidelse i riket av anvendt Type Teori, med det formål å til slutt brette type teori inn i denne konvergensen også.

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert.