declaratieve kennis

3.3.3 gekanaliseerde hypergraphs en RDF

the Resource Description Framework (RDF) modelleert informatie via gerichte grafieken (Refs. zijn goede discussies over semantische webtechnologieën vanuit een grafisch-theoretisch perspectief), waarvan de randen zijn gelabeld met concepten die, in goed gestructureerde contexten, zijn ontleend aan gepubliceerde ontologieën (deze labels spelen een soortgelijke rol als “classifiers” in CHs). In principe worden alle gegevens uitgedrukt via RDF-grafieken gedefinieerd door ongeordende sets van gelabelde randen, ook wel “triples” (“Subject Subject, predicaat, Object〉,” waar het “predicaat” het label is). In de praktijk behandelen hogere RDF-notaties zoals TTL (Turtle of “Terse RDF Triple Language”) en Notatie3 (N3) geaggregeerde groepen gegevens, zoals RDF-containers en-collecties.

bijvoorbeeld, stel je een representatie voor van het feit “(A/The person named) Nathaniel, 46, has lived in Brooklyn, Buffalo, and Montreal” (afgebeeld in Fig. 3.2 als zowel een CH als in RDF). Als we schildpad of N3 beschouwen als Talen en niet alleen notaties, lijkt het alsof hun semantiek is gebouwd rond hyperedges in plaats van triples. Het lijkt erop dat deze talen veel-tot-veel of één-tot-veel beweringen coderen, weergegeven als randen met meer dan één onderwerp en/of predicaat. Inderdaad, Tim Berners-Lee zelf suggereert dat” implementaties lijst kunnen behandelen als een gegevenstype in plaats van alleen een ladder van RDF:first en RDF:rest eigenschappen”. Dat wil zeggen, de specificatie voor RDF lijst-Type datastructuren nodigt ons uit om te overwegen dat ze kunnen worden beschouwd als integrale eenheden in plaats van alleen aggregaten die uit elkaar worden getrokken in semantische interpretatie.

Fig. 3.2. Ch versus RDF collecties.

technisch gezien is dit misschien een illusie. Ondanks hun hogere expressiviteit, worden RDF-expressietalen misschien verondersteld als “syntactische suiker” te worden beschouwd voor een meer primitieve opsomming van triples: de semantiek van Turtle en N3 zijn ontworpen om te worden gedefinieerd door uitdrukkingen te vertalen naar de drievoudige verzamelingen die ze logisch impliceren (zie ook ). Deze intentie aanvaardt het paradigma dat het verschaffen van semantiek voor een formele taal nauw verbonden is met het definiëren van welke stellingen logisch verbonden zijn met haar uitspraken.

er is echter een afwijkende traditie in de formele semantiek die meer op de typetheorie dan op de logica is gericht. Het is consistent met deze alternatieve benadering om een andere semantiek te zien voor een taal als Turtle, waar grotere schaal aggregaten “eerste klasse” waarden worden. Dus, 〈⌈Nathaniel⌉, ⌈46⌉〉 kan worden gezien als een (single, integraal) waarde waarvan het type is een 〈naam, leeftijd〉 paar. Een dergelijke waarde heeft een” interne structuur ” die meerdere datapunten omvat. De RDF-versie is in plaats daarvan georganiseerd rond een leeg knooppunt dat ongelijksoortige gegevenspunten met elkaar verbindt, zoals mijn naam en mijn leeftijd. Deze lege knoop is ook verbonden met een andere lege knoop die plaats en partij met elkaar verbindt. De lege knooppunten spelen een organisatorische rol, omdat knooppunten gegroepeerd zijn voor zover ze met hetzelfde lege knooppunt verbonden zijn. Maar de impliciete organisatie is minder strikt betrokken; men zou kunnen aannemen dat de Brooklyn Brooklyn⌉, Democrat Democraat nodes nodes net zo gemakkelijk individueel worden gehecht aan de “naam/leeftijd” blanco (dat wil zeggen, Ik woon in Brooklyn, en ik stem democratisch).

Waarom zijn Brooklyn en Democratic gegroepeerd? Welk concept modelleert deze fusie? Er is een veronderstelde reden voor de naam / leeftijd blanco (d.w.z. denkbaar zijn er meerdere 46-jarigen met de naam Natanael, zodat de lege knoop een belangrijke semantische rol speelt (analoog aan de kwantificeerder in “Er is een Natanael, Leeftijd 46…”); Het biedt een eenduidige nexus zodat verdere predicaten kunnen worden gekoppeld aan één specifieke 46-jarige Natanael in plaats van elke oude Natanael, 46⌉ 〉. Maar er is geen soortgelijke voorgestelde semantische rol voor de” plaats/partij ” groep. De naam kan logischerwijs niet worden geplaagd los van de naam/leeftijd blanco (omdat er meerdere Nathanielen zijn), maar er lijkt geen logische betekenis te zijn voor de plaats/partijgroepering. Maar het koppelen van deze waarden kan worden gemotiveerd door een modelleringsconventie—die weerspiegelt dat geografische en partij affiliatiegegevens worden gegroepeerd in een dataset of datamodel. De logische semantiek van RDF maakt het moeilijker om dit soort modelleringsaannames uit te drukken die meer worden gedreven door conventie dan logica—een abstractie uit de modelleringsomgeving van data die in sommige contexten wenselijk kan zijn, maar niet in andere.Dus, waarom dringt de semantische web gemeenschap effectief aan op een semantische interpretatie van Turtle en N3 als gewoon een notatie gemak voor N-Triples in plaats van als hogere-level talen met een andere hogere-level semantiek—en ondanks verklaringen zoals de eerdere Tim Berners-Lee citaat insinueren dat een alternatieve interpretatie is overwogen, zelfs door degenen die de kern van semantische web SPECIFICATIES? Bovendien is het definiëren van hiërarchieën van materiaalsamenstelling of structurele organisatie—en dus bij uitbreiding, potentieel verschillende schalen van modelleringsresolutie-geïdentificeerd als een intrinsiek onderdeel van domeinspecifiek Ontologieontwerp (zie Refs. of Ref. ). De pleitbezorgers van het semantische Web hebben echter geen multitierstructuur als kenmerk van semantische modellen fundamenteel gepromoot, in tegenstelling tot criteriologie binnen specifieke ontologieën. In de mate dat dit een verklaring heeft, heeft het waarschijnlijk iets te maken met redeneermotoren: de tools die SPARQL queries evalueren werken op een triplestore basis. Dus de” reductieve ” semantische interpretatie is aantoonbaar gerechtvaardigd door een garantie dat de definitieve criteria voor semantische webvoorstellingen niet hun conceptuele elegantie ten opzichte van menselijke oordelen zijn, maar hun nut in cross-ontologie en cross-context gevolgtrekkingen.

als tegenargument, merk echter op dat veel inferentiemotoren in Constraint Solving, Computer Vision, enzovoort, afhankelijk zijn van gespecialiseerde algoritmen en niet kunnen worden gereduceerd tot een canonieke query-indeling. Bibliotheken zoals GeCODE en ITK zijn belangrijk omdat het oplossen van problemen in veel domeinen verfijnde applicatie-niveau engineering vereist. We kunnen deze bibliotheken zien als ondersteuning voor speciale of domeinspecifieke redeneermachines, vaak gebouwd voor specifieke projecten, terwijl OWL-gebaseerde redeneermachines zoals Fact++ algemene engines zijn die zonder verdere Kwalificatie aan algemene RDF-gegevens werken. Om “speciale” reasoners op RDF toe te passen, moet een contingent knooppunten worden geselecteerd die in overeenstemming is met de runtime-vereisten van reasoners.

natuurlijk kan van speciale reasoners niet worden verwacht dat ze draaien op het domein van het gehele semantische Web, of zelfs op “zeer grote” datasets in het algemeen. Een typische analyse zal zijn probleem onderverdelen in kleinere delen die elk tractable zijn om aangepaste reasoners-in radiologie, laten we zeggen, een diagnose kan doorgaan door eerst een medische beeldreeks te selecteren en vervolgens beeld-voor-beeld segmentatie uit te voeren. Toegepast op RDF, kan dit proces in twee stappen worden beschouwd als een combinatie van algemene en speciale reasoners: een algemene taal zoals SPARQL filtert veel knooppunten naar een kleinere subset, die vervolgens worden toegewezen/gedeserialiseerd naar domeinspecifieke representaties (inclusief runtime geheugen). RDF kan bijvoorbeeld een patiënt koppelen aan een diagnostische test, besteld op een bepaalde datum door een bepaalde arts, waarvan de resultaten kunnen worden verkregen als een reeks beelden—waarbij de specifieke reeks relevant is voor een diagnostische taak wordt geselecteerd. Algemene reasoners kunnen de beelden van belang te vinden en vervolgens doorgeven aan speciale reasoners (zoals segmentatie algoritmen) te analyseren. Voor zover deze architectuur in werking is, zijn semantische webdata een site voor vele soorten redeneermachines. Sommige van deze motoren moeten werken door RDF-gegevens en-bronnen te transformeren naar een geoptimaliseerde, interne weergave. Bovendien zal de semantiek van deze representaties meestal dichter bij een hoog niveau N3 semantiek genomen als sui generis, in plaats van zoals reductief geïnterpreteerd als een notatie gemak voor lagere niveau formaten zoals N-Triple. Dit lijkt de rechtvaardiging voor reductieve semantiek in termen van OWL reasoners te ondermijnen.

misschien wel het meest accurate paradigma is dat semantische webgegevens twee verschillende interpretaties hebben, die verschillen in overeenstemming met respectievelijk speciale en algemene semantiek. Het is zinvol om deze de “speciale semantische interpretatie” of “semantische interpretatie voor special-purpose reasoners” (SSI, misschien) en de “Algemene semantische interpretatie” (GSI), respectievelijk te noemen. Beide interpretaties zouden een rol moeten spelen in de” semantiek ” van het semantische Web.

een andere volgorde van overwegingen betreft de semantiek van RDF-knooppunten en CH-hypernoden, in het bijzonder met betrekking tot uniciteit. Knooppunten in RDF vallen in drie klassen: lege knooppunten; knooppunten met waarden uit een kleine set basistypen zoals tekenreeksen en gehele getallen; en knooppunten met URL ‘ s die worden beschouwd als uniek over het hele World Wide Web. Er zijn geen lege knooppunten in CH, en intrinsiek ook geen URL ‘ s, hoewel men zeker een URL type kan definiëren. Er is niets in de semantiek van URL ‘ s die garandeert dat elke URL wijst een aparte Internet resource; dit is slechts een conventie die in wezen zichzelf de facto vervult omdat het een web van commerciële en juridische praktijken structureert, niet alleen digitale; bijvoorbeeld, eigendom wordt op unieke wijze verleend voor elke internet domeinnaam. In CH kan een gegevenstype worden gestructureerd om institutionele praktijken te weerspiegelen die de uniciteit van waarden in een bepaalde context garanderen: boeken hebben unieke ISBN-codes; plaatsen hebben verschillende GIS-locaties, enz. Deze unieke vereisten maken echter niet intrinsiek deel uit van CH en moeten met aanvullende axioma ‘ s worden uitgedrukt. In het algemeen is een Ch—hypernode een tupel van relatief eenvoudige waarden en eventuele extra semantiek wordt bepaald door typedefinities (het kan nuttig zijn om Ch-hypernodes ruwweg analoog te zien aan C-structuren-die geen a priori uniciteit mechanisme hebben).

ook zijn RDF-types minder intrinsiek voor RDF-semantiek dan in CH . De fundamentele elementen van CH zijn value-tuples (via knooppunten die waarden uitdrukken, waarvan tuples op hun beurt hypernodes zijn). Tuples worden geïndexeerd op positie, niet op labels: de tupel-Natanael, 46 Draw tekent op zichzelf niet de labels “naam” of “leeftijd”, die in plaats daarvan zijn gedefinieerd op het type-niveau (voor zover type-definities kunnen bepalen dat het label “leeftijd” een alias is voor het knooppunt in zijn tweede positie, enz.). Er is dus geen manier om de semantische/conceptuele bedoeling van hypernodes vast te stellen zonder rekening te houden met zowel hyponode als hypernode types. Omgekeerd, RDF heeft geen werkelijke tupels (hoewel deze kunnen worden weergegeven als collecties, indien gewenst); en knooppunten worden altijd verbonden met andere knooppunten via gelabelde connectoren – er is geen direct equivalent aan de CH-modelleringseenheid van een hyponode die wordt opgenomen in een hypernode per positie.

in de kern zijn RDF-semantiek gebaseerd op de stelling dat veel knooppunten wereldwijd uniek kunnen worden verklaard door fiat. Dit hoeft niet waar te zijn voor alle knooppunten—RDF types zoals gehele getallen en floats zijn meer etherisch; het nummer 46 in een grafiek is niet te onderscheiden van 46 in een andere grafiek. Dit kan worden geformaliseerd door te zeggen dat sommige knooppunten objecten kunnen zijn, maar nooit subjecten. Als dergelijke beperkingen niet zouden worden gehandhaafd, dan zouden RDF-grafieken in zekere zin overbepaald kunnen worden, wat relaties impliceert op grond van kwantitatieve grootheden zonder semantische inhoud. Dit zou de deur openen naar bizarre oordelen zoals “mijn leeftijd is niet-prime” of “ik ben ouder dan Mohamed Salah’ s 2018 doeltotalen.”Een manier om deze gevolgtrekkingen te blokkeren is om te voorkomen dat knooppunten zoals” het nummer 46 ” worden onderwerpen en objecten. Maar knooppunten die geen primitieve waarden zijn—die bijvoorbeeld Mohamed Salah zelf aanwijzen in plaats van zijn doeltotalen—zijn terecht wereldwijd uniek, omdat we dwingende redenen hebben om een model aan te nemen waarin er precies één ding is, namelijk dat Mohamed Salah. Dus RDF-semantiek trouwt in principe enkele primitieve types die objecten zijn maar nooit subjecten met een web van wereldwijd unieke maar intern ongestructureerde waarden die ofwel subject of object kunnen zijn.

in CH zijn de “primitieve” typen effectief hypotypen; hyponodes zijn (op zijn minst indirect) analoog aan object-only RDF-knooppunten voor zover ze alleen kunnen worden weergegeven via opname in hypernodes. Maar CH hypernodes zijn noch (op zichzelf) wereldwijd uniek noch ontbreken in interne structuur. In essentie wordt een RDF-semantiek op basis van gegarandeerde uniciteit voor atoom-achtige primitieven vervangen door een semantiek op basis van gestructureerde bouwstenen zonder gegarandeerde uniciteit. Dit alternatief kan worden overwogen in de context van algemene versus speciale reasoners: aangezien algemene redeneerders potentieel het gehele semantische Web als hun domein nemen, is globale uniciteit een meer gewenste eigenschap dan interne structuur. Omdat speciale reasoners alleen op speciaal geselecteerde data draaien, is globale uniciteit echter minder belangrijk dan efficiënte mapping naar domeinspecifieke representaties. Het is niet computationeel optimaal om gegevens te deserialiseren door SPARQL-query ‘ s uit te voeren.

ten slotte is het als laatste punt in de vergelijking tussen RDF en CH-semantiek de moeite waard om het onderscheid tussen “declaratieve kennis” en “procedurele kennis” te overwegen (zie bijvoorbeeld ). Volgens dit onderscheid, canonieke RDF gegevens illustreren declaratieve kennis, omdat ze schijnbare feiten beweren zonder expliciet te proberen te interpreteren of te verwerken. Declaratieve kennis circuleert tussen software in canonieke, herbruikbare dataformaten, waardoor individuele componenten kunnen gebruiken of gevolgtrekkingen maken van gegevens volgens hun eigen doeleinden.

tegen dit paradigma in, ga terug naar hypothetische Cyber-fysische voorbeelden, zoals de conversie van spanningsgegevens naar versnellingsgegevens, wat een voorwaarde is om versnellingsmeters in de meeste contexten bruikbaar te maken. Software met capaciteiten om versnellingsmeters te verwerken onthult daarom wat procedurele kennis genoemd kan worden, omdat software die zo gekarakteriseerd niet alleen gegevens ontvangt, maar ook dergelijke gegevens op gestandaardiseerde manieren verwerkt.

het onderscheid tussen declaratief en procedureel geeft misschien niet aan hoe procedurele transformaties kunnen worden opgevat als intrinsiek aan sommige semantische domeinen—zodat zelfs de informatie die wij als “declaratief” beschouwen een procedureel element heeft. Bijvoorbeeld, het feit dat “accelerometers” niet “Voltmeters” worden genoemd (wat iets anders is) suggereert hoe de alomtegenwoordige Computergemeenschap voltage-to-acceleratieberekeningen ziet als intrinsiek aan de gegevens van accelerometers. Maar strikt genomen, de componenten die deelnemen aan USH-netwerken zijn niet alleen bezig met het delen van gegevens; ze zijn functionerende delen van het netwerk, omdat ze verschillende algemeen erkende berekeningen die worden beschouwd als centraal in het relevante domein kunnen uitvoeren—met andere woorden, ze hebben (en delen met hun collega ‘ s) een bepaalde “procedurele kennis.”

RDF is gestructureerd alsof het delen van statische gegevens de enige scheidsrechter was van semantisch geïnformeerde interacties tussen verschillende componenten, die een verscheidenheid aan ontwerpen en redenen kunnen hebben—dat wil zeggen een semantisch Web. Maar een grondige analyse van de formele communicatie semantiek moet rekening houden met de manier waarop semantische modellen worden geà nformeerd door de impliciete, soms onbewuste aanname dat producenten en / of gebruikers van gegevens bepaalde operationele capaciteiten zullen hebben: de dynamische processen die worden verwacht als onderdeel van het delen van gegevens zijn moeilijk conceptueel te scheiden van de statische gegevens die letterlijk worden overgedragen. Om het voorbeeld van de accelerometer voort te zetten, kunnen ontwerpers denken aan instrumenten als “het meten van versnelling”, hoewel dit fysiek niet strikt waar is; hun output moet wiskundig getransformeerd worden om het in deze termen te kunnen interpreteren. Of het nu gaat om RDF-grafieken of gerichte Hypergrafen, de semantiek van gedeelde gegevens is onvolledig, tenzij de bewerkingen die gepaard gaan met het verzenden en ontvangen van gegevens worden erkend als voorwaarden voor legitieme semantische uitlijning.Hoewel ontologieën waardevol zijn voor het coördineren en integreren van ongelijksoortige semantische modellen, heeft het semantische Web ingenieurs wellicht beïnvloed om semantisch geïnformeerde gegevensuitwisseling te beschouwen als een kwestie van het presenteren van statische gegevens conform gepubliceerde ontologieën (d.w.z. het uitlijnen van “declaratieve kennis”). In werkelijkheid vereist een robuuste uitwisseling van gegevens ook een “afstemming van procedurele kennis”: in een ideaal semantisch netwerk worden procedurele capaciteiten omcirkeld tussen componenten, waardoor een opkomende “collectieve procedurele kennis” wordt bevorderd die wordt aangedreven door transparantie over code en bibliotheken en over gegevens en formaten. Het CH-model ondersteunt deze mogelijkheid, omdat het type beweringen fundamenteel maakt voor de semantiek. Rigoureuze typering legt zowel een basis voor procedurele afstemming als verplicht dat procedurele capaciteiten in aanmerking worden genomen bij de beoordeling van netwerkcomponenten, omdat een typetoewijzing geen betekenis heeft zonder adequate bibliotheken en code om typespecifieke waarden te construeren en te interpreteren.

ondanks hun verschillen, het semantische Web, aan de ene kant, en Hypergraph-gebaseerde frameworks, aan de andere kant, beide behoren tot de totale ruimte van Graf-georiënteerde semantische modellen. Hypergraphs kunnen worden geëmuleerd in RDF, en RDF grafieken kunnen organisch worden toegewezen aan een Hypergraph representatie (voor zover gerichte Hypergraphs met annotaties zijn een goede superruimte van gerichte gelabelde grafieken). Semantische Webontologieën voor computer broncode kunnen dus ook gemodelleerd worden met DHS, zelfs terwijl we ook Hypergraph-gebaseerde broncode ontologieën kunnen formuleren. We mogen dus aannemen dat er voldoende ontologie bestaat voor de meeste of alle programmeertalen. Dit betekent dat we voor een bepaalde procedure kunnen aannemen dat er een overeenkomstige DH-vertegenwoordiging is die de uitvoering van die procedure belichaamt.

Procedures zijn natuurlijk afhankelijk van ingangen die voor elke oproep vast zijn, en produceren “uitgangen” zodra deze zijn beëindigd. In de context van een grafiekweergave betekent dit dat sommige hypernodes waarden vertegenwoordigen en/of uitdrukken die inputs zijn, terwijl andere de outputs vertegenwoordigen en/of uitdrukken. Deze hypernoden zijn abstract in de zin (zoals in de Lambda Calculus) dat ze geen specifieke toegewezen waarde hebben binnen het lichaam, qua formele structuur. In plaats daarvan vult een runtime-manifestatie van een DH (of gelijkwaardig Een CH, zodra gechanneliseerde types worden geïntroduceerd) de abstracte hypernodes met concrete waarden, die op zijn beurt uitdrukkingen die door de CH worden beschreven, kunnen evalueren.

deze punten suggereren een strategie om Lambdacalculi te verenigen met Broncodeontologieën. De essentiële construct in λ-calculi is dat wiskundige formules “vrije symbolen” bevatten die geabstraheerd zijn: sites waar een formule kan leiden tot een concrete waarde, door het leveren van waarden aan onbekenden; of aanleiding geven tot nieuwe formules, via geneste uitdrukkingen. Analoog, knooppunten in een grafiekgebaseerde broncode representatie zijn effectief λ-geabstraheerd als ze inputparameters modelleren, die concrete waarden krijgen wanneer de procedure wordt uitgevoerd. Het verbinden van de output van een procedure met de input van een andere—die kan worden gemodelleerd als een grafiek operatie, het koppelen van twee knooppunten—is dan een grafiek-gebaseerde analoog aan het inbedden van een complexe expressie in een formule (via een gratis symbool in de laatste).

om deze analogie verder uit te werken, noemde ik eerder verschillende λ-calculus extensies geïnspireerd door programmeertaal kenmerken zoals object-Oriëntatie, uitzonderingen, en by-reference of by-value captures. Deze kunnen ook worden opgenomen in een broncode ontologie: bijvoorbeeld, de verbinding tussen een knooppunt met een waarde doorgegeven aan een invoerparameter knooppunt, in een procedure handtekening, is semantisch onderscheiden van de knooppunten met “objecten” die afzenders en ontvangers zijn voor “berichten,” in Object-georiënteerde taal. Variant input / output protocollen, met inbegrip van objecten, captures, en uitzonderingen, zijn zeker semantische constructies (in het computer-Code Domein) die broncode ontologieën moeten herkennen. Dus we kunnen een convergentie zien in het modelleren van verschillende input/output protocollen via λ-Calculus en via broncode ontologieën. Ik zal nu een overeenkomstige uitbreiding in het domein van de toegepaste typetheorie bespreken, met als doel om uiteindelijk ook de typetheorie in deze convergentie te vouwen.

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.