deklaratív tudás

3.3.3 csatornázott hipergráfok és RDF

a Resource Description Framework (RDF) irányított grafikonokon (Refs) keresztül modellezi az információkat. a szemantikus webes technológiák jó megbeszélései gráfelméleti szempontból), amelyek éleit olyan fogalmak jelölik, amelyek jól strukturált kontextusokban közzétett Ontológiákból származnak (ezek a címkék hasonló szerepet játszanak, mint a CHs “osztályozói”). Elvileg az RDF grafikonokon keresztül kifejezett összes adatot címkézett élek rendezetlen halmazai határozzák meg, amelyeket “hármasoknak” is neveznek (“főcím, predikátum, objektum!”, ahol a “predikátum” a címke). A gyakorlatban azonban a magasabb szintű RDF jelölések, mint például a TTL (Turtle vagy “Terse RDF Triple Language”) és a Notation3 (N3) összesített adatcsoportokkal foglalkoznak, például RDF tárolókkal és gyűjteményekkel.

képzeljük el például azt a tényt, hogy “(a/A megnevezett személy) a 46 éves Nathaniel Brooklynban, Buffalóban és Montrealban élt” (az ábrán látható. 3.2 mind CH-ként, mind RDF-ben). Ha a Turtle-t vagy az N3-at nyelveknek tekintjük, és nem csak jelöléseket, akkor úgy tűnik, hogy szemantikájuk inkább a hiperélek, mint a hármasok köré épül. Úgy tűnik, hogy ezek a nyelvek sok a sokhoz vagy egy a sokhoz állításokat kódolnak, olyan élekként ábrázolva, amelyeknek egynél több alanyuk és/vagy predikátumuk van. Valójában Tim Berners-Lee maga is azt sugallja, hogy “a megvalósítások a list-et adattípusként kezelhetik, nem pedig csak az rdf:first és az rdf:rest tulajdonságok létrájaként” . Ez azt jelenti, hogy az RDF lista típusú adatstruktúrák specifikációja arra késztet bennünket, hogy fontolja meg, hogy ezek integrál egységnek tekinthetők, nem pedig csak aggregátumoknak, amelyek széthúzódnak a szemantikai értelmezésben.

Fig. 3.2. CH versus RDF gyűjtemények.

technikailag talán ez illúzió. Magasabb szintű kifejezőképességük ellenére az RDF expressziós nyelveket talán “szintaktikai cukornak” kell tekinteni a hármasok primitívebb felsorolásához: a Turtle és az N3 szemantikáját úgy képzelik el, hogy a kifejezéseket lefordítják a három halmazra, amelyeket logikusan sugallnak (Lásd még ). Ez a szándék elfogadja azt a paradigmát, miszerint a formális nyelv szemantikájának biztosítása szorosan összefügg annak meghatározásával, hogy mely állítások logikusan járnak az állításaival.

van azonban egy eltérő hagyomány a formális szemantikában, amely inkább a típuselméletre irányul, mint a logikára. Ezzel az alternatív megközelítéssel összhangban más szemantikát látunk egy olyan nyelv számára, mint a teknős, ahol a nagyobb léptékű aggregátumok “első osztályú” értékekké válnak. Szóval, 〈⌈Nathaniel⌉, ⌈46⌉〉 lehet tekinteni, mint egy (egyetlen, szerves) értékkel, amelynek típusa 〈név, életkor〉 pár. Egy ilyen értéknek van egy” belső szerkezete”, amely több adatpontot foglal magában. Az RDF verzió ehelyett egy üres csomópont köré szerveződik, amely különböző adatpontokat köt össze,például a nevem és a korom. Ez az üres csomópont egy másik üres csomóponthoz is kapcsolódik, amely összekapcsolja a helyet és a partit. Az üres csomópontok szervezeti szerepet játszanak, mivel a csomópontok csoportosítva vannak, amennyiben ugyanahhoz az üres csomóponthoz kapcsolódnak. De az implikált szervezet kevésbé szigorúan magában foglalja; feltételezhetjük, hogy a Brooklyn-i, a Demokrata -, a demokrata-csomópontokat ugyanolyan könnyen lehet külön-külön csatolni a “név/életkor” üres részhez (azaz Brooklynban élek, és demokratára szavazok).

miért van Brooklyn és a Demokrata csoportosulás? Milyen koncepció ez a fúziós modell? A név/életkor üres (pl., az összeolvadó név/életkor összekapcsolásával egy üres csomóponthoz, ahelyett, hogy lehetővé tenné számukra, hogy egymástól függetlenül éleket vegyenek): elképzelhető, hogy több Nathaniel nevű 46 éves van, így az üres csomópont kulcsfontosságú szemantikai szerepet játszik (analóg a “Van egy Nathaniel, 46 éves kor…”); egyértelmű összefüggést biztosít, így további predikátumok csatolhatók egy adott 46 éves Nathanielhez, nem pedig bármely régihöz. De a “hely/párt” csoportosulásnak nincs hasonlóan javasolt szemantikai szerepe. A nevet logikusan nem lehet ugratni a név / életkor üresen kívül (mert több Nathaniel van), de úgy tűnik, hogy nincs logikai jelentősége a hely/párt csoportosulásának. Ezen értékek párosítását azonban motiválhatja egy modellezési konvenció—tükrözve, hogy a földrajzi és párthovatartozási adatok egy adatkészletbe vagy adatmodellbe vannak csoportosítva. Az RDF logikai szemantikája megnehezíti az ilyen típusú modellezési feltételezések kifejezését, amelyeket inkább a konvenció vezérel, mint a logika—az adatok modellezési környezetéből való elvonatkoztatás, amely bizonyos kontextusokban kívánatos lehet, másokban azonban nem.

tehát miért ragaszkodik a szemantikus webes közösség a Turtle és az N3 szemantikai értelmezéséhez, mint csak az N-hármasok jelölési kényelméhez, ahelyett, hogy magasabb szintű nyelvekként más magasabb szintű szemantikával rendelkeznének-és az olyan állítások ellenére, mint a korábbi Tim Berners-Lee idézet, arra utalva, hogy egy alternatív értelmezést fontolgatnak még a szemantikus Web SPECIFIKÁCIÓK középpontjában állók is? Ezenkívül az anyagösszetétel vagy a strukturális szerveződés hierarchiáinak meghatározását-és így kiterjesztve, potenciálisan a modellezési felbontás különálló skáláit-a tartományspecifikus ontológia tervezésének belső részeként azonosították (lásd Refs. , vagy Ref. ). A szemantikus Web szószólói azonban alapvetően nem támogatták a multitier struktúrát, mint a szemantikai modellek jellemzőjét, szemben a meghatározott Ontológiákon belüli kritériumokkal. Olyan mértékben, hogy ennek magyarázata van, valószínűleg köze van az érvelő motorokhoz: a SPARQL lekérdezéseket értékelő eszközök triplestore alapon működnek. Tehát a” reduktív ” szemantikai értelmezés vitathatatlanul igazolható azzal a garanciával, hogy a szemantikus Web reprezentációk végleges kritériumai nem a fogalmi eleganciájuk az emberi ítéletekkel szemben, hanem a hasznosságuk a kereszt-ontológiában és a kereszt-kontextus következtetésekben.

ellenérvként azonban megjegyezzük, hogy a kényszermegoldás, a számítógépes látás stb.Számos következtetési motorja speciális algoritmusokra támaszkodik, és nem redukálható kanonikus lekérdezési formátumra. Az olyan könyvtárak, mint a GeCODE és az ITK azért fontosak, mert a problémamegoldás számos területen finomhangolt alkalmazásszintű tervezést igényel. Ezekre a könyvtárakra úgy gondolhatunk, mint amelyek speciális vagy domain-specifikus érvelő motorokat támogatnak, amelyeket gyakran konkrét projektekhez építenek, míg az OWL-alapú érvelők, mint a Fact++, általános motorok, amelyek általános célú RDF adatokon dolgoznak további minősítés nélkül. Annak érdekében, hogy “speciális” reasonereket alkalmazzunk az RDF-re, ki kell választani egy csomópont-kontingenst, amely összhangban van a reasoners futásidejű követelményeivel.

természetesen nem várható el, hogy a speciális érvelők a teljes szemantikus Web domainjén, vagy általában “nagyon nagy” adatkészleteken futjanak. Egy tipikus elemzés kisebb részekre osztja a problémáját, amelyek mindegyike kezelhető az egyéni érvelők számára—a radiológiában, mond, a diagnózis úgy folytatódhat, hogy először kiválaszt egy orvosi képsorozatot, majd képről képre szegmentálja. Az RDF-re alkalmazva ez a kétlépcsős folyamat általános és speciális okok kombinációjának tekinthető: egy olyan általános nyelv, mint a SPARQL, sok csomópontot szűr le egy kisebb részhalmazra, amelyeket aztán leképeznek/dezerializálnak a tartományspecifikus reprezentációkhoz (beleértve a futásidejű memóriát is). Például az RDF összekapcsolhatja a beteget egy adott időpontban egy adott orvos által megrendelt diagnosztikai teszttel, amelynek eredményeit képcsomagként lehet megszerezni—ezáltal kiválasztva a diagnosztikai feladat szempontjából releváns sorozatot. Az Általános érvelők megtalálhatják az érdeklődésre számot tartó képeket, majd átadhatják azokat speciális érvelőknek (például szegmentációs algoritmusoknak) elemzésre. Amennyiben ez az architektúra érvényben van, a szemantikus webes adatok sokféle érvelő motor webhelye. Ezen motorok némelyikének úgy kell működnie, hogy az RDF adatokat és erőforrásokat optimalizált, belső reprezentációvá alakítja. Sőt, ezeknek az ábrázolásoknak a szemantikája általában közelebb áll a magas szinthez N3 szemantika mint sui generis, nem pedig reduktívan értelmezve, mint az alacsonyabb szintű formátumok jelölési kényelme N-hármas. Úgy tűnik, hogy ez aláássa a reduktív szemantika igazolását az OWL reasoners szempontjából.

talán a legpontosabb paradigma az, hogy a szemantikus webes adatoknak két különböző értelmezése van, amelyek különböznek abban, hogy összhangban vannak a speciális, illetve az Általános szemantikával. Érdemes ezeket “speciális szemantikai értelmezésnek” vagy “szemantikai értelmezésnek a speciális célú okoskodók számára” (SSI, talán), illetve “általános szemantikai értelmezésnek” (GSI) címkézni. Mindkét értelmezést úgy kell tekinteni, hogy szerepet játszanak a szemantikai Web “szemantikájában”.

egy másik szempontrend az RDF csomópontok és a ch hipercsomópontok szemantikáját foglalja magában, különös tekintettel az egyediségre. Az RDF csomópontjai három osztályba sorolhatók: üres csomópontok; olyan csomópontok, amelyek kis alaptípusok, például stringek és egészek értékeit tartalmazzák; és olyan csomópontok, amelyek URL-jei egyedinek tekinthetők az egész világhálón. Nincsenek üres csomópontok a CH – ben, és lényegében nincsenek URL-ek sem, bár minden bizonnyal meg lehet határozni egy URL-típust. Az URL-ek szemantikájában semmi sem garantálja, hogy minden URL külön internetes erőforrást jelöl; ez csak egy olyan egyezmény, amely lényegében de facto teljesíti magát, mert a kereskedelmi és jogi gyakorlatok hálóját strukturálja, nem csak a digitálisakat; például a tulajdonjogot egyedileg biztosítják minden internetes domain névhez. A CH-ben egy adattípus strukturálható úgy, hogy tükrözze az intézményi gyakorlatokat, amelyek bizonyos összefüggésekben garantálják az értékek egyediségét: a könyvek egyedi ISBN-kódokkal rendelkeznek; a helyeknek különálló GIS-helyeik vannak stb. Ezek az egyediségi követelmények azonban nem tartoznak a CH-hez, ezért további axiómákkal kell kifejezni őket. Általában a ch hipernód viszonylag egyszerű értékek halmaza, és minden további szemantikát típusdefiníciók határoznak meg (hasznos lehet A CH hipernódokat nagyjából analógnak tekinteni a C struktúrákkal—amelyeknek nincs a priori egyediség mechanizmusa).

továbbá az RDF típusok kevésbé lényegesek az RDF szemantikában, mint a CH-ben . A ch alapelemei érték-tuples (értékeket kifejező csomópontokon keresztül, amelyek halmazai viszont hipercsomók). A sorokat pozíció szerint indexelik, nem címkék szerint: a leírónak 〈⌈Nathaniel⌉, ⌈46⌉〉 önmagában nem felhívni a címkék a “név” vagy a “kor”, ami helyett határozza meg, milyen szintű (amennyiben típus-meghatározások előírhatja, hogy a címkén a “kor” egy alias a csomópont a második pozíció, stb.). Tehát nincs mód a hipernódok szemantikai/fogalmi szándékának megállapítására anélkül, hogy figyelembe vennénk mind a hiponód, mind a hipernód típusokat. Ezzel szemben az RDF-nek nincsenek tényleges sorai (bár ezeket kívánság szerint gyűjteményként is ábrázolhatjuk); a csomópontok pedig mindig címkézett csatlakozókon keresztül csatlakoznak más csomópontokhoz-nincs közvetlen megfelelője annak, hogy egy hiponód Ch modellező egysége pozíció szerint szerepeljen egy hipercsomópontban.

tehát az RDF szemantikája azon a feltételezésen alapul, hogy a Fiat számos csomópontot globálisan egyedinek nyilváníthat. Ennek nem kell minden csomópontra igaznak lennie—az RDF típusok, például az egész számok és a float-ek éteribbek; az egyik gráfban a 46-os szám nem különböztethető meg a másik gráfban a 46-tól. Ezt úgy lehet formalizálni, hogy egyes csomópontok objektumok lehetnek, de soha nem alanyok. Ha ezeket a korlátozásokat nem hajtják végre, akkor az RDF gráfok bizonyos értelemben túlhatározottá válhatnak, ami összefüggéseket jelent a szemantikai tartalomtól mentes kvantitatív nagyságok alapján. Ez megnyitja az ajtót olyan bizarr ítéletekhez, mint például: “korom nem elsődleges” vagy “idősebb vagyok, mint Mohamed Salah 2018-as gólösszege.”Az egyik módja annak, hogy blokkolja ezeket a következtetéseket, hogy megakadályozza a csomópontok, mint a “46-os szám” attól, hogy tárgyak, valamint tárgyak. De azok a csomópontok, amelyek nem primitív értékek—azok, mond, magát Mohamed Salah—t jelöli meg, nem pedig a célösszegeit-indokoltan globálisan egyediek, mivel kényszerítő okunk van egy olyan modell elfogadására, ahol pontosan egy dolog van, az, hogy Mohamed Salah. Tehát az RDF szemantika alapvetően olyan primitív típusokat vesz feleségül, amelyek tárgyak, de soha nem alanyok globálisan egyedi, de belsőleg strukturálatlan értékek hálójával, amelyek lehetnek szubjektumok vagy objektumok.

CH-ben a” primitív ” típusok gyakorlatilag hipotípusok; a hiponódák (legalábbis közvetve) analógak a csak objektum-RDF csomópontokkal, amennyiben csak a hipernódokon belüli befogadás révén ábrázolhatók. De a ch hipernódok sem (önmagukban) globálisan nem egyediek, sem belső struktúrájuk nem hiányzik. Lényegében az atomszerű primitívek garantált egyediségén alapuló RDF szemantikát strukturált építőelemeken alapuló szemantika váltja fel garantált egyediség nélkül. Ezt az alternatívát az Általános versus speciális érvek összefüggésében lehet figyelembe venni: mivel az Általános érvelők potenciálisan a teljes szemantikai webet veszik domainjüknek, a globális egyediség kívánatosabb tulajdonság, mint a belső struktúra. Mivel azonban a speciális okok csak speciálisan kiválasztott adatokon futnak, a globális egyediség kevésbé fontos, mint a tartományspecifikus reprezentációkhoz való hatékony leképezés. Számítási szempontból nem optimális az adatok deserializálása SPARQL lekérdezések futtatásával.

végül az RDF és a CH szemantika összehasonlításának utolsó pontjaként érdemes megfontolni a “deklaratív tudás” és a “procedurális tudás” közötti különbséget (lásd pl. ). E megkülönböztetés szerint a kanonikus RDF adatok példázzák a deklaratív tudást, mert nyilvánvaló tényeket állítanak anélkül, hogy kifejezetten megpróbálnák értelmezni vagy feldolgozni őket. A deklaratív tudás kanonikus, újrafelhasználható adatformátumokban kering a szoftverek között, lehetővé téve az egyes összetevők számára, hogy az adatokból saját céljaik szerint használjanak vagy következtetéseket vonjanak le.

ezzel a paradigmával szemben térjen vissza hipotetikus kiberfizikai példákhoz, például a feszültségadatok gyorsulási adatokká történő átalakításához, ami előfeltétele annak, hogy a gyorsulásmérők leolvasása a legtöbb kontextusban hasznos legyen. A gyorsulásmérők feldolgozására képes szoftverek tehát feltárják az úgynevezett eljárási ismereteket, mivel az így jellemzett szoftverek nemcsak adatokat fogadnak, hanem szabványosított módon is feldolgozzák ezeket az adatokat.

a deklaratív/eljárási megkülönböztetés talán nem tudja megragadni, hogy az eljárási transzformációk hogyan értelmezhetők egyes szemantikai tartományok belső jellegeként—így még az általunk “deklaratívnak” érzékelt információnak is van eljárási eleme. Például az a tény, hogy a “gyorsulásmérőket” nem nevezik “Voltmérőknek” (amelyek valami más), arra utal, hogy a mindenütt jelenlévő számítástechnikai közösség hogyan érzékeli a feszültség-gyorsulás számításokat a gyorsulásmérők adatainak lényegeként. De szigorúan véve, az USH hálózatokban részt vevő összetevők nem csak adatmegosztással foglalkoznak; a hálózat működő részei, mert számos széles körben elismert számítást tudnak végrehajtani, amelyek a releváns tartomány központi jelentőségűek—más szóval, rendelkeznek (és megosztják társaikkal) egy bizonyos “eljárási ismeretek.”

az RDF úgy van felépítve, mintha a statikus adatmegosztás lenne az egyetlen döntőbíró a szemantikailag informált interakciók között a különböző komponensek között, amelyeknek sokféle tervük és logikájuk lehet—vagyis egy szemantikus Web. De a formális kommunikációs szemantika alapos beszámolójának számolnia kell azzal, hogy a szemantikai modelleket hogyan tájékoztatják az implicit, néha tudattalan feltételezés, hogy az adatok előállítói és/vagy fogyasztói bizonyos működési kapacitásokkal rendelkeznek: az adatmegosztás részeként várható dinamikus folyamatokat fogalmilag nehéz elválasztani a szó szerint továbbított statikus adatoktól. A gyorsulásmérő példájának folytatásához a tervezők olyan eszközöket gondolhatnak, mint a” gyorsulás mérése”, bár fizikailag ez nem szigorúan igaz; kimenetüket matematikailag át kell alakítani, hogy ezeket a kifejezéseket értelmezni lehessen. Függetlenül attól, hogy RDF gráfokon vagy irányított Hipergráfokon ábrázolják, a megosztott adatok szemantikája hiányos, kivéve, ha az adatok küldését és fogadását kísérő műveleteket a törvényes szemantikai összehangolás előfeltételeként ismerik el.

míg az ontológiák értékesek az eltérő szemantikai modellek koordinálásában és integrálásában, a szemantikai Web talán befolyásolta a mérnököket abban, hogy a szemantikailag tájékozott adatmegosztást leginkább a közzétett Ontológiáknak megfelelő statikus adatok bemutatásának kérdéseként képzeljék el (azaz a “deklaratív tudás”összehangolása). A valóságban a robusztus adatmegosztáshoz “az eljárási ismeretek összehangolására” is szükség van: egy ideális szemantikai hálózatban az eljárási képességek köröznek az összetevők között, elősegítve egy kialakulóban lévő “kollektív eljárási tudást”, amelyet a kód és a könyvtárak, valamint az adatok és formátumok átláthatósága vezérel. A CH modell vitathatatlanul támogatja ezt a lehetőséget, mert alapvető fontosságúvá teszi a típusú állításokat a szemantika szempontjából. A szigorú gépelés egyaránt megalapozza az eljárási összehangolást, és előírja, hogy az eljárási képességeket figyelembe kell venni a hálózati összetevők értékelésénél, mivel a típus-hozzárendelésnek nincs értelme megfelelő könyvtárak és kód nélkül a típusspecifikus értékek felépítéséhez és értelmezéséhez.

különbségeik ellenére egyrészt a szemantikus Web, másrészt a Hipergráf alapú keretek egyaránt a gráforientált szemantikai modellek teljes teréhez tartoznak. A hipergráfok emulálhatók az RDF – ben, és az RDF gráfok organikusan leképezhetők egy Hipergráf reprezentációra (amennyiben az irányított Hipergráfok annotációkkal az irányított címkézett gráfok megfelelő szupertere). A számítógépes forráskód szemantikus webes Ontológiáit így megfelelően gépelt DHs-ekkel is modellezhetjük, még akkor is, ha Hipergráf alapú forráskód Ontológiákat is megfogalmazhatunk. Tehát joggal feltételezhetjük, hogy elegendő ontológia létezik a legtöbb vagy az összes programozási nyelv számára. Ez azt jelenti, hogy bármely adott eljárás esetében feltételezhetjük, hogy van egy megfelelő DH reprezentáció, amely megtestesíti az eljárás végrehajtását.

az eljárások természetesen az egyes hívásokhoz rögzített bemenetektől függenek, és “kimeneteket” hoznak létre, miután befejeződtek. A gráf-ábrázolás összefüggésében ez azt jelenti, hogy egyes hipercsomópontok olyan értékeket képviselnek és/vagy fejeznek ki, amelyek bemenetek, míg mások a kimeneteket képviselik és/vagy fejezik ki. Ezek a hipernódok elvontak abban az értelemben (mint a Lambda kalkulusban), hogy nincs meghatározott hozzárendelt értékük a testen belül, qua formális struktúra. Ehelyett a DH (vagy ekvivalens módon a ch, miután bevezették a csatornázott típusokat) futásidejű megnyilvánulása konkrét értékekkel tölti be az absztrakt hipernódokat, ami viszont lehetővé teszi a CH által leírt kifejezések értékelését.

ezek a pontok egy stratégiát javasolnak a Lambda kalkulusok és a forráskód ontológiák egyesítésére. Az alapvető konstrukció a következők szerint történik: a matematikai képletek “szabad szimbólumokat” tartalmaznak, amelyek elvontak: olyan helyek, ahol egy képlet konkrét értéket eredményezhet azáltal, hogy értékeket szolgáltat ismeretleneknek; vagy új képleteket eredményezhet beágyazott kifejezéseken keresztül. Analóg módon a gráf-alapú forráskód-ábrázolás csomópontjai hatékonyan elvonatkoztathatók, ha modellezik a bemeneti paramétereket, amelyek konkrét értékeket kapnak az eljárás futtatásakor. Az egyik eljárás kimenetének összekapcsolása egy másik bemenetével—amely gráfműveletként modellezhető, két csomópont összekapcsolása—ezután gráf alapú Analóg egy komplex kifejezés beágyazásához egy képletbe (az utóbbi szabad szimbólumán keresztül).

ezt az analógiát tovább folytatva korábban már említettem a különböző programozási nyelvű funkciók által inspirált különböző számtani kiterjesztéseket, mint például az objektumorientáció, a kivételek, valamint a referencia-vagy értékalapú rögzítések. Ezeket is be lehet építeni egy forráskód Ontológiájába: például egy bemeneti paraméter csomópontnak átadott értéket tartó csomópont közötti kapcsolat az eljárás aláírásában szemantikailag különbözik az “objektumokat” tartó csomópontoktól, amelyek az “üzenetek” feladói és vevői, objektumorientált szóhasználatban. A variáns bemeneti / kimeneti protokollok, beleértve az objektumokat, a rögzítéseket és a kivételeket, minden bizonnyal szemantikai konstrukciók (a számítógépes kódtartományban), amelyeket a forráskód Ontológiáinak fel kell ismerniük. Tehát konvergenciát láthatunk a sokféle input/output protokollok modellezésében, a caulculus-on és a forráskód Ontológiákon keresztül. Most megvitatom a megfelelő bővítést az alkalmazott típuselmélet területén, azzal a céllal, hogy végül a típuselméletet ebbe a konvergenciába is összehajtsam.

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.