宣言的知識

3.3.3チャネライズされたハイパーグラフとRDF

リソース記述フレームワーク(RDF)は、有向グラフを介して情報をモデル化します(Refs. そのエッジは、よく構造化されたコンテキストでは、公開されたオントロジーから引き出される概念でラベル付けされています(これらのラベルはCHsの”分類子”と同様の役割を果たしています)。 原則として、RDFグラフを介して表現されるすべてのデータは、ラベル付きエッジの順序付けられていないセットによって定義され、「トリプル」(「〈Subject、Predicate、Object〉」、「Predicate」がラ しかし、実際には、TTL(Turtleまたは「Terse RDF Triple Language」)やNotation3(N3)などの高レベルのRDF表記は、rdfコンテナやコレクションなどのデータの集合グループを扱います。

例えば、”(A/the person named)Nathaniel,46,has lived in Brooklyn,Buffalo,And Montreal”(図に示す)という事実の表現を想像してみてください。 3.2CHとRDFの両方として)。 TurtleやN3を単なる表記ではなく言語として考えると、それらの意味論がトリプルではなくハイパーエッジを中心に構築されているかのように見えます。 これらの言語は、複数の主語および/または述語を持つエッジとしてグラフ化された、多対多または一対多のアサーションをエンコードするように思われる。 実際、Tim Berners-Lee自身は、「実装は、rdf:firstおよびrdf:restプロパティの単なるはしごではなく、listをデータ型として扱うことができる」と示唆しています。 つまり、RDFリスト型データ構造の仕様は、意味解釈で引き離される単なる集約ではなく、積分単位とみなすことができると考えるように促します。

図1.1.1. 3.2. CHとRDFのコレクション。

技術的には、おそらく、これは錯覚です。 彼らのより高いレベルの表現力にもかかわらず、RDF式言語は、おそらく、トリプルのより原始的なリストのための”構文糖”とみなされることになってい: TurtleとN3の意味論は、式を論理的に暗示する三重集合に変換することによって定義されると考えられている(も参照)。 この意図は、形式言語の意味論を提供することは、どの命題がその文によって論理的に伴うかを定義することと密接に関連しているというパラダイムを受け入れている。

しかし、形式的意味論には、論理よりも型理論に向けられた発散的な伝統があります。 より大規模な集合体が”ファーストクラス”の値になるTurtleのような言語の異なるセマンティクスを見ることは、この代替アプローチと一致しています。 なので、〈⌈Nathaniel⌉,⌈46⌉〉として見ることができ(シングル、積分値タイプをクライアントには〈は、氏名、年齢〉対になっています。 このような値は、複数のデータポイントを包含する”内部構造”を有する。 RDFバージョンは、代わりに空白のノードの周りに編成されており、my nameやmy ageなどの異種のデータポイントを結び付けています。 この空白のノードは、placeとpartyを結びつける別の空白のノードにも接続されています。 空白のノードは、同じ空白のノードに接続する限り、ノードがグループ化されるため、組織的な役割を果たします。 Brooklyn Brooklyn⌉、⌈Democrat nodesノードは、「名前/年齢」の空白に個別に簡単に添付できると仮定するかもしれません(つまり、私はbrooklynに住んでいて、民主的に投票します)。

なぜ、つまり、ブルックリンと民主主義は一緒にグループ化されていますか? この融合モデルはどのような概念ですか? 名前/年齢空白の推定的根拠があります(つまり、 nathanielという名前の複数の46歳が存在するため、空白のノードは重要な意味的役割を果たします(”There is a Nathaniel,age46…”の量指定子に似ています);それは明確なネクサスを提供し、古い〈 ⌈Nathaniel⌉,⌈46.ではなく、特定の46歳のNathanielにさらに述語をアタッチすることができます。 しかし、”place/party”グループ化のための同様に示唆された意味的役割はありません。 名前は論理的に名前/年齢の空白から離れてからかうことはできません(複数のNathanielsがあるため)が、場所/パーティーのグループ化に論理的な意味はないようです。 しかし、これらの値をペアリングすることは、地理的および党所属データがデータセットまたはデータモデルにグループ化されていることを反映して、モデ RDFの論理的セマンティクスは、ロジックよりも慣習によって駆動されるこれらの種類のモデリング仮定を表現することを困難にします。

では、なぜセマンティックWebコミュニティは、TurtleとN3のセマンティック解釈を、異なる高レベルのセマンティックを持つ高レベル言語としてではなく、Nトリプルの単なる表記上の利便性として効果的に主張しているのでしょうか。 さらに、材料組成または構造組織の階層を定義すること、および拡張によって、潜在的に、モデリング解像度の明確なスケールを定義することは、ドメイ 、または参照。 ). しかし、セマンティック-ウェブの支持者は、特定のオントロジー内の基準論とは対照的に、セマンティック-モデルの特徴として多階層構造を根本的に推進していない。 これは説明を持っている程度に、それはおそらく推論エンジンと関係があります: SPARQLクエリを評価するツールは、トリプレストアベースで動作します。 したがって、”還元的”な意味論的解釈は、セマンティックWeb表現の決定的な基準は、人間の判断に対する概念的な優雅さではなく、クロスオントロジーとクロスコンテキスト推論における有用性であるという保証を介して間違いなく正当化される。

しかし、制約解決やコンピュータビジョンなどの多くの推論エンジンは、特殊なアルゴリズムに依存しており、標準的なクエリ形式に縮小することはできないことに注意してください。 GeCODEやITKなどのライブラリは、多くの領域で問題を解決するには、微調整されたアプリケーションレベルのエンジニアリングが必要なため、重要です。 これらのライブラリは、特定のプロジェクト用に構築された特別なまたはドメイン固有の推論エンジンをサポートするものと考えることができますが、FACT++のようなOWLベースの推論エンジンは、それ以上の資格を持たずに汎用RDFデータで動作する一般的なエンジンです。 “特別な”推論をRDFに適用するには、推論者の実行時要件と一致するノードの偶発的なものを選択する必要があります。

もちろん、特別な推論はセマンティックWeb全体のドメイン上で、あるいは一般的に”非常に大きな”データセット上でさえ実行することは期待できません。 典型的な分析は、その問題をカスタム推論者に扱いやすい小さな部分に細分化します—放射線学では、診断は最初に医用画像シリーズを選択し、次に画像 RDFに適用すると、この二段階のプロセスは、一般的な推論者と特別な推論者の組み合わせと考えることができます: SPARQLのような一般的な言語は、多くのノードをより小さなサブセットにフィルタリングし、ドメイン固有の表現(ランタイムメモリを含む)にマップ/逆シ 例えば、RDFは、特定の医師が特定の日付に注文した診断テストに患者をリンクさせることができ、その結果は一連の画像として得ることができ、それ 一般的な推論者は、関心のある画像を見つけて、分析するために特別な推論者(セグメンテーションアルゴリズムなど)に渡すことができます。 このアーキテクチャが有効である限り、セマンティックWebデータは多くの種類の推論エンジンのためのサイトです。 これらのエンジンの中には、RDFデータとリソースを最適化された内部表現に変換することによって動作する必要があるものがあります。 さらに、これらの表現の意味論は、通常、n-Tripleのような低レベルの形式の表記上の利便性として還元的に解釈されるのではなく、sui generisとして取られる高レベルのN3意味論に近い。 これは、OWL推論の観点からの還元的意味論の正当性を損なうように見える。

おそらく最も正確なパラダイムは、セマンティックWebデータには二つの異なる解釈があり、それぞれ特殊セマンティクスと一般セマンティクスとの一貫性が異なるということである。 これらをそれぞれ「特別な意味解釈」または「特別な目的の理由のための意味解釈」(SSI、多分)および「一般的な意味解釈」(GSI)にラベル付けすることは理にかなっ これらの両方の解釈は、セマンティックウェブの”意味論”において役割を持つとみなされるべきである。

別の考慮事項には、特に一意性に関するRDFノードとCHハイパーノードの意味論が含まれています。 Rdfのノードは、空白ノード、文字列や整数などの小さな基本型の値を持つノード、World Wide Web全体で一意であると理解されるUrlを持つノードの3つのクラスに分類されます。 CHには空白のノードはなく、本質的にUrlもありませんが、確かにURLタイプを定義することはできます。 Urlのセマンティクスには、各URLが個別のインターネットリソースを指定することを保証するものはありません; これは、デジタルのものだけでなく、商業的および法的慣行のウェブを構造化するため、本質的に事実上それ自体を満たす単なる条約です。 CHでは、データ型は、いくつかの文脈で値の一意性を保証する制度的慣行を反映するように構造化することができる:書籍は一意のISBNコードを持ってい しかし、これらの一意性要件は本質的にCHの一部ではなく、追加の公理で表現する必要があります。 一般に、CHハイパーノードは比較的単純な値のタプルであり、追加のセマンティクスは型定義によって決定されます(chハイパーノードは、先験的な一意性メカニズムを持たないC構造体にほぼ類似していると見なすと便利かもしれません)。

また、RDF型はCHよりもRDFセマンティクスにはあまり本質的ではありません。 CHの基本的な要素は値タプルです(値を表現するノードを介して、そのタプルはハイパーノードです)。 タプルは、ラベルではなく位置によって索引付けされます: タプル〈 ⌈Nathaniel⌉、4 46.は、それ自体ではラベル”name”または”age”を描画せず、代わりに型レベルで定義されます(型定義がラベル”age”がその2番目の位置にあるノードのエイ). したがって、ハイポノード型とハイポノード型の両方を考慮せずに、ハイポノードの意味的/概念的な意図を確認する方法はありません。 逆に、RDFには実際のタプルはありません(ただし、必要に応じてこれらをコレクションとして表すことができます)。; また、ノードは常にラベル付けされたコネクタを介して他のノードに結合されます—位置によってハイポノードのCHモデリングユニットがハイポノードに含まれているのと直接同等のものはありません。

その中核に、RDFセマンティクスは、多くのノードがfiatによってグローバルに一意であると宣言できるという命題に基づいて構築されています。 これはすべてのノードに当てはまる必要はありません—整数や浮動小数点数のようなRDF型はよりエーテル性があります;あるグラフの46の数は別のグラフの46と区別できません。 これは、いくつかのノードがオブジェクトになることはできますが、サブジェクトになることはできないと言うことによって形式化できます。 このような制限が強制されなかった場合、RDFグラフはある意味で過剰決定になり、意味的内容を欠いた定量的な大きさのおかげで関係を暗示する可 これは、「私の年齢は素数ではありません」または「私はMohamed Salahの2018の目標の合計よりも年上です」のような奇妙な判断への扉を開くでしょう。「これらの推論をブロックする1つの方法は、「46番」のようなノードがオブジェクトだけでなくサブジェクトになるのを防ぐことです。 しかし、原始的な値ではないノード、つまり目標の合計ではなくMohamed Salah自身を指定するノードは、Mohamed Salahというモデルを採用する説得力のある理由があるため、 したがって、RDFセマンティクスは基本的に、オブジェクトではあるがサブジェクトではないいくつかのプリミティブ型と、サブジェクトまたはオブジ

CHでは、”プリミティブ”型は事実上hypotypesです; ハイポノードは、ハイパーノード内の包含によってのみ表現できる限り、オブジェクトのみのRDFノードに(少なくとも間接的に)類似しています。 しかし、CHハイパーノードは(それ自体で)グローバルに一意でもなく、内部構造に欠けていません。 本質的に,アトムのようなプリミティブに対する保証された一意性に基づくRDFセマンティクスは,保証された一意性のない構造化ビルディングブロックに基づくセマンティクスに置き換えられる。 この代替案は、一般的な理由と特別な理由の文脈で考慮される可能性があります: 一般的な推論者は潜在的にセマンティックWeb全体をドメインとして取るので、グローバルな一意性は内部構造よりも望ましい特性です。 しかし、特別な推論は特別に選択されたデータでのみ実行されるため、グローバルな一意性はドメイン固有の表現への効率的なマッピングよりも重要ではありません。 SPARQLクエリを実行してデータを逆シリアル化することは、計算上最適ではありません。

最後に、RDFとCHの意味論の比較の最後のポイントとして、”宣言的知識”と”手続き的知識”の区別を考慮する価値がある(例えば、参照)。 この区別によれば、標準的なRDFデータは、明示的に解釈または処理しようとせずに明らかな事実を主張するため、宣言的知識を例示します。 宣言的な知識は、正規の再利用可能なデータ形式でソフトウェア間を循環し、個々のコンポーネントが独自の目的に従ってデータを使用または推論するこ

このパラダイムに反して、電圧データから加速度データへの変換などの仮想的なサイバー物理的な例に戻ります。 したがって、加速度計を処理する能力を持つソフトウェアは、データを受信するだけでなく、標準化された方法でそのようなデータを処理するため、プロシージャルナレッジと呼ぶことができるものを明らかにする。

宣言型/手続き型の区別は、手続き型変換がいくつかの意味領域に固有のものとして理解される方法を捉えることができない可能性があります。 たとえば、「加速度計」が「電圧計」と呼ばれていないという事実(これは他のものです)は、ユビキタスコンピューティングコミュニティが、加速度計のデータに固有の電圧から加速度までの計算をどのように認識しているかを示唆しています。 しかし、厳密に言えば、USHネットワークに参加するコンポーネントは、単にデータ共有に従事しているのではなく、関連するドメインの中心であると理解されているいくつかの広く認識されている計算を実行できるため、ネットワークの一部に機能しています。”

RDFは、静的データ共有が異なるコンポーネント間の意味的に情報に基づいた相互作用の唯一の仲裁者であるかのように構造化されています。 しかし、正式な通信セマンティクスの徹底的な説明は、データの生産者および/または消費者が特定の運用能力を有するという暗黙の、時には無意識の: データの共有の一部として予想される動的プロセスは、文字通り転送される静的データから概念的に分離することは困難です。 加速度計の例を続けるために、設計者は物理的にこれが厳密に真実ではないにもかかわらず、このような計測器を”加速度を測定する”と考えることが RDFグラフでも有向ハイパーグラフでも,データの送受信に伴う操作が正当な意味的整列の前提条件として認識されない限り,共有データの意味は不完全である。

オントロジーは異種のセマンティックモデルを調整し統合するために価値がありますが、セマンティックウェブは、おそらくエンジニアに、セマンティック情報に基づいたデータ共有を、主に公開されたオントロジーに準拠した静的データを提示する問題(すなわち、”宣言的知識”のアラインメント)として考えるように影響を与えています。 理想的なセマンティックネットワークでは、手続き型機能がコンポーネント間で囲まれ、コードやライブラリ、データやフォーマットに関する透明性によって駆動される創発的な”集合的手続き型知識”を促進します。 CHモデルは、型アサーションを意味論の基本にするため、間違いなくこの可能性をサポートしています。 厳密な型付けは、型固有の値を構築して解釈するための適切なライブラリとコードがなければ、型属性には意味がないため、手続き的なアライメントの基礎を築き、手続き的な機能をネットワークコンポーネントの評価に考慮することを義務付けている。

その違いにもかかわらず、一方ではセマンティックウェブとハイパーグラフベースのフレームワークは、両方ともグラフ指向のセマンティックモデルの全体的な空間に属しています。 ハイパーグラフはRDFでエミュレートすることができ、RDFグラフはハイパーグラフ表現に有機的にマッピングすることができます(注釈付きの有向ハイパーグラフが有向ラベル付けされたグラフの適切な超空間である限り)。 したがって,コンピュータのソースコードに対するセマンティックWebオントロジーは,ハイパーグラフベースのソースコードオントロジーを定式化することもできるが,適切に型付けされたDhsによってモデル化することができる。 したがって、ほとんどまたはすべてのプログラミング言語に十分なオントロジーが存在すると仮定することで正当化されます。 これは、任意のプロシージャに対して、そのプロシージャの実装を具体化する対応するDH表現があると仮定できることを意味します。

プロシージャは、もちろん、呼び出しごとに固定された入力に依存し、終了すると”出力”を生成します。 グラフ表現の文脈では、これは、いくつかのハイパーノードが入力である値を表し、/または表現し、他のものはその出力を表し、/または表現することを意味し これらのハイパーノードは、(ラムダ計算のように)ボディ内に特定の割り当てられた値、qua形式構造を持たないという意味で抽象的です。 代わりに、dh(またはチャネライズされた型が導入されると同等のCH)の実行時の症状は、抽象ハイパーノードに具象値を移入し、CHによって記述された式を評価することを可能にする。

これらの点は、Lambda calculiをソースコードオントロジーと統合するための戦略を示唆している。 Σ-計算における本質的な構成は、数式に抽象化された”自由記号”が含まれていることです: 式が未知数に値を与えることによって具体的な値を生み出すことができるサイト、またはネストされた式を介して新しい式を生み出すサイト。 同様に、グラフベースのソースコード表現のノードは、プロシージャの実行時に具体的な値が与えられる入力パラメータをモデル化すると、効果的にσ抽象化され あるプロシージャの出力を別のプロシージャの入力に接続する—グラフ操作としてモデル化することができ、二つのノードをリンクする—は、複雑な式を式に埋め込むためのグラフベースのアナログである(後者のフリーシンボルを介して)。

この類推をさらに進めて、オブジェクト指向、例外、参照または値によるキャプチャなどのプログラミング言語の機能に触発されたさまざまなμ-Calculus拡張 たとえば、プロシージャシグネチャ内の入力パラメータノードに渡された値を保持するノード間の接続は、オブジェクト指向の用語では、”メッセージ”の送信者と受信者である”オブジェクト”を保持するノードとは意味的に区別される。 オブジェクト、キャプチャ、および例外を含むバリアント入出力プロトコルは、ソースコードオントロジーが認識すべき(コンピュータコード領域における)セマンティック構造であることは確かである。 したがって、μ-Calculusとソースコードオントロジーを介して、多種多様な入出力プロトコルのモデリングに収束を見ることができます。 ここでは、応用型理論の領域における対応する拡張について議論し、最終的に型理論をこの収束にも折り畳むことを目標とします。

コメントを残す

メールアドレスが公開されることはありません。