語意網的核心挑戰之一就是將現有的大量資訊轉變成由知識本體語言所定義的知識本體,這些現有的大量資訊主要是由網路上的資訊內容所構成。因此,為了實現語意網的目的,將這些網路上的資訊內容對映至知識本體是有必要的。網路服務技術允許應用程式透過網路標準以一致的方式被存取,使得它們就像是不同平台上的軟體元件。

隨著網路服務的規模越來越大,找到適合的網路服務成為一件重要的工作。現今大多數使用者使用關鍵字搜尋以及人工閱讀服務的內容描述這種方式來尋找網路服務,這件工作相當的費時且沒有效率。網路上擁有超過數億的網頁,而這些網頁上的資訊內容大多數是被儲存在關聯式資料庫因而很難被搜尋引擎所找到;因此,為了讓語意網可以取用這些資訊內容,一個有效的方法就是將"深網"底下的關聯式資料庫對映至某特定領域中一個已有的知識本體(Ontology)
 
語意網是一種利用知識本體加以註釋並且機器可以理解的網路,透過將語意網應用到網路服務上,我們可以使得網路服務可以被機器理解(machine readable)。大多數人使用知識本體定義來當作語意網上語意註釋的基礎,因此從現有的資訊中自動化的產生知識本體事件意義重大的工作。關聯式資料庫是最為普遍的資料儲存系統,對於那些想要參與語意網路服務領域的服務提供者來說,找到他們使用已久的關聯式資料庫與知識本體間的對應關係是一個關鍵性的議題。若是能夠將一個關聯式資料庫綱目對映到某特定領域中一個已有的知識本體,這個使用已久的關聯式資料庫藉此可以被語意網路服務所運用,設計出一套半自動化方法直接將一個關聯式資料庫對(RDBMS)映到某特定領域中一個已有的知識本體(Ontology),這個方法採取在資料採礦中的群集分析概念去替每個表格找出它們的匹對類別群組,其中在類別群組中的每個類別都會滿足對映一至性亦即對映的結果不應該違背在關聯式資料庫所表達的事實。
 
第一階段-元素層級的媒合
目標是衡量單一一個表格和單一一個類別的相似度。這個階段的配對將所有單一一個表格和單一一個類別可能的組合搭配出來後,使用自然語言處理技術藉由它們的名字以及它們的欄位和屬性的名字來計算相似度。主要是利用語意上的資訊將關聯式資料庫中的外鍵對映到知識本體中的物件屬性以獲得一些表格的匹對類別群組特徵,有別於其它方法,在對映時,不只考量了表格之間的一般化/特殊化關係也考量了隱含表達在關聯式資料庫中的反關係以建構出一個隱含匹對等級。

第二階段-綱目層級的媒合
使考慮的是這兩種資料綱目的整體結構,對一個表格和一個類別來說,他們相關的表格和相關的類別之間越接近,他們會實際被對映在一起的機率就越高。綱目層級的媒合者由它們的子類別/表格、超類別/表格、參考和被參考到此表格的那些表格、以及那些透過某些物件屬性與此類別產生關聯的類別來測量結構上的相似度。用外鍵的對映結果作為特徵線索以找出一些表格的匹對類別群組,然後再利用這些表格的匹對類別群組去找到其它表格的匹對類別群組,最後將每個表格對映至本身的匹對類別群組。
 
 

 
為什麼要能夠產生知識本體(Ontology),Ontology的功用可由下列四點說明 (Noy & McGuinness, 2001):
1.一些相同領域的專家或機構可用相同的Ontology來定義Class或Concept,如此軟體代理人或使用者可藉由Ontology而達到資訊共享之目的。
2.當需要建立一個大範圍的Ontology時,可利用已存在的General Ontology (ex. WordNet、UNSPSC Ontology) 或一些Domain Ontology來作為輔助。
3.Ontology中定義的Class及Relation對於某個Domain Knowledge可做更明確的定義,當一個初學者想要瞭解某個Domain Knowledge,可藉由Ontology而得到幫助。
4.可利用已經存在的Domain Ontology,來分析Domain Knowledge並重複使用Ontology或對Ontology做擴充。
 
近年來,已經發展出許多Ontology Languages,常見的Ontology Languages有:XOL
(一)XOL(XML-based Ontology Exchange Language, XOL)
是在1999年由Peter D. Karp, Vinay K. Chaudhri, and Jerome Thomere (Karp et al. 1999) 等專家所發展出來的。它是基於XML (eXtensible Markup Language) 的Ontology Language,可應用於不同異質系統之間的訊息交換。
(二)SHOE (Simple HTML Ontology Extensions, SHOE)
起源於馬里蘭大學College Park資訊科學系所的Understanding Systems Group所提出的SHOE計畫 (xml.coverpages.org)。SHOE是一種HTML的延伸語言,它允許網頁作者在他們的網頁文件中註解機器可讀取的語意知識。SHOE使得線上智慧代理人 (Intelligent Agent) 能更有效率地執行搜尋網頁和文件內有意義的資訊,這過程包含三個步驟:1.定義Ontology。2.使用HTML來註解Ontology知識及描述它們和其他網頁的關連。3.設計一個Agent使它可搜尋到語意網頁資訊 (Asunción & Corcho, 2002)。
(三)OML(Ontology Markup Language, OML)
是1998年8月由華盛頓大學所提出來的,其嘗試以XML的語法為基礎來表達Ontology,且其有部分是建立於SHOE (Simple HTML Ontology Extension) 的基礎上,也就是說,OML和SHOE有許多共有的特徵 (Asunción & Corcho, 2002)。
(四) 資源描述架構 (RDF , Resource Description Framework)& RDF Schema
是1999年2月由全球資訊網協會 (W3C) 主導所發展而成的一個架構,其提供一具有語意網路之機制,可用來描述網頁資源,允許資源描述機構訂定各自的控制詞彙,提供結構化的相互共容機制,RDF在語法上則是遵循XML。
(五)OIL(Ontology Inference Layer or Ontology Interchange Language, OIL),
是從On-To-Knowledge Project中所發展出來的一種Ontology表達語言,而這個Project是從1999年開始到現在,其成員是由業界及學術界所組成的。然而OIL之所以會被發展出來是為了能正確地去表達在Web上電腦可以存取有語意的資訊,而這些有語意的資訊必需能符合電腦可以存取的格式。而OIL的語法及語意是建構在已存在的一些標準語言上,如Open Knowledge Base Connectivity (OKBC)、XML-based Ontology Exchange Language (XOL)、Resource Description Framework (RDF) 等。目前可用以建構OIL Ontology的工具軟體有OntoEdit、OILEd,、WebODE和Protege2000 (Asunción & Corcho, 2002) (Fensel, 2000)。
(六)DAML+OIL
DAML (DARPA Agent Markup Language),是由美國國防部高等研究計畫局研發。為比RDF能更佳表達RDF Class的定義,在美國政府倡議的努力下,於2000年10月發行了DAML-ONT,這是一種符合 RDFS 的簡單語言。不久 DAML 小組為提供更加的功能服務,乃朝向結合Ontology Inference Layer (OIL) 而努力,使用人工智慧框架基礎 (Frame-based) 的架構。這些努力的結果即為後來發展的DAML+OIL。DAML+OIL是Web Resources中可以用來描述語意的Ontology標記語言。它是以W3C早期所制定的標準 (RDF及RDF Schema) 而建立的,且擴充了許多modelling primitives於此語言。DAML+OIL
所提供的Modelling Primitives,通常都是出自於Frame-based Languages裡。這樣的DAML+OIL Language是相當簡潔且容易來定義語意的。目前用以建構OIL Ontology的工具軟體如:OntoEdit, OILEd, WebODE和Protege2000,亦可以用來建構DAML+OIL Ontology (Asunción & Corcho, 2002) (Fensel, 2000)。

 
目前知名現存已發展的本體論:
1.  專家知識的系統化主體
      (1) 美國國家癌症學術院
      (2) 藝術和建築同義辭點
      (3) 藝術家姓名聯合清單
      (4) 圖像類別字彙
      (5) 地理名程同義辭典
2.      整合的字彙
      (1) 統一醫學語言(Unified Medical Language System, UMLS)
3. 上層本體論(Upper Ontology)
4. 主題的階層
5. 語言的資源
     (1) 「中央研究院中英雙語知識本體資料庫」(The Academia Sinica Bilingual Ontological Database),網址:http://bow.sinica.edu.tw/為一涵蓋約十一萬中文詞之中英雙語知識本體資料庫。
     (2) 以IEEE批准執行的SUMO(Suggested Upper Merged Ontology,http://www.ontologyportal.org)知識本體為基礎架構,並以台灣地區的語言使用為經驗基礎。
     (3) 大陸董振東先生獨力發展出來的知網Hownet (http://www.keenage.com)也是一個非常重要的詞彙知識庫(參考Dong and Dong (2006)。知網Hownet 包含的訊息相當的多,是一個雙語的知識庫,可以表達概念與概念之間的常識關係。
     (4)  Wordnet :最著名的詞彙知識庫首推普林斯頓大學所發展出Wordnet (http://wordnet.princeton.edu/),
有大量的自然語言處理研究依靠這個知識庫。透過Wordnet 可以查出詞的定義,例句,同義詞,上位關係詞,下位關係詞,部分關係詞,全體關係詞等。Euro Wordnet 是歐盟幾個國家以Wordnet 為基礎合作發展多語詞彙知識庫。
     (5)  Ontosaurus :美國南加大整合許多的知識庫和發展了Ontosaurus (http://www.isi.edu/isd/ontosaurus.html)
如同Wordnet 它註明了詞項的定義,同義詞,及語意的類別。
     (6)  DOLCE : DOLCE 與SUMO 類似,也是一個非常重要的ontology,並提供與Wordnet 的對應。
6. 本體論庫(Ontology Library)
     (1) http://www.sketchengine.co.uk/
 
產生知識本體(Ontology)的方式依據產生的自動化的程度可以分成自動化、半自動化與手動等三種方式。然而,不論是自動化、半自動化與手動產生,具體的建立一個ontology過程可分為以下幾步驟:
(1)定義Ontology 中的Class(Class 指的就是概念);
(2)把這些Class 組織成一個層次化的結構,定義Class與Class 之間的階層關係 (Subclass- Superclass);
(3)定義Class中的屬性,填充Property 在相對應的Class上的值,並且說明對於屬性值的限制;
(4)將Instance的屬性值填入,定義Property 和描述這些Property 相對應的Class 限制。

以下分別討論之:
 
一、手工建構本體論 (Ontology) 
知識工程師從零開始建構本體論:機器學習協助知識工程師,建議最重要的關係或檢查,並驗證所建構的知識庫。建構本體論的步驟如下: 
1. 決定建構本體論的範圍 
針對一個特定領域予以抽象化,在這個抽象內要包含什麼,應該是由本體論的應用和預期未來延伸來決定。 
2. 考慮再使用 (Reuse) 已建構好的本體論 
本體論 (Ontology) 經由許多人廣為的使用後,未來將會變得更廣泛地可取得,在定義一個本體論 (Ontology) 時,目前較少人是從零開始建構,而是從已經建構第三者去取得可以利用的本體論 (Ontology) 。 
3. 列舉所有項目 
(1) 寫下沒有結構的清單 
(2) 列出所有要在本體論 (Ontology) 出現的相關項目 [1] 
名詞形成類別名稱的基礎,而動詞 ( 或動詞片語 ) 是性質名稱的基礎,例如:「 is part of 」和「 has components 」 
4. 定義分類 
識別出相關項目後,這些項目必須以分類階層 (taxonomic hierarchy) 的方式組織起來,根據由上而下或是由下而上的方式來作,何者會比較有效率、可靠,造成不同的選擇。 
5. 定義性質 
當組織類別時,很自然地會去組織這些類別的性質。關係 subClassOf 的語意要求只要 A 是 B 的次類別,對 B 的樣例有效的每個性質敘述也必定應用到 A 的樣例。由於這個繼承性,將性質附加到所應用的階層中最高的類別是有意義的。 
將性質加到類別時,就立即提供關於這些性質的定義域和值域的敘述,這個作法是可理解的。將更一般性的性質,並賦予定義域和值域,使得性質可以被次類別使用,或是經由繼承的方式,另外一方面,定義域和值域盡可能狹窄,好讓我們可以從定義域和值域的違反去偵測出本體論中潛在的不一致和錯誤概念。 
6. 定義介面 
本體論 (Ontology) 只需要 RDF Schema 所提供的表達性,而不使用任何 OWL 中多餘的原素。目前的步驟將改變這個,將前面定義的性質以片面加以充實: 
(1) 基數 (Cardinality) :盡可能描述是否允許或需要具有確定數量的不同值的性質。例如:「至少 一個值」,「至多一個值」 
(2) 必要值: 
類別以某個性質具有特定值來予以定義,這種必要值在 OWL 可以用 owl:hasValue 來描述。有時候,若是需求是比較不嚴謹的:性質必需具有一個給定類別中的某些值。 
(3) 關連的特性:對稱性、遞移性、相反、函數值。 
7. 定義樣例 
若是使用現存的本體論 
8. 檢查異常 
使用 OWL 勝過 RDFS 的有點是在本體論 (Ontology) 中或是在繁殖本體論的樣例集合中,偵測出不一致的可能性。

 
二、半自動化建構本體論 (Ontology) 
1. 從資訊網(Web Content)上的現存資料抽取出本體論:從資訊網文件抽出的本體論為基模,機器學習系統在知識工程師的幫助之下,用資料和元知識作為輸入,產生可用的本體論做為輸出。
2. 從資訊網上的現存資料抽取出關聯性資料和基元資料:本體論的充實或調整包含了現存本體論中自動地修改少數
3. 用概念延伸的分析去融合和影射本體論:
4. 用樣例資料的分析去維護本體論:本體論樣例的抽取立足於給定的本體論基模之上,並取出資訊網文件中本體論的樣例。這個工作類似於資訊抽取和網頁註解,並可應用這些區域中發展出來的技術。
5. 本體論的整合和航行是在處理大型機器可以學習的知識庫中的重建和航行。例如:改變機器學習者的命題層級知識庫成為第一階層知識庫。

三、自動建構產生本體論 (Ontology)
自動產生Ontology方法在國內外的研究\還不算多見,但仍舊是一個相當重要而且蠻令人感到興趣的主題。

OntoSeek (Guarino et al., 1999) 即是一個結合Ontology-Driven內容比對機制之資訊擷取系統;Embley et al. (1998) 提出了基於Domain Ontology的方法,應用於如何自非結構性的文件中擷取資訊。亦有人提出利用Formal Concept Analysis自動產生Ontology,採用Formal Concept Analysis理論做為文件推薦系統之即時建構本體論的方法,FCA為一種從資料集之中發現概念結構(Conceptual Structures)的資料分析理論,可以有效幫助本體論的發展,正規概念分析 (Formal Concept Analysis, FCA)如下所介紹:

正規概念分析主要根據點陣理論(Lattice theory)建構出概念點陣(Concept lattices),而概念點陣是由領域本體(Domain ontology)中的本文(Context)之建構出來的,而本文是領域本體中的屬性(attribute)和物件(object)的集合所建構而來,由上述我們可以知道,正規概念分析(FCA)的建構步驟大致如下:
(1)建構本文
(2)建構概念點陣
而建構概念點陣的目的,是可以輔助本體的產生,具有越多相關物件的屬性,視為越重要,隸屬於越高的層級。 
例:
(1) 建構本文
(2) 建構概念點陣
流程步驟
STEP1:由資料庫中獲得資訊進行模糊正規概念分析,建構出模糊概念點陣。
STEP2:計算出概念間之相似度,進行模糊概念聚集,可得到聚集後之概念點陣。
STEP3:藉由聚集後之概念點陣,進而產生糢糊本體。
STEP4:將建構之糊模本體轉換為OWL語言,使本體可被其他應用程式所使用,進而建構出語意網之架構。
產生模糊本體的詳細流程
STEP1:將概念點陣中之屬性集合(intent)與物件集合(extent)分開。
STEP2:建立已分類概念間之關聯(屬性集合間之關聯)
STEP3:建立未分類概念間之關聯(物件集合與屬性集合間之關聯)
STEP4:藉由使用者新產生的查詢項目及伺服器新回傳之資訊,建構本體中的實例層,讓本體趨於完整。
 
 
有了產生建立本體論(ontology),後續觀察使用者以改進(modify)語意網:
1.自然語言本體論(Natural Language Ontologies, NUOs)
2.領域本體論
領域本體論掌握住特定領域的知識,這些本體論提供一個源自限制領域之概念的詳細描述。領域本體論的獲取仍然由人類知識工程師去引導,自動學習技術在知識獲取扮演次要的角色,以統計方式在領域本文中找出有效的相依性,並建議給知識工程師。
3.本體論樣例
當本體論停留不變時,本體論樣例可以自動產生,並時常更新。本體論樣例的學習工作非常適合機器學習的框架,機器學習演算法在此有幾個成功的應用,但是這些應用是嚴格地相依於領域本體論,或和任何領域理論無關的標記。給與領域本體論作為輸入從本文抽取本體論樣例的一般用途技術仍然尚未發展出來。除了可支援的本體論的不同型別之外,在本體論學習也有不同的使用。

OntoSeek (Guarino et al., 1999) 即是一個結合Ontology-Driven內容比對機制之資訊擷取系統;Embley et al. (1998) 提出了基於Domain Ontology的方法,應用於如何自非結構性的文件中擷取資訊。

為什麼要能夠產生Ontology,Ontology的功用可由下列四點說明 (Noy & McGuinness, 2001):

1.一些相同領域的專家或機構可用相同的Ontology來定義Class或Concept,如此軟體代理人或使用者可藉由Ontology而達到資訊共享之目的。

2.當需要建立一個大範圍的Ontology時,可利用已存在的General Ontology (ex. WordNet、UNSPSC Ontology) 或一些Domain Ontology來作為輔助。

3.Ontology中定義的Class及Relation對於某個Domain Knowledge可做更明確的定義,當一個初學者想要瞭解某個Domain Knowledge,可藉由Ontology而得到幫助。

4.可利用已經存在的Domain Ontology,來分析Domain Knowledge並重複使用Ontology或對Ontology做擴充。

近年來,已經發展出許多Ontology Languages,常見的Ontology Languages有:XOL

(一)XOL(XML-based Ontology Exchange Language, XOL)
是在1999年由Peter D. Karp, Vinay K. Chaudhri, and Jerome Thomere (Karp et al. 1999) 等專家所發展出來的。它是基於XML (eXtensible Markup Language) 的Ontology Language,可應用於不同異質系統之間的訊息交換。

(二)SHOE (Simple HTML Ontology Extensions, SHOE)
起源於馬里蘭大學College Park資訊科學系所的Understanding Systems Group所提出的SHOE計畫 (xml.coverpages.org)。SHOE是一種HTML的延伸語言,它允許網頁作者在他們的網頁文件中註解機器可讀取的語意知識。SHOE使得線上智慧代理人 (Intelligent Agent) 能更有效率地執行搜尋網頁和文件內有意義的資訊,這過程包含三個步驟:1.定義Ontology。2.使用HTML來註解Ontology知識及描述它們和其他網頁的關連。3.設計一個Agent使它可搜尋到語意網頁資訊 (Asunción & Corcho, 2002)。

(三)OML(Ontology Markup Language, OML)
是1998年8月由華盛頓大學所提出來的,其嘗試以XML的語法為基礎來表達Ontology,且其有部分是建立於SHOE (Simple HTML Ontology Extension) 的基礎上,也就是說,OML和SHOE有許多共有的特徵 (Asunción & Corcho, 2002)。

(四) 資源描述架構 (RDF , Resource Description Framework)& RDF Schema
是1999年2月由全球資訊網協會 (W3C) 主導所發展而成的一個架構,其提供一具有語意網路之機制,可用來描述網頁資源,允許資源描述機構訂定各自的控制詞彙,提供結構化的相互共容機制,RDF在語法上則是遵循XML。

(五)OIL(Ontology Inference Layer or Ontology Interchange Language, OIL),
是從On-To-Knowledge Project中所發展出來的一種Ontology表達語言,而這個Project是從1999年開始到現在,其成員是由業界及學術界所組成的。然而OIL之所以會被發展出來是為了能正確地去表達在Web上電腦可以存取有語意的資訊,而這些有語意的資訊必需能符合電腦可以存取的格式。而OIL的語法及語意是建構在已存在的一些標準語言上,如Open Knowledge Base Connectivity (OKBC)、XML-based Ontology Exchange Language (XOL)、Resource Description Framework (RDF) 等。目前可用以建構OIL Ontology的工具軟體有OntoEdit、OILEd,、WebODE和Protege2000 (Asunción & Corcho, 2002) (Fensel, 2000)。

(六)DAML+OIL
DAML (DARPA Agent Markup Language),是由美國國防部高等研究計畫局研發。為比RDF能更佳表達RDF Class的定義,在美國政府倡議的努力下,於2000年10月發行了DAML-ONT,這是一種符合 RDFS 的簡單語言。不久 DAML 小組為提供更加的功能服務,乃朝向結合Ontology Inference Layer (OIL) 而努力,使用人工智慧框架基礎 (Frame-based) 的架構。這些努力的結果即為後來發展的DAML+OIL。DAML+OIL是Web Resources中可以用來描述語意的Ontology標記語言。它是以W3C早期所制定的標準 (RDF及RDF Schema) 而建立的,且擴充了許多modelling primitives於此語言。DAML+OIL

所提供的Modelling Primitives,通常都是出自於Frame-based Languages裡。這樣的DAML+OIL Language是相當簡潔且容易來定義語意的。目前用以建構OIL Ontology的工具軟體如:OntoEdit, OILEd, WebODE和Protege2000,亦可以用來建構DAML+OIL Ontology (Asunción & Corcho, 2002) (Fensel, 2000)。

具體的建立一個ontology,可分為以下幾步驟:

(1)定義Ontology 中的Class(Class 指的就是概念);

(2)把這些Class 組織成一個層次化的結構,定義Class與Class 之間的階層關係 (Subclass- Superclass);

(3)定義Class中的屬性,填充Property 在相對應的Class上的值,並且說明對於屬性值的限制;

(4)將Instance的屬性值填入,定義Property 和描述這些Property 相對應的Class 限制。

 

 

亦有人提出利用Formal Concept Analysis自動產生Ontology:

採用Formal Concept Analysis理論做為文件推薦系統之即時建構本體論的方法,FCA為一種從資料集之中發現概念結構(Conceptual Structures)的資料分析理論,可以有效幫助本體論的發展
正規概念分析 (Formal Concept Analysis, FCA)

正規概念分析主要根據點陣理論(Lattice theory)建構出概念點陣(Concept lattices),而概念點陣是由領域本體(Domain ontology)中的本文(Context)之建構出來的,而本文是領域本體中的屬性(attribute)和物件(object)的集合所建構而來,由上述我們可以知道,正規概念分析(FCA)的建構步驟大致如下:
(1)建構本文
(2)建構概念點陣
而建構概念點陣的目的,是可以輔助本體的產生,具有越多相關物件的屬性,視為越重要,隸屬於越高的層級。 
例:
(1) 建構本文
(2) 建構概念點陣
流程步驟
STEP1:由資料庫中獲得資訊進行模糊正規概念分析,建構出模糊概念點陣。
STEP2:計算出概念間之相似度,進行模糊概念聚集,可得到聚集後之概念點陣。
STEP3:藉由聚集後之概念點陣,進而產生糢糊本體。
STEP4:將建構之糊模本體轉換為OWL語言,使本體可被其他應用程式所使用,進而建構出語意網之架構。
產生模糊本體的詳細流程
STEP1:將概念點陣中之屬性集合(intent)與物件集合(extent)分開。
STEP2:建立已分類概念間之關聯(屬性集合間之關聯)
STEP3:建立未分類概念間之關聯(物件集合與屬性集合間之關聯)
STEP4:藉由使用者新產生的查詢項目及伺服器新回傳之資訊,建構本體中的實例層,讓本體趨於完整。

手工建構本體論 (Ontology)

步驟:

1. 決定建構本體論的範圍

針對一個特定領域予以抽象化,在這個抽象內要包含什麼,應該是由本體論的應用和預期未來延伸來決定。

2. 考慮再使用 (Reuse) 已建構好的本體論

本體論 (Ontology) 經由許多人廣為的使用後,未來將會變得更廣泛地可取得,在定義一個本體論 (Ontology) 時,目前較少人是從零開始建構,而是從已經建構第三者去取得可以利用的本體論 (Ontology) 。

3. 列舉所有項目

(1) 寫下沒有結構的清單

(2) 列出所有要在本體論 (Ontology) 出現的相關項目 [1]

名詞形成類別名稱的基礎,而動詞 ( 或動詞片語 ) 是性質名稱的基礎,例如:「 is part of 」和「 has components 」

4. 定義分類

識別出相關項目後,這些項目必須以分類階層 (taxonomic hierarchy) 的方式組織起來,根據由上而下或是由下而上的方式來作,何者會比較有效率、可靠,造成不同的選擇。

5. 定義性質

當組織類別時,很自然地會去組織這些類別的性質。關係 subClassOf 的語意要求只要 A 是 B 的次類別,對 B 的樣例有效的每個性質敘述也必定應用到 A 的樣例。由於這個繼承性,將性質附加到所應用的階層中最高的類別是有意義的。

將性質加到類別時,就立即提供關於這些性質的定義域和值域的敘述,這個作法是可理解的。將更一般性的性質,並賦予定義域和值域,使得性質可以被次類別使用,或是經由繼承的方式,另外一方面,定義域和值域盡可能狹窄,好讓我們可以從定義域和值域的違反去偵測出本體論中潛在的不一致和錯誤概念。

6. 定義介面

本體論 (Ontology) 只需要 RDF Schema 所提供的表達性,而不使用任何 OWL 中多餘的原素。目前的步驟將改變這個,將前面定義的性質以片面加以充實:

(1) 基數 (Cardinality) :盡可能描述是否允許或需要具有確定數量的不同值的性質。例如:「至少 一個值」,「至多一個值」

(2) 必要值:

類別以某個性質具有特定值來予以定義,這種必要值在 OWL 可以用 owl:hasValue 來描述。有時候,若是需求是比較不嚴謹的:性質必需具有一個給定類別中的某些值。

(3) 關連的特性:對稱性、遞移性、相反、函數值。

7. 定義樣例

若是使用現存的本體論

8. 檢查異常

使用 OWL 勝過 RDFS 的有點是在本體論 (Ontology) 中或是在繁殖本體論的樣例集合中,偵測出不一致的可能性。

 

現存已發展的本體論:

1. 專家知識的系統化主體

美國國家癌症學術院

藝術和建築同義辭點

藝術家姓名聯合清單

圖像類別字彙

地理名程同義辭典

2. 整合的字彙

統一醫學語言 (Unified Medical Language System, UMLS)

3. 上層本體論 (Upper Ontology)

4. 主題的階層

5. 語言的資源

6. 本體論庫

 

 

知識工程師從零開始建構本體論:機器學習協助知識工程師,建議最重要的關係或檢查,並驗證所建構的知識庫。

 

 

使用半自動化的方法進行建構本體論 (Ontology) :

從資訊網上的現存資料抽取出本體論:從資訊網文件抽出的本體論為基模,機器學習系統在知識工程師的幫助之下,用資料和元知識作為輸入,產生可用的本體論做為輸出。

從資訊網上的現存資料抽取出關聯性資料和元資料:

本體論的充實或調整包含了現存本體論中自動地修改少數

用概念延伸的分析去融合和影射本體論:

用樣例資料的分析去維護本體論:

本體論樣例的抽取立足於給定的本體論基模之上,並取出資訊網文件中本體論的樣例。這個工作類似於資訊抽取和網頁註解,並可應用這些區域中發展出來的技術。

本體論的整合和航行是在處理大型機器可以學習的知識庫中的重建和航行。例如:改變機器學習者的命題層級知識庫成為第一階層知識庫。

 

 

觀察使用者以改進語意網應用:

1. 自然語言本體論 (Natural Language Ontologies, NUOs)

2. 領域本體論

領域本體論掌握住特定領域的知識,這些本體論提供一個源自限制領域之概念的詳細描述。領域本體論的獲取仍然由人類知識工程師去引導,自動學習技術在知識獲取扮演次要的角色,以統計方式在領域本文中找出有效的相依性,並建議給知識工程師。

3. 本體論樣例

當本體論停留不變時,本體論樣例可以自動產生,並時常更新。本體論樣例的學習工作非常適合機器學習的框架,機器學習演算法在此有幾個成功的應用,但是這些應用是嚴格地相依於領域本體論,或和任何領域理論無關的標記。給與領域本體論作為輸入從本文抽取本體論樣例的一般用途技術仍然尚未發展出來。除了可支援的本體論的不同型別之外,在本體論學習也有不同的使用