糯米文學吧

位置:首頁 > 設計 > 網頁設計

基於語義Web的旅遊信息服務的研究與應用

摘 要 本文提出了一種基於語義Web的旅遊信息服務應用的新架構,並給出了實現此服務應用的構建方法。該方法通過本體來增強服務描述語義,利用OWL本體描述語言來表示旅遊本體的語義信息,通過基於本體的描述邏輯的推理有效地實現旅遊信息的語義化查詢和智能化服務。

基於語義Web的旅遊信息服務的研究與應用

關鍵詞 語義Web;本體;OWL;推理

1 引言

近年來,Web的發展日新月異,已經成為一個巨大的全球化信息資源庫。網絡信息資源數量飛速增長,網絡信息資源組織呈現多種模式並存的局面。專家學者們在嘗試了多種提高網絡信息資源組織質量,改進檢索效率的措施之後,正嘗試綜合運用不同層次的元數據模型來構建語義Web,使Web文檔的語義能清晰地體現出來,併為檢索程序所理解。而傳統的旅遊信息系統是在數據庫系統的基礎上發展起來的,歐洲在這方面有許多成功的例子,比較著名的有奧地利帝羅爾信息系統,瑞士阿彭策爾信息系統等[1]。這些系統功能強大,涵蓋了旅遊業的食、宿、行、導、購遊等各項服務功能,但隨着旅遊服務信息和服務需求信息的幾何級數的速度增長,基於傳統的旅遊信息查詢已不能適應當前旅遊者對旅遊信息的快速多變化的需求增長,在此基礎上,本文結合目前語義Web技術的新發展,提出了一種基於語義web的旅遊信息服務的新構建,其在Web系統中增加機器可理解的語義內容,實現了語義信息的推理查詢,有效地提高了旅遊信息查詢的廣度和準確度。

2 語義Web的相關技術

2000年Berners_Lee在XML2000會議上正式提出Sematic Web[2],它的基本思想就是通過在Web信息的創作和發佈中嵌入機器可閲讀的、代表某類知識的標註,使Web上的數據不僅被機器顯示,而且能夠被機器理解,使網絡中儘可能多的信息都具有語義的表達。語義Web的體系結構 [2]包括有七層,自下而上各層功能逐漸增強。

2.1語義Web中的本體

本體是對共享的概念化進行形式的顯式規範説明[3]。通俗地講,本體是用來描述某個領域甚至更廣範圍內的概念以及概念之間的關係,使得這些概念和關係在共享的範圍內具有大家共同認可的、明確的、唯一的定義。通過構造領域本體知識庫為信息源提供必要的語義信息,使系統對領域的概念、概念之間的聯繫及領域內的基本公理知識有一個統一的認識,進一步實現Web信息的智能化推理,提高系統的智能性和精確性。目前本體已經被廣泛應用於語義Web 、智能檢索、信息集成等領域[4]。

2.2 語義Web的本體建模語言

2004年,W3C提出OWL作為對本體描述的語言。它有三個表達能力遞增的子語言:OWL Lite、OWL DL和OWL Full 。考慮到實際應用在知識表達能力和推理能力較強和保證推理的可判定性兩個方面的要求,選擇OWL DL作為本應用的本體表示語言。

2.3 本體的構建工具

目前的本體構建工具有Ontolingua[5],WebOnto[6],OntoSaurus[7],Protege_2000[8],WebODE[9],OntoEdit[10]等。藉助這些工具,可以把精力集中在旅遊本體信息的組織上,而不必瞭解本體描述語言的複雜語法細節,避免了很多錯誤的發生,更方便我們對本體的構建。本應用中,我們採用Protege2000作為該旅遊信息本體的構建工具。Protege2000是美國Stanford大學開發的本體編輯器,它用Java開發是一個開源的項目,以OWL插件的形式支持OWL格式的本體,此OWL插件用Jena包支持OWL文檔的讀取。

2.4 推理的應用

Jena是一個為語義網應用設計的一個Java API,專門用來構建語義網的應用軟件,它為RDF、RDFS和OWL提供了一個可編程實現的環境。推理功能是Jena中的一個重要子系統,用來實現本體信息的智能推理。

3 語義Web的旅遊服務應用實例

圖1的本體信息中,實箭頭表示實例,虛箭頭表示屬性關係,其中有部門機構、省市、旅遊景點、旅店等四個本體的部分信息,當有一遊客需要了解桂林的景點名山時,傳統的做法是建立數據庫系統進行管理,但基於關鍵字的查詢有時是不能滿足的,此時系統可能通過旅遊景點的實例信息七星公園和象山公園來找到駱駝山和象鼻山,由於獨秀峯並不存在於景點的具體實例中,此時就查詢不到獨秀峯。然而我們知道廣西師大內有一座獨秀峯,同時獨秀峯也是旅遊景點的一個子類,則可以認為廣西師大也作為一景點實例。通過語義Web,利用Jena推理機進行語義查詢,返回獨秀峯作為查詢結果提交給用户。同時,當要查找桂林市內旅店時,不僅可以通過旅店的實例查詢到帝苑酒店和桂林賓館,此外,廣西師大內設有學校招待所,而招待所同時也是旅店的一個子類,所以認為廣西師大也可作為旅店實例,並把學校招待所也作為查詢結果返回給用户。而且當我們要統計桂林市區內的旅遊景點時由於廣西師大和旅遊景點並無直接實例關係,藉助傳統的數據庫系統無法得出獨秀峯也是秀峯區的一個旅遊景點。而通過構建語義Web,我們知道廣西師大內獨秀峯是一旅遊景點子類,自然也認為廣西師大屬於旅遊景點,同時廣西師大又位於秀峯區,通過本體和Jena推理機的應用可以方便的'查找到秀峯區下有一景點為廣西師範大學,這樣利用語義Web可以更全面更準確的查找到更多相關的旅遊信息。

4 基於語義Web的旅遊服務系統

4.1 基本功能結構

系統包括如圖2所示7個基本功能模塊。

信息統計分析:如指定範圍的旅遊景點數,旅遊景區的分佈,各旅遊景區的旅遊流情況,旅遊景區的分類等。

語義描述模塊:負責對指定的信息資源(如非結構化、半結構化、結構化)將相關領域的本體類、語義屬性、語義關係以及語義規則用OWL進行旅遊信息的語義描述。

語義提取模塊:本應用選取指定的幾個有名的旅遊信息網站作為輔助信息源,結合語義描述模塊對其中旅遊信息進行語義提取,將最終結果轉化為OWL格式文件。

語義存儲模塊:主要負責將OWL所描述的信息資源與Protege構建的旅遊本體庫一起存儲到MySql數據庫中。

語義查詢模塊:主要負責基於語義的旅遊信息查詢。

語義輸出模塊:主要負責將旅遊信息本體類、語義屬性、語義關係及由此推理得到的隱藏信息以一定的方式呈現給用户。可通過與本體類、語義屬性定義的子系統的接口以及推理查詢子系統的接口來獲得。

系統維護管理模塊:主要是系統本體數據庫建立、編輯與更新,以及系統的界面修改和文件管理等。

4.2 基於語義的推理查詢

基於語義Web的旅遊信息服務應用最重要的一個功能就是在系統中使用了基於本體的語義推理查詢,由於使用本體作為檢索系統的語義核心,充分利用其在知識表示和語義描述上的特性和優點,將語義處理結合到應用模型中去,利用Jena推理機結合自定義的規則庫進行更廣泛的推理,很好的實現信息查詢的智能化。基於語義的推理查詢可實現如下子查詢:

周邊信息查詢:查詢從指定地點周邊指定距離內的旅遊資源、公共服務設施及企事業單位。用户可以對某一地點對其周邊指定範圍內的指定資源類別進行查詢分析,如對桂林市區“灕江”周邊“2000米”範圍內的“四星級的景點”進行查詢分析,得到了七星公園、象山公園、伏波山、疊彩山等4條查詢結果,點擊其中一條即可顯示出其相關旅遊信息。

最近信息查找:查詢離指定地點最近的旅遊資源、公共服務設施及企事業單位。用户可對某一地點查詢距離其最近的一類指定資源類別,並顯示其查詢結果和相關旅遊信息。如我們要查詢距離“廣西師大”最近的“四星級景點”,推理查詢後得到“伏波山”1條查詢結果。

高級查詢:系統提供給用户多種選擇信息進行自動匹配並推理查找出條件相符的各類信息。由於本應用中的各種查詢都要利用部署在接口與本體之間的推理機,通過推理機對查詢的語言進行規範統一的處理後,根據本體中內容之間的邏輯關係推理出備選的答案。

4.3 系統實現

4.3.1系統模型架構

本系統採用B/S模式,所用軟件包均是基於 Java環境的開源項目,具有很好的移植性和開放性。該系統利用“旅遊信息本體庫”為用户提供基於本體的語義信息檢索,採用可視化的界面和多種方式的查詢入口,實現基於語義的智能信息查詢。系統模型架構如圖3所示。

用户端界面作為系統的門户,包括信息錄入、顯示和查詢等操作,它為用户通過瀏覽器訪問信息系統提供了一個基於Web的接口。用户通過瀏覽窗口提交服務請求給HTTP服務器,HTTP服務器從消息中解析出查詢請求,轉發請求給服務器端的Web服務器,Web服務器把請求交給Servlet服務器組件,調用javaBean通過內部推理機,搜索本體數據庫中的信息。Web服務器把推理查詢的結果遞交給HTTP服務器,再由HTTP服務器把結果包裝成SOAP消息發送給用户。

4.3.2本體信息數據庫

本體數據庫中存儲的是相關的旅遊本體信息,是整個系統的基石。

圖4中對旅遊領域相關的非結構化、半結構化和結構化信息進行語義實體和語義關係的抽取,結合構建好的領域本體庫一併置入語義本體數據庫中。我們將語義本體庫存儲在MySql關係數據庫中,使用關係數據庫的表結構來存儲本體庫中的三元數據。由於“旅遊本體庫”是用Protege作為工具開發的,因此本體庫最初的存儲方式是OWL文件,這裏需要利用OwlFile2DB類來將本體數據庫裝載到數據庫中去。基於數據庫的本體存儲方式比文件存儲方式能處理更大的本體庫模型,而且不需要顯式的保存數據模型,效率更高,但是需要複雜的數據庫配置。但對於大多數應用來説,數據庫方式是必要的。所以本應用採用了這種方式。

4.3.3推理查詢模塊

應用中的本體信息查詢是基於語義Web技術的發展,考慮到查詢用户的特性以控制查詢過程,通過使用一些描述邏輯語言,對大量的領域信息和網絡資源使用邏輯表述進行唯一規範化的合理解析,並使用語義精確方法與本體數據庫中的術語相關聯,利用本體庫中的術語及術語之間的關係來建立用户查詢界面,系統將用户的選擇包含到查詢串中,對本體數據庫中的旅遊信息進行語義查詢我們還需要利用Jena推理機來實現此功能。首先,把圖1中所有用到的與旅遊相關的概念、關係和實例用Protege工具構建好,以OWL的形式存儲到MySql數據庫中。對於選定的一些輔助網絡資源,通過本體發現、本體映射等方法進行語義實體及語義關係的發現和抽取並將結果以OWL的形式存儲到語義本體數據庫中。第二,根據查詢需要構造本體規則庫:如:

Rule1:(?x hasHill ?y),(?y isSubClassOf ?z) (?x isSubClass ?z)

Rule2:(?x hasHill ?y),(?x locateIn ?z) (?Y locateIn ?z)

Rule3:(?x hasHotel ?y),(?y isSubClassOf ?z) (?x isSubClassOf ?z)

Rule1説明如果某部門機構x內有一座山y,而y屬於旅遊景點z,則x也屬於旅遊景點z的子類。Rule2説明如果某部門機構x內有一座山y,x位於城區z,則y也位於城區z。Rule3説明如果某部門機構x設有招待所y,而y屬於旅店z,則x也屬於旅店z。第三,把建立好的規則庫放入Jena推理機中,基於前面建立的本體信息數據庫進行推理,可以很方便的推理查詢出更多更精確的旅遊信息。

本應用系統利用本體把語義信息加入到檢索中,實現了描述邏輯推理過程的優化,實現了語義Web的推理查詢方法。實際應用表明,該方法能夠以一種明確的、形式化的方式來表示領域知識,促進知識共享的實現和智能性檢索技術的應用。

5 結束語

基於語義Web的系統構建是未來網絡發展的必然趨勢。我們知道本體是語義Web中最關鍵的技術,它使得Web上的信息共享和重用成為可能。但當前的本體編輯工具發展得還不成熟。要使得本體編輯工具得到更廣泛的應用,還應在界面化、功能完善、推理支持和與其它的開發工具結合上更進一步。同時本體集成、映射方法還很不成熟。雖然語義Web技術的研究取得了很大的發展,但是Intenet上基於本體的語義的應用卻不能得到很好的實現,使得信息的共享查詢不能很好的在各個領域中得以交融,這些都有待我們做更進一步的深入研究。

參考文獻

[1] 黃怡然,黃杏元.基於Internet的旅遊信息系統研究[J].計算機應用研究,2000,15(1):114-117

[2] Lee T B,Hendler J,Lassila semantic Web[J]ntific A merican,2001,284(5)

[3] Gruber T.A translation approach to portable ontology specifications[J]ledge Acquisition Acquisition,1993,5:199-200

[4] Deng ZH,Tang SW,Zhang M,Yang DQ,Chen viewof ontoloty[M] Scientiarrum Naturalium Universitatis Pekinensis,2002,38(5):730-738

[5] Farquhar A,Fikes R,Rice J. The Ontoling server:A tool for collaborative ontology construction[J]. Int’l Journal ofHuman-Computer Studies,1997,46(6):707-727

[6] Duineveld AJ,Stoter R,Weiden MR. Wonder tools? A comparative study of ontological engineering tools[J]. Int’l Journal of Human-Computer Studies,2000,52(6):1111-1133

[7] Swartout B,Ramesh rd distributed use of large scale ontologies[C]: the AAAI Symp. on OntologicalEngineering. :// KAW /KAW96/swartout/Banff_96_final_

[8] Noy NF,Fergerson RW,Musen MA. The knowledge model of protégé-2000:Combinining interoperability and flexibility[C]. In:Dieng R,Corby O,eds. Proc. of the EKAW2000. Heidelberg:Springer-Verlag,2000. 17-32

[9] Arpirez JC,Corcho O,. WebODE:A scalable ontological engineering workbench[C]. In:Gil Y,MusenM,Shavlik J,eds. Proc. of the K-CAP York:ACM Press,2001. 6-13

[10] Sure Y,Angele J,Erdmann M,Staab S,Studer R,Wenke D. OntoEdit:Collaborative ontolo-gy engineering for the semantic Web[C]:Horrocks I,Hendler JA,eds. Proc. of the ISWC 2002. Heidelberg:Springer-Verlag,2002. 221-235

標籤:web 語義 旅遊 服務