- 相關推薦
互操作聯(lián)邦數字圖書館研究
【內容提要】未來的圖書館將是聯(lián)邦數字圖書館,其目標是向用戶提供一個將異構、分布信息源無縫集成的視圖,實現(xiàn)對數字圖書館資源的透明訪問。文中首先介紹了研究數字圖書館互操作的必要性,在此基礎上重點分析討論了聯(lián)邦數字圖書館的實現(xiàn)方法,并對當前具有代表性的互操作聯(lián)邦數字圖書館的研究進行了綜述討論,最后簡單討論了目前建立互操作聯(lián)邦數字圖書館所面臨的挑戰(zhàn)及進一步研究和解決的問題。【摘要題】專題探討……
1 研究數字圖書館互操作的必要性
隨著在線數字圖書館(DLs)的日益增多,人們發(fā)現(xiàn)必須訪問許多DLs才能找到所需要的資料。由于大多數DLs是基于數據庫驅動的,現(xiàn)有流行的搜索引擎不能對其內容建立索引。因此,對于那些需要跨越多個DLs查找資料的用戶來說,搜索引擎不能滿足這種需求。如何將廣泛分布的、異構的DLs聯(lián)合起來向用戶提供統(tǒng)一的服務,即實現(xiàn)DLs之間的互操作,成為DLs研究與開發(fā)所關注的中心問題。
所謂數字圖書館的互操作是指交換和共享DLs的文檔、查詢和服務的能力[1]。它要求來自技術(協(xié)議和格式等)、內容(元數據及其語義等)和組織(DLs的基本訪問原則、支付方式和認證等)三方面的合作。DLs的互操作可以出現(xiàn)在不同的抽象層次上,我們可以將其概括為兩類視圖[1]:縱向視圖(verticalview)和橫向視圖(horizontalview)。前者涉及法律、社會、文化和知識產權等方面的問題,后者涉及DLs的硬件和軟件即體系結構方面的問題。
為什么要研究DLs的互操作?道理很簡單:目前很少有DLs既提供豐富的館藏資源,又提供有效的服務。盡管目前一些DLs擁有大量的館藏資源,而另外一些DLs卻提供許多的服務,但在這兩種情況下,用戶都不太容易找到其所需要的信息資源。只有在這些DLs之間實現(xiàn)互操作,才能共享DLs的資源和服務。因此,研究DLs的互操作是十分必要的。
2 聯(lián)邦數字圖書館的實現(xiàn)方法
為了解決用戶使用DLs查找資料時同一查詢條件的重復提交問題,人們提出了聯(lián)邦數字圖書館的概念。所謂聯(lián)邦數字圖書館是指正式或非正式合作操縱DLs的一些組織,它們同意支持一組共同的服務和標準,以便在聯(lián)盟成員之間共享DLs的資源,實現(xiàn)互操作。聯(lián)邦數字圖書館允許跨越不同的DLs執(zhí)行搜索,并將每個DLs的查詢結果合并后返回給用戶,使用戶感到如同使用單個數字圖書館一樣。從聯(lián)邦的耦合度考慮,實現(xiàn)聯(lián)邦數字圖書館的方法可分為以下三種:NCSTRL方法、Harvesting方法和搜集(Gathering)方法。
2.1 NCSTRL方法
網上計算機科學技術報告圖書館(NCSTRL)是一個擁有100多個機構加盟的聯(lián)邦數字圖書館[2],它利用Dienst作為DLs的協(xié)議和體系結構。凡是要求加入NCSTRL的機構需要在本地安裝Dienst服務器,并按照統(tǒng)一規(guī)定的數據格式建立其館藏資源。NCSTRL借助于分布式搜索技術在聯(lián)盟DLs之間實現(xiàn)資源共享,它將用戶的查詢送往參與聯(lián)邦的所有DLs上分別執(zhí)行,收集返回的結果,綜合整理后返回給用戶(圖1)。
附圖
圖1 NCSTRL方法
NCSTRL方法要求所有參與聯(lián)邦的DLs使用相同的協(xié)議或軟件系統(tǒng),因此能夠提供全面的互操作。但緊密的聯(lián)邦必將加重聯(lián)盟成員的負擔,它們不得不就技術標準和策略(如知識產權準則、安全和隱私等)達成一致。從網絡和搜索系統(tǒng)方面的限制考慮,NCSTRL是昂貴的運行模式,因為要求每個聯(lián)盟成員的DLs必須支持復雜的查詢語言和對查詢的快速實時響應。另外,從查詢的頻率、元數據的質量以及網絡資源的可用性等方面綜合考慮,這種實現(xiàn)聯(lián)邦的方法對聯(lián)盟成員加負較重。因此,只有那些需求強烈的DLs會采用這種代價較高的模式。
2.2 Harvesting方法
一臺計算機能夠自動地從其他計算機中收集并提取元數據的方法通常稱作Harvesting[3]。利用Harvesting方法建立聯(lián)邦數字圖書館的基本思想是:從每個DLs收集并提取元數據,經過處理、合并后集中保存在一個中心DL中,然后對保存在中心DL本地的元數據執(zhí)行搜索(圖2)。顯然,這種方法需要在中心DL維護一個所有DLs館藏元數據索引信息的副本,以便提供基于館藏元數據內容的查詢路由服務。
附圖
圖2 Harvesting方法
Harvest系統(tǒng)[4]是這種方法的代表,它包括一組從各個DLs館藏中搜集信息并建立基于主題內容索引的集成工具。Harvest體系結構主要包括兩部分:搜集者(gatherers)和代理(brokers)。每個搜集者從DLs館藏中搜集并提取索引信息。代理程序從一個或多個搜集者或其他代理檢索索引信息,并按增量方式對其進行更新。代理程序能夠為多個館藏建立集成索引,并提供一個查詢界面。
由于Harvesting方法采用集中處理方式,所以能夠保證有較好的查詢響應時間,但各DLs館藏元數據內容的變化不能及時得到反映。另外,Harvesting方法不要求嚴格遵守一組完整的技術協(xié)定,只要求做少許支持基本共享服務(如數據訪問)的工作。同NCSTRL方法相比,Harvesting方法提供的互操作性相應的要差一些,但對聯(lián)盟成員的要求卻很少。因此,許多組織可能會加入這種松散的DLs聯(lián)邦。
2.3 搜集(Gathering)方法
對于那些不能正式加盟的DLs組織,仍有可能通過搜集(Gathering)DLs可公開訪問信息的途徑獲得一定程度的互操作。這種聯(lián)邦方法通常提供統(tǒng)一的用戶界面,用戶輸入查詢請求,系統(tǒng)執(zhí)行分布式搜索,并將合并后的查詢結果返回給用戶。元數據蜘蛛(MetaCrawler)[5]是搜集方法的代表,它是由美國華盛頓大學實現(xiàn)的并行Web搜索服務。MetaCrawler提供一個智能接口界面,它能將用戶的查詢并行地送往多個搜索服務(如Lycos、Altavista和Yahoo等),并對返回的結果進行整理,篩除其中重復的內容,然后返回給用戶。MetaCrawler體系結構具有許多優(yōu)點,它在傳統(tǒng)的搜索服務之上提供一個抽象層,使其在Web增長和變化時具有較好的適應性、可伸縮性和便攜性。
利用搜集方法建立聯(lián)邦數字圖書館無須任何DLs直接參與合作,但所提供服務的質量比參與合作情況下的要差。同前面介紹的兩種方法相比,搜集方法所提供的互操作性最差。目前許多關于Web的研究可視為在這個層次上添加功能,這將會提供更有效的互操作性。盡管期望整個Web表現(xiàn)出豐富的語義不太現(xiàn)實,但是人們還是期望著通過搜集方法提供服務的水平能夠逐步地得到改善。
上述三種聯(lián)邦方法中,NCSTRL方法通過使用相同的協(xié)議或軟件系統(tǒng)來消除DLs之間的異構問題,因此可以實現(xiàn)全面的互操作。而對現(xiàn)有的DLs來說,Harvesting方法是比較現(xiàn)實的建立聯(lián)邦數字圖書
【互操作聯(lián)邦數字圖書館研究】相關文章:
TD—LTE與TD—SCDMA雙網互操作04-30
我國高校數字圖書館服務對策探析06-07
談舞蹈體態(tài)與音樂聲態(tài)的互滲互釋論文06-26
高校圖書館數字資源建設中存在的問題分析(精選5篇)04-22
研究分析醫(yī)院圖書館在臨床及科研信息服務中的作用論文07-28
互文性理論視角下《黃帝內經》的英譯08-27
數字時鐘論文提綱06-23
談數字IC設計技術08-25