- 相關推薦
聚集學術機構知識的中心:機構庫(Institutional Repository)探析
1 引言
早在1988年,Peter Drucker就在《即將到來的新組織》一書中預言,“對一個組織來說,最重要的是該組織所擁有的知識資源,對其加以有效管理是組織成功的最關鍵因素!盵1]學術機構是人才和知識的集中地,收集、管理、利用其成員在學術科研等多方面的高質量數字信息資源,對增強機構實力、贏取競爭優勢等都具有重要意義。時至今日,各學術機構成員可在互聯網上以各種方式發表、傳播和交流學術信息,這給組織、管理這部分信息帶來了相當大的困難的同時,傳統出版模式的局限性也日趨明顯,不利于學術交流的開展。有鑒于此,2001年,俄亥俄州立大學的高級行政官員和該館館長布蘭寧(Joseph J.Branin)在探討開開發遠程教育體系時,提出并著手建立俄亥俄州立大學知識庫(Ohio State University Knowledge Bank),以保存該校師生員工的數字知識資源,這也成為機構庫(Institutional Repository,以下簡稱IR)最初的雛形。2002年,麻省理工大學(Massachusetts Institute of Technology,MIT)和惠普公司(Hewlett-Packard Corporation)合作推出DSpace,宣告IR的正式誕生。同年,在“第六屆歐洲數字圖書館先進技術研討會”上,MacKenzie Smith做了《DSpace:來自MIT圖書館和惠普實驗室的機構庫》的學術報告,詳細介紹了DSpace的構建原理、運行情況及在開放學術交流和數字資源長期保存中的重要作用[2],這一報告引起了各國學者的關注,也促成了世界范圍內關于IR的大規模理論與實踐研究。
2 機構庫的定義
關于IR,目前尚無統一的定義,比較有代表性的兩種觀點是:
(1)美國網絡信息聯盟(Coalition for Networked Information)的常務董事Clifford Lynch認為,IR是指大學為方便其共同體組織、整理、存儲和利用師生員工相關的數字知識資源而提供的一系列服務[3]。此定義強調IR的目的是為用戶提供一系列服務,但服務對象局限于IR所屬的機構成員,服務的目的是協助大學共同體組織、利用其師生員工的數字知識資源。
(2)加拿大研究圖書館協會(Canadian Association of Research Libraries,CARL)則提出,所謂IR就是指搜集、存儲學術機構成員的知識資源,并提供檢索的數字知識庫,同時認為IR可以作為一個全球知識庫的子庫,為世界范圍內的網絡用戶服務[4]。此定義認為IR是一個聚集數字信息資源的知識庫,其資源對任何國家的所有網絡用戶開放,但該定義遺漏了一個重要的內容,即IR中的絕大部分資源可免費獲取。
據此,筆者認為:所謂IR,就是以搜集、組織、存儲學術機構(大學、大學共同體等)相關數字知識資源為主要任務,并將其中絕大部分資源對任何網絡用戶免費開放的知識庫。
3 機構庫產生的原因及其主要特點
2.1 機構庫產生的原因
IR之所以在人類剛跨進21世紀的時候興起,原因是多方面的,但最為根本的原因在于:
(1)網絡給信息組織帶來的困難。網絡環境下,學術機構成員可以通過各種方式(如個人網站、blog等)在互聯網上發表、傳遞各種學術信息資源,據MIT的統計數據表示,43%的學者會把預印本(preprint)上載到個人網站上,60%的人則通過e-mail傳遞預印本文獻[5]。發表、傳遞方式的多樣性雖然在一定程度上促進了學術交流,但由于這些方式的隨意性太強,使得搜集、組織、存儲、利用某一學術機構的知識資源就相當困難,給相關機構造成難以估量的損失。這也是建立IR最根本的原因。
(2)傳統的期刊出版模式帶來了學術交流障礙。近年來,隨著出版機構的兼并和商業化,期刊價格大幅度攀升,大大超過了圖書館經費所能承受的范圍。美國研究圖書館協會(Association of Research Libraries,ARL)的統計表明,在1986-2000年之間,科學、技術和醫學方面的學術期刊價格增長了226%,同期商品零售價格指數增長幅度為57%,在此期間,圖書館購買期刊的經費增長了192%,但購買的期刊品種卻下降了7%[6]。雖然圖書館也嘗試通過館際互借、加大數據庫的購買力度、遠程文獻傳遞等措施來緩解經費短缺的壓力,但效果并不理想,也沒有從根本上解決學術交流的問題,從而促使人們思考傳統的期刊出版模式之不足,并探討新的方式以促進學術交流。
(3)網格技術和開放源代碼的推動。網格計算源于元計算(Metacomputing),其初衷是將分布的多臺超級計算機連接成為一個可遠程控制和訪問的元計算系統,網格體系根據高速和共享兩大特征,正在不斷向基于更大的網、共享更多的資源、構建更大的計算能力的目標邁進。網格技術將有助于解決大并發量訪問、海量信息檢索以及資源共享等方面的技術問題。而開放源代碼的意義則在于將人類大量寶貴的創造力從“重復創造”中解放出來。近年來,開放源代碼在數字圖書館領域的應用已經相當普遍。美國的OCLC,英國的UKOLN,以及新西蘭的DL項目都是圖情領域推動開放源代碼應用的代表[7]。網格技術和開放源代碼為IR的建立奠定了關鍵的技術基礎,使IR思想的實現和快速發展成為可能。
3.2 機構庫的特點
(1)綜合性。IR不僅包括常見的研究性學術資源,如期刊論文、電子預印文本、技術報告、會議論文、學位論文、數據庫及數字圖書館資源,還包括部分學術數據庫所不收錄但又具有較高價值的資源,如工作文件、圖像、音頻和視頻文件、學習資料等[8]。這樣IR即可全面系統地反映所屬學術機構的教學和科研成果,不僅有利于分析自身教學、科研的優勢與不足,衡量現有的研究水平和明確今后的發展方向,還可作為對外展示其綜合實力的窗口,以提高該學術機構的知名度和影響力。
(2)開放性。進入新世紀以后,實現學術資源、科研成果的開放共享已經成為國際潮流。IR以其開放性的特點成為開放共享運動中的弄潮兒,IR對世界范圍內的所有用戶不抱任何偏見,任何用戶隨時都可以通過互聯網不受限制地合理利用其中的知識資源,這既利于本領域學者之間的學術交流,也利于其他學科研究者跨學科獲取知識與信息,更重要的是它打破了國家界限,特別是有助于發展中國家的科學研究者追蹤世界著名學府研究的最新發展,從一定程度上縮小發展中國家與發達國家之間的知識鴻溝。
(3)動態性。一般來說,信息一旦輸入數據庫就不再發生變化,IR則不同,為了使最新研究成果能在最短的時間內發布,提交者可根據自己的最新研究隨時修改、更新之前提交給IR的信息,使IR體現出明顯的動態性特點。這一特點雖然可以加快學術交流的速度,但也有可能使IR中的內容更迭過于頻繁,對其穩定性產生負面影響。
4 國內外相關項目簡介
近兩年來,隨著各學術機構對IR的日益重視,IR的建設也取得了初步成效,現選取其中具有代表性的3個項目介紹如下:
4.1 DSpace
2000年3月,惠普公司出資1800萬美元,與MIT圖書館合作開發DSpace,2002年11月,DSpace正式面世并迅速成為一個由劍橋大學、哥倫比亞大學等七家著名學府直接參與的聯合機構庫。DSpace是目前全球最有影響力的機構庫,其收錄的信息資源主要包括研究報告、數據庫、音頻和視頻文件以及其他格式的MIT認為確實重要的文件,但不收錄MIT學生的研究資料、機構記錄以及非MIT教師的研究成果等。DSpace提供一系列遵循開放檔案信息系統參考模式(Reference Model for an Open Archival Information System)的上載、管理、傳播數字信息的工具,并使用DC、OpenURL與OAI-PHM等一系列開放標準,因而成為其他機構開發IR的首選軟件,據統計,在成立后不到一年就已經有3500家來自全球的機構下載了DSpace的開放源代碼[9]。因此可以說DSpace是一個搜集、管理、標引、傳播數字信息的系統、工具和平臺。
DSpace的垂直體系結構包括三級層次:存儲層、事務邏輯層和應用層,每一層都內嵌API(Application Programming Interface),方便系統的升級,同時也使其他大學在開發IR時能根據實際情況調整相關部分,提高DSpace的靈活性。存儲層的主要功能是存儲數字化信息,事務邏輯層是整個系統的核心部分,主要包括工作流管理模塊、內容管理模塊、檢索和瀏覽模塊,這些子模塊也都相應地嵌有API;應用層則主要作為用戶檢索信息的界面[10-11]。
4.2 CARL機構庫導航項目
CARL機構庫導航項目(The CARL Institutional Repositories Pilot Project)由加拿大12所大學于2002年發起建設,目前主要由西蒙·弗雷澤大學、多倫多大學等5所大學圖書館負責操作管理,導航項目旨在通過聯合加拿大眾多學術機構的知識庫,提高加拿大學術機構及研究人員的曝光度和影響力,同時,通過實踐操作為加拿大其他機構開發IR提供經驗。2004年,西蒙·弗雷澤大學推出名為“CARL收割機”(The CARL Harvester)的搜索引擎,作為導航項目檢索服務的操作界面,通過此界面任何國家的用戶都可以免費檢索其中的資源。目前該搜索引擎已經收錄了來自馬尼托巴大學等9個IR的4493條記錄并保持每日更新,提供簡單檢索、高級檢索和分類瀏覽等3項檢索功能,用戶可按任意詞、作者、題名、摘要、索引號、日期、語種等多種途徑查找所需信息[12-13)。
4.3 學術信息庫
為推進香港中文大學(The Chinese University of Hong Kong,CUHK)印刷文獻的數字化進程,加強圖書館的電子導航功能,CUHK圖書館于2004年夏天開始建設學術信息庫(Scholarly Information Repository,SIR),SIR以盡可能多地收錄CUHK共同體成員出版物信息為目標,收錄的文獻種類包括學校出版物、各院系及教師出版物、教師工作文檔、期刊論文、報紙、書籍、書籍篇章、學位論文、會議論文、技術報告以及專利信息,除提供引文和簡單著錄信息之外,還盡可能地提供全文的鏈接。
提交者通過SIR系統中的“引文輸入系統”輸入出版物的詳細信息,這部分信息在傳遞給SIR系統的同時,還會傳送給研究與科技管理局中的在線出版輸入系統,SIR的檢索界面則允許用戶瀏覽和檢索所需信息,并在結果中提供圖書館所購買的電子資源、互聯網上免費和有償電子資源的鏈接[14]。
共2頁: 1
論文出處(作者):5 現階段存在的主要問題
5.1 知識產權的保護
IR中包含多種類型的信息資源,因此相應的知識產權問題也比較復雜,目前爭論的焦點主要集中在學術論文發表于傳統期刊之后版權歸誰所有的問題上。在傳統的出版模式下,當作者愿意將其研究成果發表在某一份學術期刊上時,就已經將版權交給出版社或者說同意出版社擁有“排他性許可”(exclusive licence)出版的權利。這樣一來,IR收錄這些已經發表的學術論文就會構成侵權。但大部分作者并不認同此類規定,據RoMEO(Rights Metadata for Open archiving)的調查顯示,61%的作者認為機構應該保留論文的版權,90%的人也確實將版權交給所屬的機構[15]。隨著作者和學術機構對擁有版權的呼聲日益強烈,這一問題正在向有利于IR的方向發展,如在2003年,《Nature》出版集團允許作者“可以重新利用他們發表在紙制期刊上的論文,可以將論文的電子版上載到其個人網站(非商業目的),可以重新利用論文中的數據和表格”等,但同時也明確規定,作者不能將論文提交給開放性檔案網站(open archival website)。最近《Nature》出臺新的規定,允許作者在論文刊出6個月后將電子版提交給IR,條件是在記錄中提供雜志社網站的鏈接[16]。
對于IR來說,關鍵的是應該在向公眾開放信息的同時盡可能地保護知識產權所有者的利益,至少須確保IR不是有意侵犯版權或其他知識產權。因此,許多IR都要求作者提交資源時能保證其為版權所有者,且不會涉及到除作者和IR以外的第三方,或者要求作者在提交資源時將部分知識產權轉交給IR,如DSpaee就在其軟件包中包括“非排他性分發許可”(Non-Exclusive Distribution Licence)協議,要求提交者允許IR在不改變論文內容的情況下以各種格式在多種媒體上將其復制、翻譯和傳播。SIR則認為版權歸學校及其作者所有,學校和作者都希望能擴大研究成果的傳播范圍,因此SIR盡量滿足用戶出于研究目的的全文檢索需求。不過Lynch認為不管IR以何種方式來規避侵犯知識產權,大學或大學共同體以IR的形式來擁有或控制知識資源這一行為本身的合法性就值得商榷[17];類似于《Nature》的期刊出版商也只是少數一部分,RoMEO的統計表明這類出版商只占4%,而90%的出版商要求作者在發表論文時將版權移交給出版商。因此,令出版商、IR、作者等多方實體均能接受的知識產權保護辦法尚待探討。
5.2 經費的預算與管理
IR的開發、運行經費受諸多因素的影響,首先就是員工薪水問題,結構庫不僅需要技術人員開發、調試、維護系統,還需要大量的非技術人員保證IR的正常運轉;其次是設備問題,主要包括系統開發和升級等所需軟、硬件的選擇,如網絡服務器和數據庫的選用等;此外,運行經費還受到用戶培訓、所屬學術機構的管理策略、專業設置、機構變動(如機構合并)等外部因素的影響。這些都會給經費帶來不確定的因素,從而影響經費預算和管理的準確性。學術機構逐漸認識到IR經費預算與管理的重要性,并在實踐中采取一定的措施對經費加以控制,如DSpace邀請圖書館館員參與IR的建設,依靠他們已有的相關專業基礎進行用戶培訓、資源建設等工作,以降低成本;羅徹斯特大學則要求圖書館館員抽出1/3的工作時間來為IR服務。但效果并不能令人十分滿意,IR的開發、運行經費依然高昂,如MIT每年在IR上花費28.5萬美元,皇后大學每年僅支付員工薪水就需要10萬加元[18]。這種狀況可能導致決策者對IR信任值和支持度的降低、部分工作無法按計劃進行等問題,給IR的平穩發展及在世界各國尤其是發展中國家的普及帶來負面影響。因此,有必要對如何建立一個科學、合理的經費預算與管理體系加以研究探索。
5.3 質量的控制與評價
質量是IR的生命線,如果IR中充斥的都是價值不高甚至垃圾信息,不僅會造成人力、物力等資源的浪費,還會損害學術機構的聲譽。因此,如何保證IR中信息資源的質量是IR必須面對的一大挑戰。
傳統學術期刊在長期的發展過程中形成了一整套的質量控制與評價機制,如專家評審或同行評議制度。這些機制對IR中信息質量的控制與評價有一定的參考價值,但IR不僅包括已在傳統學術期刊上發表的學術性論文,還包括大量未發表的preprint、學習資料、工作文件等,不同類型的資源有不同的質量評定方法。故完全借鑒傳統學術期刊的做法是行不通的,必須針對不同類型的資源擬定與之相適應的質量控制和評價體制。但由于IR的理論與實踐研究尚處于初級階段,研究重點主要集中在系統構建和資源建設等方面,對IR中信息資源的質量控制關注不多,也沒有建立全面、系統的質量控制評價體系,目前部分項目僅通過一些簡單的方法對質量加以初步控制,如對提交者、提交的文件類型和格式進行限定等,DSpace就不收錄學生的研究成果、機構記錄、非MIT教師的研究成果等。但這樣并不能夠確保IR的質量,同時,一部分有價值的信息會被排除在外,不利于真實反映一個學術機構的整體實力。
5.4 其他問題
除上述三個主要問題之外,IR還面臨穩定性、元數據等方面的問題,其中,穩定性主要受兩個因素的影響,一是所屬機構是否在戰略上和經濟上給予支持,Lynch認為學術機構經常會發生變化,如開設新的學院或研究中心、關閉部分夕陽專業、與其他機構合并等,這些都有可能使其對IR的戰略支持或經濟支持發生變化,因此,IR的建設有必要爭取機構高層領導的支持,并且需制定長期的發展計劃,以減少上述變化帶來的負面影響[19]。其次就是IR中的知識資源能否長期保存,資源的長期保存是長期開放的基礎,目前IR中包含大量不同格式的資源,給其長期保存增雖不穩定性因素,James就認為IR應該適時預見多格式知識資源給長期保存帶來的風險[20]。此外,IR動態性的特點、組織者的管理策略、元數據等都會對知識資源的長期保存產生影響。
元數據方面的問題主要是不同資源的元數據之間存在矛盾,在IR中,不同的資源可能采用不同的DC元素;信息提交者在自我存檔(self-archiving)時也有可能使用不規范的DC元數據;基于不同軟件開發而成的IR所確定的元數據也有可能存在差異,不利于聯合多個IR(如CARL機構庫導航項目)提供集成服務。目前,有關機構對此已采取了相應措施,如DSpace使用標準DC元數據來描述信息,在提交資源時只有題名、語種、提交日期等三項信息必須提供,其余如文摘、關鍵詞等均為選擇性提供。CARL也正在討淪起草“國家機構庫元數據文件”(National Metadata Profile for institutional repositories)[21],力求規范IR中的元數據,進一步推進資源共享。
6 圖書館應如何面對機構庫帶來的機遇與挑戰
在學術期刊出版市場日益商業化的今天,圖書館經費捉襟見肘,而IR的發展,則給圖書館帶來了難得的機會,它沖擊著傳統的出版模式,有利于減少圖書館經費短缺的壓力,擴大了圖書館的發展空間;但是,我們也應該看到,IR充分利用一切可運用的技術手段,收集多種類型的知識資源,并將其中的絕大部分免費向所有網絡用戶開放,給圖書館在信息服務、學術交流中的中心地位帶來了強有力的沖擊。圖書館要確保現有地位并有所發展,就必須發揮自身優勢,積極面對來自IR的機遇與挑戰:(1)整合資源,義不容辭,圖書館擁有的豐富信息資源無疑是網絡中的寶貴資源,但無序的信息只會讓用戶淹沒在信息的海洋中而無法找到所需信息,IR的出現讓圖書館認識到整合信息資源,尤其是知識資源(如學術機構、實驗室形成的知識資源)的重要意義,同時,IR還能減輕圖書館經費短缺的壓力,使得圖書館有更多的人力、物力、財力進行資源的整合,因此圖書館應抓住機遇,大力推進信息資源的有效整合,為圖書館提高信息服務水平奠定基礎;(2)積極參與,互助雙贏,當前,圖書館在數字圖書館的研究與實踐中,有很多思路與IR不謀而合。比如,IR的目的之一就是實現資源的高度開放與共享,促進學術交流,而圖書館界一直在提倡和實踐信息資源的共建共享。因此,圖書館應積極參與IR的建設,利用其在信息組織、信息標引等方面的專業優勢以及數字圖書館建設中的經驗與教訓,為IR的順利建設保駕護航,而圖書館通過參與IR的建設,有機會親身了解、學習最新的信息技術、全新的信息服務模式,從而有利于促進圖書館的創新、改革和整體水平的提高。
【參考文獻】
1 Drucker,Peter.The Coming of the New Organization.Harvard Business Review on Knowledge Management.Harvard Business School Press,Cambridge,MA,1988
2 MacKenzie Smith.DSpace:An institutional repository from the MIT Libraries and Hewlett Packard Laboratories[2005-04-06]http://www,nstl.gov.cn/nstl/user/xxnyl,jsp
3 Anonymous.DEFINING AN INSTITUTIONAL REPOSITORY[conference article].Library Technology Reports.Chicago:2004,140(4):6-10
4 CARL.Institutional Repositories:Innovation in Scholarly Publishing[2005-04-06].http://www.carl-abrc.ca/projects/ir/about-e.htm
5 Anonymouts.BENEFITS OF AN INSTTTUTIONAL REPOSITORY[conference article].Library Technology Reports.Chicago:2004,40(4):11-16
6 David C.Prosser.The Next Information Revolution-Can Institutional Repositories and Self-archiving Transform Scholarly Communications?[2005-04-06].http://www.iatul.org/conference/proceedings/vol13/papers/PROSSER-fulltext,pdf
7 吳建中.圖書館VS機構庫——圖書館戰略發展的再思考.中國圖書館學報,2004(5):5-8
8 Weller,Mary Case.BACKGROUND AND DEFINITIONS FOR CIC SUMMIT ON SCHOLARLY COMMUNICATION [2005-04-06].http://www.cic.uiuc.edu/groups/CICMembers/archive/documents/backgroundforsummit,pdf
9 Tom Storey.University Repositories:An Extension of the Library Cooperative OCLC Newsletter.2003(7):7-11
10 MacKenzie Smith,etc.DSpace:An Open Source Dynamic Digital Repository[2005-04-06]http://www.dlib.org/dlib/january03/smith/01 smith,html
11,15 RoMEO Project.Key Findings of the RoMEO Project.The Intellectual Property Rights Issues Facing Self-archivin.[2005-04-06].http://www.dlib.org/dlib/january03/smith/01 smith.html
12 Kathleen Shearer.CARL Institutional Repositories Project[2005-04] http://www.carl-abrc.ca/projects/ir/survey-results-2004.pdf
13 website:http:[2005-04]//www.carl-abrc.ca/projects/ir/
14 Colin Storey,etc.The Institutional Repository:The Chinese Universityof Hong Kong'SIR'Model.[Conference artical].Lecture Notes in Computer Science,2004,3334:236
16 Philip Hunter,Michael Day.Institutional repositories,aggregator services and collection devel-opment.[2005-04-06]http://www.rdn.ac.uk/projects/eprints-uk/docs/studies/coll-development/coll-development.pdf
17,19 Lynch,C.A."Institutional repositories:essential infrastructure for scholarship in the digital age."[2005-04-06]http://www.arl.org/newsltr/226/ir.html
18 Anonymous.COSTS[conference article],library Technology Reports.Chicago:2004,40(4):54-56
20 James,H.etc.Feasibility and requirements study on preservation of e-prints.[conference article]London:Joint Information Systems Committee.2003
21 Anonymous.CARL Institutional Repositories Project.[2005-04-06]https://dspace.ucalgary,ca/handle/1880/360.
共2頁: 2
論文出處(作者):【聚集學術機構知識的中心:機構庫(Institutional Reposi】相關文章:
評析機構股東積極主義03-21
機構養老的需求及問題分析03-20
民間養老機構的政府監管03-10
淺論檢測機構的人才建設03-18
技術論文發表雜志較好的機構推薦03-08
建立公共保險評估機構的構想03-20
論我國反壟斷執法機構的設置03-07
牛頭刨床六桿機構簡介05-20
淺論如何構建高效的內部審計機構03-18