基于多智能Agent計算機科學信息檢索個性化服務的探討論文
摘要:
文章論述了智能agent搜索理論的提出背景,闡述了智能agent的搜索理論及多種智能agent的功能和工作原理,并在此基礎上構建了一個基于多種智能agent個性計算機科學信息檢索系統,得出該系統是當今圖書館智能化的主動服務模式。
關鍵詞:智能agent;智能化;主動服務;信息檢索
1、問題的提出。
近年來,隨著振興東北老工業基地戰略的實施,齊齊哈爾大學加快計算機科學專業的建設與發展,檢索大量的有關計算機科學專業的信息資源成為學科館員的必須工作,但網上計算機科學信息資源浩如煙海,專業數據庫不計其數。通過計算機科學類信息檢索實踐發現浩瀚如海且不斷變化的計算機科學信息資源與有效獲取之間存在著尚需解決的技術問題,且越來越明顯,主要表現在以下幾個方面:
。1)搜索準確性問題。
目前我們使用的大部分搜索引擎和專業數據庫檢索都是依據查詢字段的匹配來收集信息,在查詢的結果中,常常包含著一些無用信息即信息過載和資源迷向,浪費了用戶的時間與精力。
。2)個性同化問題。
不同的用戶使用同一個搜索引擎對同一個關鍵詞進行查找,得到的結果均是相同的,毫無個性可言。
(3)結果差異問題。
我們對相同的“計算機編程”進行搜索時,在百度能搜到770個網頁,而在雅虎中卻可搜到8832765個網頁,在中國期刊全文數據庫中搜到10624篇(精確)論文,而在重慶維普數據庫中卻搜到208篇(精確)論文,體現出不同搜索引擎產生不同的結果,對同一關鍵詞使用不同的搜索引擎得出的結果差別很大。
。4)主動服務問題。
我們目前所使用的搜索引擎都是通過在搜索引擎中鍵入關鍵詞搜索才能得到所需要的信息,而引擎本身不能為用戶提供主動的服務,這是一種較為被動的信息獲取方法。
(5)動態監測問題。
網絡中計算機科學方面的信息是實時動態變化的,如果為計算機科學的研究提供更新的信息,我們只有花費很多時間與精力實時查詢網絡,才能做好服務工作,而在現有搜索引擎技術條件下,對我們來說是極為不便的。
這些問題正是數字圖書館個性化信息服務所要解決的。對于搜索引擎來說,也是其自身無法克服的,為適應信息的個性化需求,一種智能agent搜索工具已被研發出來,在工業、商業領域廣泛應用,本文擬將該理論引入數字圖書館的.個性化服務中來,探討其在計算機科學信息檢索中的應用。
2、agent智能搜索理論。
智能agent的研究起始于20世紀90年代,是人工智能和代理技術的集成運用,它代表了信息技術最前沿的發展方向,是一個全新的研究開發領域。是具有劃時代意義的智能化、主動服務用戶的研究熱點。
agent智能搜索理論,核心功能就是智能代理,利用一種計算機軟件(實體)自動執行用戶委托的任務來達到用戶的檢索需求,如學習agent、中介agent、通信agent、信息協作查詢agent、信息采集agent、信息分析agent、信息傳遞agent等等,每種智能agent都需要相應的技術支持,這些技術包括了人工智能和代理技術、神經網絡技術、信息檢索技術、計算機網絡技術、數據庫數據挖掘技術、自然語言處理技術等,這些技術,近年來的研究已非常成熟,在這些技術支持下的多種agent組成的智能系統已被開發者廣泛應用于工業和商業領域,智能agent能把用者的需求通過自身的自治性、代理性、學習性、分析性描繪讀者需求、建立導出信息模塊、自動搜索信息。專家學者設計了許多面向agent的建模語言以支持基于借助于面向agent的軟件,和支持不同系統模型之間轉換的軟件,以使各系統之間相互兼容,從而建立起一種逐步求精的agent系統,為解決網絡中計算機科學專業信息服務與計算機科學專業信息搜索問題提供了新思路。遵循這一理論,我們進行計算機科學專業專業智能檢索的探討。
3、基于多種智能agent的計算機科學專業檢索系統的工作原理。
完成用戶的完整的檢索過程需要許多智能agent的有機配合,以下分別介紹相關的agent在完成用戶檢索過程的工作原理。
。1)信息采集agent執行網絡的搜索任務。
信息采集agent是該系統的核心部分,信息采集agent是一組獨立運行于各個物理節點上的網絡信息搜索程序,它根據所分配的任務和知識庫中的信息對網絡站點進行遍歷,并把采集到的信息存進本地信息庫中。
信息采集agent工作流程如下:
①初始化時,信息采集agent派遣信息協作agent取回知識庫中適當的外部地址作為運行種子。
、谟扇』氐耐獠康刂纷鳛槌跏挤N子,采集該網站信息,并把采集到的內部地址信息存儲到本地信息庫中的內部地址列表結構中去。
③從本地信息庫中的內部地址列表中取地址,采集信息。
、軆炔康刂妨斜頌榭,則表示完成該網站采集任務,執行步驟。
。2)學習agent總結用戶檢索習慣形成個性化的檢索模式。
學習agent安裝在用戶個人機上,每個用戶一個學習agent,學習agent根據用戶注冊信息了解用戶背景、興趣、愛好、檢索目的、任務等,自動從用戶提交的初始的興趣樣本中提取特征自動學習,并且根據用戶經常的檢索習慣,自動完成用戶檢索習慣的反饋學習任務和用戶個性化模式的生成。學習agent根據用戶的注冊信息能主動地分析和獲取用戶的個性信息并根據用戶的興趣模型或當前的環境狀態了解用戶的潛在需求,以主動服務方式提供服務,例如,設定計算機科學的信息,學習agent可根據用戶的信息和檢索習慣,獲取信息服務網站地址,自動監測相關網站的更新情況,自動將新信息推送給用戶,將主動絡上計算機科學資源的使用現狀。
工作流程:
①學習agent將用戶使用類似自然語言的描述限制在一個概念區域中,擁有完成學習任務的準備知。
、谌缓骯gent在用戶的教導下不斷訓練,直至能有效地找到用戶感興趣的檢索語言。
③學習agent發揮它的學習和適應能力,形成一種記憶型的模式,能自動代表用戶將用戶經常檢索的問題在網上搜索,推送給用戶。
。3)中介agent協調整個信息搜索過程。
中介agent在整個搜索過程中至關重要,是實現系統分布式透明性的關鍵。主要用于協調采集、管理、統計、查詢等各種agent,按其功能分類或建立聯盟,保證各種agent之間的安全通信機制。
工作流程:
、佼攲W習agent從本地機知識庫儲存的信息狀態,了解到用戶和個性化信息及多次關于計算機科學專業的檢索習慣形成固定的檢索模塊。
②根據用戶的需求自動推送計算機科學專業信息給中介agent檢索。
、壑薪閍gent首先把信息傳遞給各個采集系統中的信息采集協作agent。
、苄畔⒉杉瘏f作agent,與各個信息采集agent進行交流。
、菖c此同時中介agent與信息分析agent交流。
、扌畔⒎治鯽gent通過調取本地知識庫進行分析,把結果通過信息分析agent遞給信息中介agent,中介agent從信息分析系統中獲得數據,再傳遞給信息采集系統,完成信息采集。
。4)信息協作agen在動態的情況下自主完成搜索任務。
這是一個可移動的agent(mobileagent),能根據當前動態變化的環境狀態,在無需外界參與的情況下,獨立地發現和利用完成任務所(來源:)需的資源,獨立地制定完成任務的規劃,最終實現規劃、達到目標。
工作流程:
①信息協作查詢agen移動于采集系統和分析系統。
②從信息采集agent和數據傳送agent處接受協作信息查詢請求。
、墼購闹薪閍gent系統獲得目標系統地址后,移動到這個新的目標主機,完成信息查詢任務。
。5)信息傳輸agent。
信息傳輸agent負責把本地信息庫中已經采集到的信息安全傳送到sad中去。由于各子系統分
別處于不同的物理節點上,數據傳送的安全性和可靠性就變得尤為重要。數據傳送agent通過與信息協作查詢agent以及中介agent的合作有效解決了這一問題。
工作流程:
、贁祿䝼魉蚢gent向信息協作查詢agent發出對目的地系統地址的查詢請求。
②信息查詢agent從中介agent處取得數據分析子系統的ip地址,并返回給數據傳送agent。
、蹟祿䝼魉蚢gent根據所得到的目的地址,創建一個數據接收mobileagent,并移動到數據分析系統所在地。
、軘祿邮誱obileagent對數據分析系統所在地的網絡通訊質量和系統空閑時間進行評價;⑤若評價值滿足數據傳送質量的要求,數據傳送agent開始向數據接收agent傳送數據,直到數據傳送完畢,收回并銷毀數據接受mobileagent,若評價值不能滿足要求,直接收回并銷毀數據接收mobileagent。
。6)數據分析agent通過智能篩選呈現給用戶理想的檢索結果。
數據分析agent負擔著對采集回來的數據進行文本化、中文分詞和評價網站的任務。由數據接收mobileagent、信息協作查詢agent、數據分析agent協作完成。平時,數據分析agent處于休眠狀態,不加載入內存,當有新數據傳送到sad本地時,數據分析agent被激活,從硬盤上讀入狀態數據,進入工作狀態。
、贁祿M行統一化,采集到的數據可能是一段html代碼、pdf文件、word文件等,統一化就是利用代碼轉換方法把這些數據轉化成純文本格式。
②如果其中有中文詞匯,則調用中文分詞模塊進行中文分詞,并調用專業詞庫與其中的專業詞匯相比較,統計網站中出現專業詞匯的頻率,把結果寫入知識庫中,作為對網站與本專業相關度的評價,把相關內容插入索引數據庫,若沒有中文詞匯,則與專業詞匯比較,并形成索引。
4、基于多種智能agent的計算機科學專業檢索系統的工作流程。
多種智能agent相互協作完成計算機科學檢索任務的工作流程:本地知識庫存儲用戶的注冊信息,學習agent由中介agent獲取用戶的檢索模式交給采集agen并通過采集agent采集信息,采集agent把采集的結果通過協作agent、接收agent交于分析agent,分析agent經過處理把理想化的結果儲存到知識庫中,完成檢索任務。在整個過程中體現的是智能化的主動的推送的服務,是智能采集agen根據用戶注冊的個性化信息資料、并把多次的檢索習慣通過學習建立模塊,自動采集網絡,完成服務的。整個過程體現的是主動的服務方式,是當今圖書館智能化的主動服務模式。
參考文獻
。1]蔡棟.第二代搜索引擎模式探析[j].情報理論與實踐,,(3)。
[2]漆宏,等。談談個性化信息服務[j]。情報資料工作,(4)。
[3]韓立新,等。一個面向internet的個性化信息檢索系統模型[j]。電子學報,(2)。
。4]劉穎.多智能agent系統的結構與功能[j].圖書情報知識,,(4)。
【基于多智能Agent計算機科學信息檢索個性化服務的探討論文】相關文章: