- 相關推薦
從節點屬性角度對教師科研項目合作網絡可視化分析
目前的科研合作網絡可視化通常以節點連接圖和鄰接矩陣為主要方法,下面是小編搜集整理的一篇探究教師科研項目合作網絡可視化的論文范文,供大家閱讀查看。
合作研究對于信息獲取、思想交流、知識創新有重要的意義,是科學研究的重要模式。學者對科研合作網絡進行了大量的探討和研究。隨著可視化技術的發展,社會網絡可視化已成為分析科研合作網絡的重要手段。通過對合作網絡中的節點之間的聯系進行可視化建模,將科研合作網絡數據以圖形化方式展示出來,不僅可以科學高效地協助用戶清晰地認識合作網絡的內部結構,同時也有助于挖掘隱藏在網絡內部的有價值信息。目前已開發出的多款社會網絡可視化軟件,如UCINET,Pajek,NWB等都能用于科研合作網絡的可視分析。然而當前絕大多數網絡可視分析雖然能較好地揭示網絡結構,卻往往忽略了節點本身的背景信息(如屬性)。實際上社會網絡不僅僅是一系列匿名的節點和連線,同時還應包含行動者的社會屬性和他們的關系。Breiger指出作為行動者社會層次的屬性信息通常有重要的社會影響。因此分析社會網絡不僅要關注所呈現出來的網絡模式,同時也應關注隱藏在屬性中的社會結構。比如在學者合作網絡中,一個學者的所在單位信息包含學院、學校和國家3個不同的層次,如果能從不同的社會層級(從個體,到跨部門,到國際合作)來分析學者行為,將有助于深入理解學者的合作行為以及影響力的分析。針對目前社會網絡可視化難以支持節點屬性挖掘的問題,本文提出一種從節點屬性角度對社會網絡進行可視分析的方法,該方法能在展示單個節點間相互關聯關系的同時,展示單個節點與其所屬群體和其他群體間的層次關系,以及不同群體間的關聯和從屬關系,側重于對節點本身的屬性信息和群體間的從屬關系進行挖掘。筆者以某學院教師科研項目合作網絡為例進行分析,從多尺度和跨尺度對教師的科研合作進行了展示,彌補了以往可視分析只注重網絡結構特性的不足,為更深入全面地了解合作網絡提供了幫助。
1、相關工作
圖形可視化正在成為了解不斷擴大的社會交流協作網絡的重要手段。由于這樣的網絡有著更大、更復雜的鏈接和結構,傳統的直線圖和力引導布局不能有效地揭示關系和結構,這便導致許多新可視化技術的產生,如層次聚類和連線集束方法。
1.1層次可視化的相關研究
在當前的層次可視化研究中常見的是類似于樹根的有根樹結構,這種方法是使用與計算機拓撲網絡結構相類似的直線連接和層次布局來表示一個層次網絡;也有將節點的聚類根據其層次情況按照不同的深度排列在一個圓形整體中的氣球布局;還有使用基于空間填充設計技術的樹形層級圖,這種方法通過將矩陣中的方塊按照不同的權重和從屬關系進行嵌套處理來表示層次關系。層次聚類圖則是融合以上層次可視化方法,同時引入可視化交互技術的一種可視化方式,因為它擁有總覽、縮放以及篩選的功能。該技術假定一個或多個項被當作一個整體節點在可視化圖形中輸出,然后構建節點的分層或聚類集群,為這些分層或聚類集群分配一定的顯示空間,這種可視化方法與當前的力引導布局對節點的位置計算所不同的是,該方法直接使用節點本身的屬性信息來進行節點位置的定位,既保留了原始數據中節點的分層結構屬性,又避免了力引導布局所需要的大量計算。
1.2連線集束的相關研究
節點之間使用直線連接是一種常用的關系表示方法,但隨著數據量的增大,這種方法會由于連線交叉的增多而迅速導致視覺上的混亂。Fekete等為了減少直線的交叉提出使用弧線連接來盡可能避免直線的交叉,而Kauf-mann等為了避免連線的交叉將聚類的方法應用到可視化研究中,將位置相近的連線捆綁成束以減少可視化圖形中線的數量,避免密集的連線對可視化圖形可讀性的影響。D.Holten融合以上方法的優點提出將邊緣匯聚技術應用到預先定義過層次的復合可視化圖形中,針對的是既包含層次關系又包含連接關系的網絡數據。在樹形結構中直接添加網絡關系連線會使樹結構的可讀性受到極大的影響,為了解決可視化畫面雜亂的問題,這種既可以顯示節點的層次屬性,同時借由可視化交互技術,通過點擊縮放可以展示層次屬性的細節,使不同層次的信息能夠按照用戶的需求進行信息的約減及擴展的連線集束的可視化方法被提出,較好地滿足了將網絡信息和層次屬性相融合的需求。該方法使用階層式的方式來顯示節點的樹形結構,并且通過一定的聚類和集束來減少連線交叉所形成的間隙,通過使用相近連線共享同一個路徑而兩端散開的連線方式,減少了在大數據的顯示中由于連線的交叉而帶來的視覺上的混亂。
2、數據模型
通常社會網絡是用圖模型G={V,E}來表示的。
其中V代表所有節點的集合,而E代表所有邊(關聯)的集合。本文在這個基本的圖模型上進行擴展來包含節點的屬性信息。每個節點具有多個屬性,例如一個學者的社會屬性的隸屬關系可以在國家、地區、學校、學院、系等多層面進行描述。所以定義有多個層級屬性的社會網絡為N={VN,EN},其中VN為所有社會行動者(節點)的集合,而EN為所有社會關系(邊)的集合,每個節點有m個屬性,屬性之間是有層次關系的。屬性之間的層次關系定義為樹結構Ti=(VTi,ETi),其中VTi表示來源于第i個屬性的樹的節點,ETi是樹形結構的邊,表示屬性的父子關系。為了分析社會網絡和社會層次屬性信息,使用TreeNet圖模型,一個由樹形結構和網絡兩個子圖所構成的復合圖。一個TreeNet圖模型TrNi可以寫成:TrNi=(Ti,N,ρ),其中ρ是一個網絡節點在樹結構中葉節點的映射,ρ(nTi)→nN,nTi∈VTiL,nN∈VN,VTiL是Ti樹形結構里的葉節點,該模型被用于整合具有不同層次屬性的社會網絡。
3、案例分析
以武漢大學信息管理學院教師科研合作網絡為例進行可視分析。該數據集包括72名教師以及141個項目,這些項目分別為該學院在2006—2012年獲批的國家自然科學、國家社會科學和教育部3類項目。節點屬性有兩層,學院和系,具體來說為1個學院,5個系,分別是圖書館系、信息管理科學系、檔案與政務信息系、出版系、信息系統與電子商務系。針對該學院科研合作網絡的構建是以教師為節點,教師的合作關系作為邊。這是一個無向有權重的社會網絡,任意兩名教師同時參與的項目數作為這兩個節點之間邊的權重。整個網絡的邊權重總和為364。與以往分析整個網絡結構特性不同的是,從節點屬性角度來分析學院科研合作網絡,具體來說,從多尺度和跨尺度的角度來揭示合作模式。比如針對科研管理人員來說,不僅需要知道整體的教師合作次數,更關注系與系之間的合作模式有何不同,哪兩個系合作最為頻繁哪些教師跨系合作多,是連接不同系的科研人員。為此筆者利用EXTRAVIS構建了一個合作網絡可視化系統,通過交互界面實現多尺度和跨尺度分析,為科研管理人員提供快速、易理解的評估和更有效的交流手段。多尺度體現在個人與個人、系與系合作模式展現,跨尺度體現在個人跨系合作模式展示。
3.1系與系合作關系的可視化分析
基于節點屬性信息和節點關聯信息而生成的各系間的項目合作總圖。左側菜單可以對數據模型中的ρ進行調整,這樣可以選擇是否對關系連線進行匯聚,而右邊則通過列表的形式對系內和跨系合作的數量情況進行宏觀展示。連線的粗細表示項目合作次數的多少,而連線中標注的數字則量化地描述了合作次數的多少,從圖1可以清楚地看到每個系與其他系的合作次數,提示信息管理系與電子商務系是合作最多的兩個系。在此基礎上很容易得到以系為單位的合作情況(如表1所示),可以發現信息管理科學系是與其他系發生合作次數最多的系,其總數達到了80次,其次是信息系統與電子商務系58次,出版系36次及檔案與政務信息系32次,圖書館系28次。
在圖1的基礎上進行擴展,點擊系所屬信息片使其展開而得到了圖2的合作關系詳細視圖。通過展開每一個系節點,能夠得到包含每個系教師詳情信息的系合作關系詳圖,從中可以看到兩級節點,第一級是系,第二級是個人。詳圖除了進一步顯示信息管理系與電子商務系間最為密切的合作關系外,還顯示了全部參與合作的二級節點(教師)的情況,從整體上顯示了系內和系間存在的合作關系。圖2提示信息管理科學系中教師間合作關系連線最為密集,內部合作有63次,其次為電子商務系30次。
3.2個人在系內及跨系合作關系可視化
為了解個人在系內以及跨系的合作情況,可以將整個系的節點進行縮放以觀察個人跨系合作情況,以“LuoLin”(以下簡稱“LL”)節點為實例,展示跨系合作次數視圖并進行分析。在圖3中可以發現“LL”節點屬于信息管理科學系,“LL”跨系合作涉及的系有4個,分別是電子商務系、出版系、圖書館系、檔案與政務信息系。
如果需要進一步了解個人究竟與哪些個人進行跨系合作,可以通過可視化交互式技術將所有與“LL”節點有聯系的節點都通過附加標注的方式在圖4中進行展示,通過由指向性而展開的附加標引,提示與“LL”節點有聯系的相關節點和具體的節點信息及數量。
從圖4可以看出,與“LL”節點有合作的系內節點共有7個,系跨系節點有4個,與“LL”節點有合作關系的節點以文字的形式在畫面上縱向排列,可以讀出節點數共有11個,它們分別是“LP”、“ZYF”、“XLF”、“LG”、“ZXJ”、“ZXG”、“YL”、“TXQ”、“LW”、“LQ”、“MFC”,且在右邊的信息分列欄中,高亮的位置(計算機顯示)同樣可以輔助用戶讀取與“LL”節點有關聯關系的節點位置。由此可見層級式邊緣集束模型對同層級間數據的可視化也有著良好的信息傳遞效果,圖4中的數據可以概括成為表2的“LL”節點個人與系合作情況表,“LL”節點共與5個系中的11個節點有過12次合作。
若按照系整體的角度對跨系合作數進行統計,信息管理科學系最多,有80次合作,而最少的圖書館系也有28次,由此可以發現跨系合作非常頻繁,有的系跨系合作次數甚至與系內合作次數相當,同時有的節點還成為跨系合作中的橋梁,如“LL”、“HRH”等均與所有系有過合作。
這說明在目前的科研合作中跨系交流現象十分明顯,實際上科研合作并沒有受到組織結構的影響。
4、分析
目前針對科研合作網絡的研究大體可分為3類。第一類是針對機構內部成員合著情況的研究,如Perianes-Rodríguez通過對大學內合著分析來識別研究小組,并對其進行可視分析。歐陽霞探討了EAMOLA成員的科研合著行為,分析了合著網絡結構、密度、核心作者分析,以及項目實施前后合著網絡結構變化分析。第二類是針對某一領域的作者以及機構合著情況分析,如邱均平和王菲菲通過構建國內競爭情報領域作者的合作關系網絡,分析作者的外在合作關系,同時輔以作者關鍵詞耦合分析挖掘該領域內潛在的合作團體。Arif等學者研究了印度計算機領域研究機構的成員合著網絡。李長玲等人對我國圖書情報學研究機構的合作網絡進行了可視分析。第三類是針對期刊的合著研究,如李亮和朱慶華選擇了《情報學報》的合著作者為對象,對國內情報學領域的合著網絡進行了實證研究,評價了學者在合著網絡中的地位,發現了合著網絡中聯系緊密的團體。孟微和龐景安以《情報理論與實踐》合著網絡為例,對其中有代表性的子網絡進行了具體的分析。余豐民、楊江明以《圖書情報工作》為研究對象,除了對作者合著進行分析外,進一步對機構合著和區域合著現象進行了研究,以評價某種刊物的作者、地區和機構的合著水平和能力。雖然研究對象不同,但以上這些研究的方法基本相同,大都采用科學計量方法和社會網絡分析法,通過統計文獻數目、合作情況和高頻詞,挖掘出該領域的重點研究主題以及核心人物。但在合著網絡可視化方面存在層次屬性被忽略、關系信息展示不充分等問題。因此只能進行單尺度(個體—個體)的關聯分析,無法實現多尺度(機構—機構、地區—地區、國家—國家)和跨尺度(個人—機構、個人—地區、機構—地區、機構—國家)的關聯分析,因此很難回答哪些機構合作最多,哪些地區合作最多,哪個學者跨機構、跨地區合作最多,哪個機構跨地區、跨國家合作最多等問題。而本文提出的合作網絡可視化方法通過交互界面提供快速,可縮放、多尺度和跨尺度可視界面,能夠很好地彌補之前的不足,協助用戶輕松地獲取對復雜合作網絡的更深層理解。
5、結束語
目前的科研合作網絡可視化通常以節點連接圖和鄰接矩陣為主要方法,僅注重節點的分布和邊的排列,忽略了節點的屬性信息。為此,本文提出了從節點屬性角度對科研合作網絡進行可視分析的方法,并以武漢大學信息管理學院項目合作網絡為例,對該網絡進行了多尺度和跨尺度的可視分析,彌補了傳統的社會網絡可視化方法在表現層次屬性可視化方面上的不足。
該方法不僅具有易讀性的優勢,而且具有極好的可擴展性,能夠滿足多層數據的可視縮放。在本文中節點的屬性層次僅考慮了兩層,數據集相對簡單,在下一步的研究中,將擴大數據集到學校范圍以探測學院間的合作模式。另外將融合文獻計量學方法對大量關聯數據及屬性數據進行整序和排列,以提供更多的分析功能。
【從節點屬性角度對教師科研項目合作網絡可視化分析】相關文章:
網絡虛擬財產屬性分析09-05
網絡經濟基本屬性研究09-19
分析現代舞欣賞的角度08-26
從顧客角度分析OPPO營銷策劃08-20
從心理學角度分析自己的成長經歷06-07
從觀眾學角度分析電影《美麗心靈》的成功08-18
從非言語交際的角度分析“追求名牌”07-01
思維可視化視角下的視覺素養教育分析論文06-15
網絡式客戶關系體系與客戶屬性關聯規則10-03
論教師的知識分子屬性09-18