- 相關推薦
北蟲草專利檢索策略研究
摘要:北蟲草作為長白山代表藥物,隨著長白山資源的開發與利用,如何提升北蟲草專利研究的水平,增強專利數據源的可信度,成為北蟲草專利檢索的核心問題。針對中國專利檢索策略的一般思路,引入詞頻分析與比較分析的方法,研究適用于北蟲草專利研究人員的中國專利檢索策略方法。
關鍵詞:檢索策略 專利 詞頻分析 北蟲草
我國是蟲草資源分布最多最廣的國家,國內外對已經成功誘發蟲草子實體的種類研究認為, 北冬蟲夏草食用和藥用價值可與天然冬蟲夏草媲美, 這一發現, 引起了世界各地對北冬蟲夏草的需求量激增, 因此, 人工培育具有自然形態的北冬蟲夏草子實體, 具有特殊意義。
通過專利檢索發現,長白山藥用植物資源產業系列品種開發的專利申請數量較多,但是其他品種從專利申請上難以看出優勢。應在北蟲草、鹿胎、林蛙等方面加大研發攻關力度,力爭開發新藥物、優勢藥物新劑型,獲取基本專利,增強核心競爭力。
在滿足專利檢索目標的前提下,實現專利數據集的全面與準確,是制定專利檢索策略的目的。如何保證查全率與查準率是專利檢索中的關鍵。常用的專利檢索策略大多依賴于技術專家提出的關鍵詞或者分類號檢索,因而在專利檢索中必然存在專家知識的主觀判斷。因而,基于技術信息資源的客觀分析方法更應該得到應用和推廣。本文基于專利文獻和學術文獻中的詞頻分析以北蟲草的專利檢索為例設計一種更為客觀的檢索策略。
一、關鍵詞檢索
具體的來說有以下幾方面的問題:關鍵詞檢索很難全面獲取所需的專利文獻。北蟲草由于是近些年發現其可替代冬蟲夏草,因此較早的專利文獻少有記錄。翻譯方面存在不足、同義詞太多。由于北蟲草屬于中藥,在古書記載名稱較多,而英文翻譯水平有限,在檢索時存在難度,少有英文文獻記錄。專指性不強。由于早期對北蟲草的認識較少,因此至今依舊容易將北蟲草與冬蟲夏草混淆,難以檢索明確。
二、分類號檢索
分類號檢索的原理是基于專利局的專家們根據文獻主題對專利文獻進行分類所產生的序列號。因此,分類號檢索是專利檢索的有效檢索途徑。存在的問題:寬泛的分類標準:國際專利的分類在不同領域有不同的分類標準。分類號滯后:國際專利分類系統每5年才發布一次分類號,對檢索人員來說參考價值大為縮水。分類號過時:很多免費的數據庫,甚至是收費昂貴的數據庫,都沒有提供舊的分類號和更改后的分類號之間的鏈接,只有美國國家專利和商標局提供了這類服務。本文將數據采集中確定并獲取專利數據集合的方法定義為“專利檢索策略”,即明確專利分析對象與研究主題,結合專利分析研究的具體需求,整理并收集相關領域的背景資料,整合包括專家意見在內的多方資源與反饋信息,制定數據采集的目標數據集與檢索詞并進行多次修正,最終獲得專利數據集合的過程。整個專利信息獲取策略的流程分為詞頻分析、比較分析和結果修正三個階段。
三、詞頻分析
詞頻分析是一種透過詞頻現象看內容本質的科學方法,也是目前內容分析法中最重要也是使用最多的工具。本文通過詞頻分析方法獲取北蟲草技術領域的關鍵詞集合以輔助專家決策,解決了單純依靠專家咨詢獲得檢索詞時可能存在的主觀性或偏差性等缺陷。例如,為了解北蟲草研究的總體特征、研究之間的內在聯系以及研究的發展方向等,就可以通過對期刊文獻中的關鍵詞或專利文獻中的技術核心詞進行詞頻分析來進行一定的歸納[4]。進行詞頻分析的目的是采用文獻計量學的手段統計出相應技術領域的熱點主題詞,再將主題詞轉化成適用于專利檢索的專利檢索詞。事實上,專利檢索詞與熱點主題詞( 即技術術語) 仍然存在差異。同時,任何一篇文獻的關鍵詞并非僅僅局限于同一個領域,而是總結并概括了該篇文獻相關的全部核心技術。因此,通過詞頻分析獲得的主題詞中必定會存在一部分或偏離既定研究領域,或不適用于作為檢索詞匯的熱點主題詞。對于這些主題詞,需要依靠專家判斷進行清除。
四、比較分析
所謂的比較分析是指在專利檢索策略制定過程中通過將當前檢索策略與常用檢索策略、既往項目檢索策略進行比較,不斷地獲得反饋并對檢索策略進行修正的過程。通過比較分析,可以發現當前專利檢索策略的缺陷與不足,將多種檢索策略進行優化組合,以達到更全面和準確的檢索結果。其具體流程如下:假設通過詞頻分析所得到的關鍵詞檢索策略A 所獲得的數據集合為M,而常規檢索策略B 所對應的數據集合為N。首先找出這兩個數據集合所共有的數據,然后將兩種檢索策略間的不同結果進行比較。對屬于檢索結果數據集合M 但不屬于檢索結果數據集合N的數據,即是檢索策略A所得到的獨有數據集,稱為M1,對M1中的專利文獻進行逐項分析,以判斷這些數據是否是冗余數據。其次,對屬于數據集合N 但而不屬于數據集合M 的數據,即是檢索策略B 所得到的獨有數據集,稱為N1,對N1中的數據進行逐項分析以判斷這些數據是否是遺失數據。通過以上比較分析方法,將關鍵詞檢索策略與常用檢索策略分別進行比較,并根據反饋結果對當前檢索策略進行反饋與修正,最終獲得修正的檢索詞集。然后再請該技術領域的專家對檢索詞集進行補充和完善,這樣使得最終的檢索詞集既可以兼顧客觀規律又可以反應專家的智慧。
五、結果修正
結果修正階段首先需要通過對數據集進行包括關聯分析、統計分析與聚類分析在內的專利分析,其目的在于嘗試通過數據挖掘的手段找到數據集合中的異常數據,以期達到對檢索策略進行再次修正的目的。其中,統計分析的重點在于詞頻統計,對于不符合檢索目的的檢索詞或IPC 要及時剔除; 關聯分析與聚類分析則側重于尋找偏離整體的散點群,并判斷散點群的成因。一般而言,此類散點群或為相應領域的技術創新點,或為無關數據。對于后者,應及時修正檢索策略。在完成結果修正之后,檢索策略最終完成,其對應的專利檢索數據集即為最終數據集合。
六、結論
本文以專利檢索四條標準為基礎,以北蟲草為例綜合運用詞頻分析、比較分析等定性、定量分析技術方法,創造性的建立了一套適用于中國專利的檢索策略制定方案,提高了國內外中國專利研究中數據源的可靠性,具有較高的實用性與科學性。為長白山藥用植物專利申請和檢索提供了新的方法。綜上所述,本套專利檢索策略在參考當前國內外先進科技文獻檢索方案的基礎上,綜合運用定性分析與定量分析的方法,結合北蟲草的實際檢索情況,制定與推廣有助于增強國內專利數據檢索可信度,提升我國專利研究水平。
【北蟲草專利檢索策略研究】相關文章:
專利侵權認定中等同原則的運用研究06-01
幼兒園游戲組織與指導策略研究06-15
初中物理實驗教學策略研究06-14
零售企業再定位策略實證研究06-07
教師專業成長的策略研究開題報告05-09
青少年"網癮"成因及應對策略研究開題報告05-07
水稻病蟲草害防治探析05-27
小學數學學習知識構建中“留白”的策略研究08-27