有效性可區(qū)別的專利挖掘方法研究與實現(xiàn)
發(fā)布時間:2020-10-20 09:52
隨著科學技術的快速發(fā)展,企業(yè)和研究機構也越加重視專利申請,產生了大量的專利文獻,這些專利文獻為進一步分析技術發(fā)展趨勢提供了可能。專利文獻是一種技術信息的有效載體,通過分析它可以得到重要的技術細節(jié)、領先的商業(yè)趨勢以及新型的工業(yè)問題解決方案。企業(yè)做好專利挖掘有利于維護自身的法律權利,避免損失甚至增加商業(yè)收益,并且降低專利侵權的風險。由于專利數(shù)量十分龐大,現(xiàn)有專利挖掘方法的挖掘時間復雜度都較大,且當專利的描述性語句較長較多,涉及較多的技術專業(yè)術語時,發(fā)現(xiàn)專利演化過程效果不佳。此外,現(xiàn)有的大多數(shù)比較性專利挖掘方法偏重于專利之間的差異性而無法很好地表示專利之間的聯(lián)系。針對上述問題,本文研究了專利文檔之間對比的相關問題,所建立的摘要有助于專利分析人員快速了解待測專利與專利庫之間的關聯(lián)性,有助于檢測專利之間的可替代性或新申請專利的可專利性。本文開展的具體研究工作如下:1)針對需要比較的專利數(shù)量龐大導致時間復雜度高的問題,提出一種基于多點圖的專利演化建模方法,該方法可以為給定的一組專利生成相關技術領域的演化樹,構建代表專利集,使得在后續(xù)研究中減少與專利集中關聯(lián)性較小的專利進行比較,從而降低時間成本。實驗結果表明了該方法的有效性。2)針對存在的比較性摘要無法直觀地看出專利之間的聯(lián)系,并且得出的比較結果無法根據用戶的不同需求進行調整的問題,提出一種基于比較的專利文獻檢索建模方法,該方法首先從每個專利文獻中提取出可以進行判別的項,然后通過基于圖論的方法將這些項在同一個圖中進行連接,并且通過用戶自定義的停用詞,快速地得出用戶想要的結果。實驗結果表明,與現(xiàn)有方法相比,該方法可以更準確地得出比較性摘要。3)針對一篇待檢測專利與整個專利數(shù)據庫之間進行比較的成本高的問題,提出一種有效性可區(qū)別的專利挖掘方法,該方法根據待檢測專利所屬領域,應用基于多點圖的專利演化建模方法構建代表專利集,而后應用基于比較的專利文獻檢索建模方法為代表專利集構建比較性摘要。實驗結果表明,該方法降低了專利分析的時間成本。
【學位單位】:南京理工大學
【學位級別】:碩士
【學位年份】:2018
【中圖分類】:G255.53
【部分圖文】:
代表性專利:通過多視點圖中的無向部分計算每一個專利的相對影響響力較大的專利作為代表性專利;??專利演化樹:使用多視點圖中的有向圖部分,通過遞歸的方法得出斯teinertree)?[47]。下面對上述流程進行詳細解釋:??造專利集多點圖??文獻中的數(shù)據由多種類型的信息組成,這些信息決定了專利文檔之間的用多點圖G來代表這些關系,G?=?下面對這些點解釋:??G中包含了節(jié)點(專利文獻)集V,其中的每一個節(jié)點vev都與一個個時間t有關。在我們的問題設定中,成本為相應專利文檔引用總數(shù)量要的節(jié)點時,我們希望選定節(jié)點的總成本是最小的。??,頂點由兩種類型的邊進行連接:Es、Eet。其中,&中包含的是無向接兩個頂點,并且每條邊都有一個權重ws用于表示相連接的兩個頂點
有效性可區(qū)別的專利挖掘方法研宄與實現(xiàn)??為了解決己知的解決方案存在的局限性,本章提出一種改進性的方法,這種方法??可以兼顧專利之間的差異性與相似性。這種方法的構建流程如圖4.1所示:??r?'????11111????,?^?^??專利P1??特征1?丨’\?/鬌?廠一??'..f?#丨胸丨嶺衡;崢三??可區(qū)分的特征?賺圖?傾樹比較MU??圖4.1基于比較的專利文獻檢索方
從而可以得出一篇待檢驗專利(如,待發(fā)表的新專利或者需要判定是否存在抄襲??的專利)與已發(fā)表的技術成果(專利文獻集)之間的關系。有效性可區(qū)別的專利挖掘??方法的流程圖如圖5.1所示,(1)構造專利集多視點圖:通過已獲取的信息,得出包??含專利間相似度信息在內的多視點圖;(2)選取代表性專利:通過多視點圖的無向部??分計算每一個專利的相對影響力,得出影響力較大的專利作為代表性專利;(3)生成??專利演化樹:使用多視點圖中有向的部分,通過遞歸的方法得出斯坦納樹;(4)提取??可區(qū)分的特征:分別將待檢測專利以及(3)中生成的專利演化樹作為一個類,選擇出??
【參考文獻】
本文編號:2848532
【學位單位】:南京理工大學
【學位級別】:碩士
【學位年份】:2018
【中圖分類】:G255.53
【部分圖文】:
代表性專利:通過多視點圖中的無向部分計算每一個專利的相對影響響力較大的專利作為代表性專利;??專利演化樹:使用多視點圖中的有向圖部分,通過遞歸的方法得出斯teinertree)?[47]。下面對上述流程進行詳細解釋:??造專利集多點圖??文獻中的數(shù)據由多種類型的信息組成,這些信息決定了專利文檔之間的用多點圖G來代表這些關系,G?=?下面對這些點解釋:??G中包含了節(jié)點(專利文獻)集V,其中的每一個節(jié)點vev都與一個個時間t有關。在我們的問題設定中,成本為相應專利文檔引用總數(shù)量要的節(jié)點時,我們希望選定節(jié)點的總成本是最小的。??,頂點由兩種類型的邊進行連接:Es、Eet。其中,&中包含的是無向接兩個頂點,并且每條邊都有一個權重ws用于表示相連接的兩個頂點
有效性可區(qū)別的專利挖掘方法研宄與實現(xiàn)??為了解決己知的解決方案存在的局限性,本章提出一種改進性的方法,這種方法??可以兼顧專利之間的差異性與相似性。這種方法的構建流程如圖4.1所示:??r?'????11111????,?^?^??專利P1??特征1?丨’\?/鬌?廠一??'..f?#丨胸丨嶺衡;崢三??可區(qū)分的特征?賺圖?傾樹比較MU??圖4.1基于比較的專利文獻檢索方
從而可以得出一篇待檢驗專利(如,待發(fā)表的新專利或者需要判定是否存在抄襲??的專利)與已發(fā)表的技術成果(專利文獻集)之間的關系。有效性可區(qū)別的專利挖掘??方法的流程圖如圖5.1所示,(1)構造專利集多視點圖:通過已獲取的信息,得出包??含專利間相似度信息在內的多視點圖;(2)選取代表性專利:通過多視點圖的無向部??分計算每一個專利的相對影響力,得出影響力較大的專利作為代表性專利;(3)生成??專利演化樹:使用多視點圖中有向的部分,通過遞歸的方法得出斯坦納樹;(4)提取??可區(qū)分的特征:分別將待檢測專利以及(3)中生成的專利演化樹作為一個類,選擇出??
【參考文獻】
相關期刊論文 前10條
1 李夢瑤;劉彤;蔣貴凰;;我國專利挖掘研究現(xiàn)狀分析[J];科技創(chuàng)新與應用;2015年36期
2 Yunji Jang;Jangwon Gim;Jinpyo Lee;Do-Heon Jung;Hanmin Jung;張津;李穎;;基于專利演化模型的機構專利分析[J];情報工程;2015年05期
3 屈鵬;張均勝;曾文;喬曉東;王惠臨;;國內外專利挖掘研究(2005-2014)綜述[J];圖書情報工作;2014年20期
4 李運田;吳瓊;鄭獻衛(wèi);;改進的TF-IDF模型在特征抽取中的應用[J];工業(yè)控制計算機;2014年02期
5 許海云;岳増慧;雷炳旭;方曙;;基于專利技術功效主題詞與專利引文共現(xiàn)的核心專利挖掘[J];圖書情報工作;2014年04期
6 鄭文超;徐鵬;;利用word2vec對中文詞進行聚類的研究[J];軟件;2013年12期
7 邱江濤;唐常杰;李慶;;面向領域的學術文獻檢索框架[J];軟件學報;2013年04期
8 石晶;李萬龍;;基于LDA模型的主題詞抽取方法[J];計算機工程;2010年19期
9 王永智;滕至陽;王鵬;聶江濤;;基于LSA和SVM的文本分類模型的研究[J];計算機工程與設計;2009年03期
10 劉曉東,劉大有;數(shù)據挖掘專利綜述[J];電子學報;2003年S1期
本文編號:2848532
本文鏈接:http://www.wukwdryxk.cn/tushudanganlunwen/2848532.html
教材專著