專利專利專利專利專利專利專利專利專利專利專利專利專利專利專利專利專利專利專利專利專利專利專利專利專利專利分類分類分類分類分類分類中國專利申請 欧美亚洲日本久久,欧美野性肉体狂欢大派对
返回
頂部
我們已發(fā)送驗證鏈接到您的郵箱,請查收并驗證
沒收到驗證郵件?請確認郵箱是否正確或 重新發(fā)送郵件
確定
產業(yè)行業(yè)法院投稿訴訟招聘TOP100政策國際視野人物許可交易深度專題活動灣區(qū)IP動態(tài)職場商標Oversea晨報董圖公司審查員說法官說首席知識產權官G40領袖機構企業(yè)專利律所

專利檢索中先布爾再語義還是先語義后布爾,這是一個問題

專利
邊度4年前
專利檢索中先布爾再語義還是先語義后布爾,這是一個問題

專利檢索中先布爾再語義還是先語義后布爾,這是一個問題

#本文僅代表作者觀點,不代表IPRdaily立場,未經(jīng)作者許可,禁止轉載#


來源:IPRdaily中文網(wǎng)(iprdaily.cn)

作者:吳正明 常州市權航專利代理有限公司

原標題:先布爾再語義還是先語義后布爾,這是一個問題


隨著專利數(shù)據(jù)庫的發(fā)展,數(shù)據(jù)量全已經(jīng)是一個最基本的評判指標了,智能化的傻瓜型檢索方式能夠幫助企業(yè)非專業(yè)的IPR經(jīng)過短期培訓也能夠勝任普通的檢索要求;因此,為了使專利數(shù)據(jù)庫的使用更加人性化,語義檢索也成為各大專利數(shù)據(jù)庫宣傳的重點。本文對一件“基石”專利價值評估值38萬美金的專利進行檢索分析。


前段時間有分析師分析了國內數(shù)據(jù)庫的專利申請情況,同時根據(jù)專利被引用次數(shù),找出了一家數(shù)據(jù)庫被19次引用的專利,這件專利被認為是該數(shù)據(jù)庫的“基石”專利,引用這件美國專利申請的企業(yè)都是微軟、阿里巴巴、百度、LEXIS NEXIS等國內外互聯(lián)網(wǎng)巨頭,體現(xiàn)了這件專利在相關技術上的先進性。分析師指出,這件名為“Method and System for Re-ranking Search Results”的專利,背后是基于自然語義分析的新一代智能搜索技術,通過超大規(guī)模計算智能,能自動理解不同專利文獻中蘊含的各種主題。


專利檢索中先布爾再語義還是先語義后布爾,這是一個問題


帶著強烈的好奇心,筆者找出了這件專利,進行了分析。這件“基石”專利價值評估值38萬美金。


專利檢索中先布爾再語義還是先語義后布爾,這是一個問題


專利的優(yōu)先權是中國專利CN200810105725.1(對搜索結果重新排序的方法和系統(tǒng)),這件中國專利申請在授權時遇到一些波折,經(jīng)歷了一次復審,也就是說審查員曾經(jīng)做出過駁回決定。以下是最終授權版本的權利要求1。


專利檢索中先布爾再語義還是先語義后布爾,這是一個問題


權利要求1很簡單,也說明了保護范圍較大,創(chuàng)新比較原始,從保護內容來看,實質上是布爾檢索和語義檢索聯(lián)合使用時的一種應用場景。翻譯過來大概是:


1、計算機搜索用戶輸入的關鍵詞等布爾檢索式,獲得檢索結果;

2、計算機根據(jù)用戶輸入的語義檢索式(重排序表達式),對第一步的結果進行重新排序;

3、顯示排序后的所有檢索結果。


看來這件專利應該屬于自然語義分析的新一代智能搜索技術的應用專利,而與自然語義分析本身沒太大的關系,在說明書中也是引用了一些文獻,并且核心算法并未在說明書中直接公開,僅公開了一些顯性操作過程和執(zhí)行過程。


這件中國專利在授權的權利要求1中主要改變了兩個特征,一是增加了“其中重排序表達式與搜索表達式同時輸入”,二是刪除了對部分文檔進行排序和顯示部分文檔的技術方案(根據(jù)重排序表達式,對部分文檔進行重排序,以所述排序來顯示所述搜索結果中的部分文檔),只保留了對所有文檔進行排序并顯示所有文檔的技術方案。


同族的美國授權專利中也增加了“重排序表達式為搜索查詢附帶的文本字符串,在從數(shù)據(jù)源生成搜索結果時不進行任何操作”的限定。也就是說,語義排序對布爾搜索結果只作排序,不進行再次限定等會影響布爾檢索式搜索結果的操作。


專利檢索中先布爾再語義還是先語義后布爾,這是一個問題


這件專利保護的實際是先布爾限定后語義排序的檢索方式,這種技術可以“使得搜索結果不減少的情況下,與用戶的關注點相關的結果會顯示在結果的最前面。使得用戶能夠首先關注他特別最期望看到的結果,同時又可以完整地看到其它結果。而且,用戶可以對同一個搜索結果根據(jù)需要進行多個不同的排序,只要修改排序表達式即可。使用用戶個性化定制的重排序表達式可以很好的滿足用戶個性化的需求,提高了對搜索結果的瀏覽效率,能夠更快更準確地獲得需要的結果?!?/p>


這件專利申請日是2008年,當時國內數(shù)據(jù)庫方面還停留在關鍵字檢索方式上,基本未涉及語義檢索,所以該數(shù)據(jù)庫能提出這樣的檢索模式和檢索思路,同時被如此多的巨頭引用,也說明了這件專利專利數(shù)據(jù)庫檢索上的技術貢獻和應用前景是比較可觀的,帶領了國內數(shù)據(jù)庫從布爾檢索轉向智能化檢索具有里程碑的意義。


隨著專利數(shù)據(jù)庫的發(fā)展,數(shù)據(jù)量全已經(jīng)是一個最基本的評判指標了,智能化的傻瓜型檢索方式能夠幫助企業(yè)非專業(yè)的IPR經(jīng)過短期培訓也能夠勝任普通的檢索要求;因此,為了使專利數(shù)據(jù)庫的使用更加人性化,語義檢索也成為各大專利數(shù)據(jù)庫宣傳的重點。經(jīng)研究過后,筆者發(fā)現(xiàn)當前布爾與語義的配合存在兩種方式,一種是先布爾限定后語義排序的方式;第二種是先語義檢索出固定量的專利(例如2000條),再用布爾限定在其中繼續(xù)篩選,也就是先語義后布爾的方式。


以下是筆者基于國內兩大數(shù)據(jù)庫演示三種檢索模式。


一、先布爾后語義


1.數(shù)據(jù)庫1


先用布爾檢索,在全文中搜索具有“多旋翼 or 四軸 or 多軸”關鍵詞的專利,一共111335件。


專利檢索中先布爾再語義還是先語義后布爾,這是一個問題


添加語義排序條件“CN106494640B”對結果進行排序。


專利檢索中先布爾再語義還是先語義后布爾,這是一個問題


最終的表達式為R:(“CN106494640B”) AND (TACD_ALL:(多旋翼 or 四軸 or 多軸)),其中R:(“CN106494640B”)部分為語義排序表達式,(TACD_ALL:(多旋翼 or 四軸 or 多軸))部分為布爾限定表達式,結果仍是111335件專利,只不過排序方式發(fā)生了變化,專利CN106494640B的公開版本CN106494640A排在了第一個。與該數(shù)據(jù)庫在幫助中心的介紹相同。


專利檢索中先布爾再語義還是先語義后布爾,這是一個問題

專利檢索中先布爾再語義還是先語義后布爾,這是一個問題


在頂部輸入框可直接輸入語義排序表達式和布爾限定表達式,R:(“CN110641729A”) AND (TACD_ALL:(無人機)),檢索結果數(shù)量變成了123382件專利,專利CN110641729A自身排在了檢索結果第一個。


專利檢索中先布爾再語義還是先語義后布爾,這是一個問題


單獨使用布爾檢索式(TACD_ALL:(無人機))檢索,與布爾+語義的檢索結果相同,也是123382件專利,但檢索結果排序發(fā)生了變化。


專利檢索中先布爾再語義還是先語義后布爾,這是一個問題


2.數(shù)據(jù)庫2


數(shù)據(jù)庫2中可直接同時輸入布爾檢索和語義排序(超級排序)的內容進行檢索,在“標題、摘要、權利要求”中搜索具有“多旋翼 or 四軸 or 多軸”關鍵詞的專利,同時根據(jù)“CN106494640B”進行排序。


專利檢索中先布爾再語義還是先語義后布爾,這是一個問題


最終的表達式為R=(CN106494640B) AND (TIABC=(多旋翼 OR 四軸 OR 多軸)),其中R=(CN106494640B)部分為語義排序表達式,(TIABC=(多旋翼 OR 四軸 OR 多軸))部分為布爾限定表達式。檢索結果一共52999件,其中每件專利都標記了相關度百分比,專利CN106494640B的公開版本CN106494640A排在了第二個,相關度是63.27%。


專利檢索中先布爾再語義還是先語義后布爾,這是一個問題


刪除語義表達式,單獨使用布爾檢索式(TIABC=(多旋翼 OR 四軸 OR 多軸))檢索,與布爾+語義的檢索結果相同,也是52999件專利,但檢索結果排序發(fā)生了變化。


專利檢索中先布爾再語義還是先語義后布爾,這是一個問題


我們也嘗試了在頂部輸入框直接輸入語義排序表達式和布爾限定表達式,R=(CN106124517A) AND (TIABC=(無人機)),檢索結果發(fā)生了變化,檢索結果數(shù)量變成了75229件專利


專利檢索中先布爾再語義還是先語義后布爾,這是一個問題


單獨使用布爾檢索式(TIABC=(無人機))檢索,與布爾+語義的檢索結果相同,也是75229件專利,但檢索結果中無相關度百分比,排序發(fā)生了變化。


專利檢索中先布爾再語義還是先語義后布爾,這是一個問題



二、先語義后布爾


在各數(shù)據(jù)庫獨立的語義檢索模塊中操作時,檢索模式并非先布爾后語義的模式,而是采用了相反的先語義后布爾的模式,具體來說,是先通過語義檢索先找出固定數(shù)量的相關專利(例如2000條),再使用布爾限定在已找出來的固定數(shù)量的專利中繼續(xù)篩選符合布爾檢索條件的專利,因此這種模式下,最終的檢索數(shù)量一定小于等于通過語義檢索篩選出的專利數(shù)量,同時也一定小于等于僅布爾檢索條件的檢索結果數(shù)量。


1.數(shù)據(jù)庫1


先在語義搜索中輸入語義搜索條件CN106494640B。


專利檢索中先布爾再語義還是先語義后布爾,這是一個問題


檢索結果中可得到1000條檢索結果,每個結果都有相關度百分比,并且是逐漸降低的,也就是說系統(tǒng)截取了最相關的1000個檢索結果,語義檢索表達式是一串加密的代碼。


專利檢索中先布爾再語義還是先語義后布爾,這是一個問題


在語義檢索基礎上,使用布爾檢索條件限定IPC分類號為B64F5/60,進行二次過濾。


專利檢索中先布爾再語義還是先語義后布爾,這是一個問題


過濾后檢索結果為75條,也就是原1000條相關專利中,有75件專利的IPC分類號為B64F5/60。


專利檢索中先布爾再語義還是先語義后布爾,這是一個問題


而單獨檢索IPC分類號為B64F5/60的專利為3588條,也就是說此種方式并不是先布爾限定后語義排序,而是先語義檢索出1000條專利,在1000條結果中,再限定IPC分類號為B64F5/60的專利,共75條。


專利檢索中先布爾再語義還是先語義后布爾,這是一個問題


2.數(shù)據(jù)庫2


先在語義搜索中輸入語義搜索條件CN106494640B。


專利檢索中先布爾再語義還是先語義后布爾,這是一個問題


檢索結果中可得到2000條檢索結果,每個結果都有相關度百分比,并且是逐漸降低的,也就是說系統(tǒng)截取了最相關的2000個檢索結果。


專利檢索中先布爾再語義還是先語義后布爾,這是一個問題


在語義檢索基礎上,使用布爾檢索條件限定IPC分類號為B64F5/60,進行二次過濾。


專利檢索中先布爾再語義還是先語義后布爾,這是一個問題


過濾后檢索結果為45條,也就是原2000條相關專利中,有45件專利的IPC分類號為B64F5/60。


專利檢索中先布爾再語義還是先語義后布爾,這是一個問題


而單獨檢索IPC分類號為B64F5/60的專利與數(shù)據(jù)庫1相同,也是3559條,也就是說此種方式并不是先布爾限定后語義排序,而是先語義檢索出2000條專利,在2000條結果中,再限定IPC分類號為B64F5/60的專利,共45條。


專利檢索中先布爾再語義還是先語義后布爾,這是一個問題


三、先布爾后語義+截斷


1.數(shù)據(jù)庫1


在數(shù)據(jù)庫1獨立的語義檢索模塊中操作時,界面下方還可以同時輸入一些布爾限定條件,看起來類似先布爾后語義的模式,但從檢索結果看,仍是1000條結果。


專利檢索中先布爾再語義還是先語義后布爾,這是一個問題

專利檢索中先布爾再語義還是先語義后布爾,這是一個問題


使用IPC分類號B64F5/60對結果進行二次限定,檢索結果仍是1000條,并且檢索結果排序未發(fā)生變化。也就是說原檢索結果中所有的專利都具有IPC分類號B64F5/60,這種模式應該是先布爾后語義,同時做了相應的截斷處理,未顯示完整所有的布爾檢索結果。


專利檢索中先布爾再語義還是先語義后布爾,這是一個問題

專利檢索中先布爾再語義還是先語義后布爾,這是一個問題


2.數(shù)據(jù)庫2


在數(shù)據(jù)庫2獨立的語義檢索模塊中同時輸入布爾限定條件,檢索結果也仍是2000條結果。


專利檢索中先布爾再語義還是先語義后布爾,這是一個問題

專利檢索中先布爾再語義還是先語義后布爾,這是一個問題


使用IPC分類號B64F5/60對結果進行二次限定,檢索結果仍是2000條,并且檢索結果排序未發(fā)生變化。也就是說與數(shù)據(jù)庫1一樣,原檢索結果中所有的專利都具有IPC分類號B64F5/60,這種模式應該也是先布爾后語義,同時做了相應的截斷處理,未顯示完整所有的布爾檢索結果。


專利檢索中先布爾再語義還是先語義后布爾,這是一個問題

專利檢索中先布爾再語義還是先語義后布爾,這是一個問題


四、小結


由此以上分析,當前語義+布爾的檢索模式一共三種,并且各主要數(shù)據(jù)庫都支持這三種模式。先布爾后語義的模式是先使用關鍵詞檢索等布爾條件檢索出一個專利集合,再使用語義排序對這個集合進行相關度排序,并且顯示專利集合中所有的專利;因此,檢索結果仍然是布爾檢索的結果,只是排序發(fā)生了改變;先語義后布爾的模式是先使用語義檢索以檢索出固定數(shù)量(一般為1000或2000)的專利,在這個范圍內,再使用布爾檢索條件進一步限定,檢索結果是兩者的交集,專利數(shù)量小于等于語義檢索條件以及布爾檢索條件;最后一種先布爾后語義+截斷的模式,則是在先布爾后語義的模式下,不顯示所有檢索結果,而是截斷至前1000個或2000個。


綜上,從上述檢索結果可以看出,目前國內數(shù)據(jù)庫巨頭基于上述三種方式檢索反饋的結果數(shù)據(jù)量是不相伯仲的,那有沒有相應公司能夠開發(fā)一套具有全新檢索方式和檢索思路的專利數(shù)據(jù)庫,咱們拭目以待。


來源:IPRdaily中文網(wǎng)(iprdaily.cn)

作者:吳正明 常州市權航專利代理有限公司

編輯:IPRdaily王穎          校對:IPRdaily縱橫君


注:原文鏈接專利檢索中先布爾再語義還是先語義后布爾,這是一個問題(點擊標題查看原文)


專利檢索中先布爾再語義還是先語義后布爾,這是一個問題

青年有為!尋找2021年“40位40歲以下企業(yè)知識產權精英”活動正式啟動


專利檢索中先布爾再語義還是先語義后布爾,這是一個問題

報名!2021年「涉外專利代理高級研修班【上海站】」來啦!


專利檢索中先布爾再語義還是先語義后布爾,這是一個問題

報名!8天過實務-專代實務考試面授集訓營【華南站】正式招生


專利檢索中先布爾再語義還是先語義后布爾,這是一個問題

「關于IPRdaily」


IPRdaily是具有全球影響力的知識產權媒體,致力于連接全球知識產權與科技創(chuàng)新人才。匯聚了來自于中國、美國、歐洲、俄羅斯、以色列、澳大利亞、新加坡、日本、韓國等15個國家和地區(qū)的高科技公司及成長型科技企業(yè)的管理者及科技研發(fā)或知識產權負責人,還有來自政府、律師及代理事務所、研發(fā)或服務機構的全球近100萬用戶(國內70余萬+海外近30萬),2019年全年全網(wǎng)頁面瀏覽量已經(jīng)突破過億次傳播。


(英文官網(wǎng):iprdaily.com  中文官網(wǎng):iprdaily.cn) 


本文來IPRdaily中文網(wǎng)(iprdaily.cn)并經(jīng)IPRdaily.cn中文網(wǎng)編輯。轉載此文章須經(jīng)權利人同意,并附上出處與作者信息。文章不代表IPRdaily.cn立場,如若轉載,請注明出處:“http://m.jupyterflow.com/

邊度投稿作者
共發(fā)表文章1634
最近文章
關鍵詞
首席知識產權官 世界知識產權日 美國專利訴訟管理策略 大數(shù)據(jù) 軟件著作權登記 專利商標 商標注冊人 人工智能 版權登記代理 如何快速獲得美國專利授權? 材料科學 申請注冊商標 軟件著作權 虛擬現(xiàn)實與增強現(xiàn)實 專利侵權糾紛行政處理 專利預警 知識產權 全球視野 中國商標 版權保護中心 智能硬件 新材料 新一代信息技術產業(yè) 躲過商標轉讓的陷阱 航空航天裝備 樂天 產業(yè) 海洋工程裝備及高技術船舶 著作權 電子版權 醫(yī)藥及高性能醫(yī)療器械 中國專利年報 游戲動漫 條例 國際專利 商標 實用新型專利 專利費用 專利管理 出版管理條例 版權商標 知識產權侵權 商標審查協(xié)作中心 法律和政策 企業(yè)商標布局 新商標審查「不規(guī)范漢字」審理標準 專利機構排名 商標分類 專利檢索 申請商標注冊 法規(guī) 行業(yè) 法律常識 設計專利 2016知識產權行業(yè)分析 發(fā)明專利申請 國家商標總局 電影版權 專利申請 香港知識產權 國防知識產權 國際版權交易 十件 版權 顧問 版權登記 發(fā)明專利 亞洲知識產權 版權歸屬 商標辦理 商標申請 美國專利局 ip 共享單車 一帶一路商標 融資 馳名商標保護 知識產權工程師 授權 音樂的版權 專利 商標數(shù)據(jù) 知識產權局 知識產權法 專利小白 商標是什么 商標注冊 知識產權網(wǎng) 中超 商標審查 維權 律所 專利代理人 知識產權案例 專利運營 現(xiàn)代產業(yè)
本文來自于iprdaily,永久保存地址為http://m.jupyterflow.com/article_29096.html,發(fā)布時間為2021-09-14 10:57:04。

文章不錯,犒勞下辛苦的作者吧

    我也說兩句
    還可以輸入140個字
    我要評論
    回復
    還可以輸入 70 個字
    請選擇打賞金額