#本文僅代表作者觀點(diǎn),不代表IPRdaily立場(chǎng),未經(jīng)作者許可,禁止轉(zhuǎn)載#
“在知識(shí)產(chǎn)權(quán)領(lǐng)域來說,甚至有人開始嘗試讓ChatGPT撰寫專利文件。那么,ChatGPT是否能應(yīng)用于專利檢索?ChatGPT的檢索能力如何?”
來源:IPRdaily中文網(wǎng)(iprdaily.cn)
作者:梁嘉琦 嘉權(quán)專利商標(biāo)事務(wù)所軟件通訊與電學(xué)總監(jiān)
近日,人工智能技術(shù)ChatGPT成為了熱門話題,受到了廣泛的關(guān)注和討論。其在自然語言處理和文本分析等領(lǐng)域的應(yīng)用效果備受好評(píng),引起了人們的極大興趣。ChatGPT(Generative Pre-trained Transformer)是備受矚目的一項(xiàng)技術(shù)。它基于深度學(xué)習(xí)和自然語言處理技術(shù),可以用來生成自然語言文本、對(duì)話、問答等各種語言模型,是目前在語言領(lǐng)域中最先進(jìn)和高效的技術(shù)之一。
ChatGPT的應(yīng)用范圍非常廣泛。例如,它可以用于智能客服、虛擬助手、智能問答、機(jī)器翻譯、摘要生成等多個(gè)領(lǐng)域。在醫(yī)療、金融、法律、媒體等領(lǐng)域,也可以應(yīng)用ChatGPT來生成和分析文本數(shù)據(jù),從而提高工作效率和準(zhǔn)確度。
隨著ChatGPT的熱潮,人們不斷開發(fā)對(duì)ChatGPT的應(yīng)用,使ChatGPT被應(yīng)用在不同的領(lǐng)域。例如,它可以用于智能客服、虛擬助手、智能問答、機(jī)器翻譯、摘要生成等多個(gè)領(lǐng)域。在醫(yī)療、金融、法律、媒體等領(lǐng)域,也可以應(yīng)用ChatGPT來生成和分析文本數(shù)據(jù),從而提高工作效率和準(zhǔn)確度。在知識(shí)產(chǎn)權(quán)領(lǐng)域來說,甚至有人開始嘗試讓ChatGPT撰寫專利文件。
另一方面,ChatGPT是否能應(yīng)用于檢索專利文獻(xiàn),我們不禁對(duì)此展開思考。傳統(tǒng)的專利檢索工作需要專利代理師進(jìn)行人工檢索和篩選,而ChatGPT作為一種具有高度自動(dòng)化的技術(shù),可以自動(dòng)處理文本數(shù)據(jù)、提取和分析信息。
我們想象一個(gè)場(chǎng)景,如果用戶只需要將技術(shù)內(nèi)容或者專利公開號(hào)輸入到ChatGPT中就能夠自動(dòng)完成專利文獻(xiàn)的檢索,就不用專門委托專利代理師檢索了,這也讓一些專利檢索從業(yè)人員開始感到擔(dān)憂,他們的工作可能會(huì)被ChatGPT取代。
究竟ChatGPT是否能應(yīng)用于專利檢索,以及ChatGPT的檢索能力如何。我們對(duì)此直接進(jìn)行了相關(guān)的測(cè)試。
這是我們準(zhǔn)備的檢索對(duì)象:
圖1
如上述圖1所示,公開了一種杯子,包括杯體、杯蓋和螺旋式吸管,吸管頂端作為吸水口,吸管最下端為進(jìn)水口,其特征在于,該螺旋式吸管纏繞杯子外壁設(shè)置。由于吸管纏繞在杯體的外壁,因此能夠起到抗震保護(hù)杯體的效果。
針對(duì)上述內(nèi)容,我們直接使用ChatGPT進(jìn)行檢索,看看檢索效果如何?在ChatGPT對(duì)話框中,我們輸入如下語句,并得到ChatGPT的回答。
圖2
可以看到,ChatGPT幾乎立即就完成了檢索,給出了公開號(hào)、專利名稱和近似的理由,根據(jù)ChatGPT輸出的內(nèi)容,好像都找到了與本申請(qǐng)十分接近的專利文獻(xiàn),這是不是證明ChatGPT的確能不費(fèi)吹灰之力完成專利檢索呢?我們對(duì)ChatGPT的檢索結(jié)果進(jìn)行驗(yàn)證:
圖3
通過對(duì)ChatGPT給出的結(jié)果進(jìn)行檢索,發(fā)現(xiàn)和我們要檢索的內(nèi)容毫不相關(guān),那么,為什么ChatGPT會(huì)給出這樣不靠譜的答案呢?
我們通過了解知道,ChatGPT實(shí)質(zhì)是一個(gè)語義應(yīng)答模型,是不具備實(shí)時(shí)檢索專利數(shù)據(jù)庫(kù)功能的,因此其給出的答案可能毫無真實(shí)性可言。
這說明ChatGPT的專利檢索能力失敗呢?我們換一個(gè)思路,直接檢索不行,用來構(gòu)建檢索式行不行呢?理論上,ChatGPT擅長(zhǎng)的是語義識(shí)別提取,那么提取文本中的關(guān)鍵信息并自動(dòng)構(gòu)建檢索式,用戶就可以直接在數(shù)據(jù)庫(kù)中進(jìn)行檢索,這樣也可以取代專利檢索從業(yè)人員的工作,就這個(gè)思路,我們進(jìn)一步進(jìn)行操作,讓ChatGPT提取技術(shù)文本中的特征并自動(dòng)構(gòu)建檢索式:
圖4
可以看出,ChatGPT根據(jù)技術(shù)效果從技術(shù)文本中提取了杯子,螺旋吸管,纏繞以及抗震這些特征構(gòu)建檢索式,看上去還是比較準(zhǔn)確,不過這是在有益效果說的比較清楚的情況下,我們輸入的技術(shù)效果是根據(jù)特征推理出來的,也就是說我對(duì)技術(shù)效果做了一定的加工,在大多數(shù)情況下,復(fù)制的技術(shù)效果都比較籠統(tǒng),這樣ChatGPT的識(shí)別就會(huì)出現(xiàn)問題,例如:
圖5
當(dāng)技術(shù)效果不結(jié)合特征進(jìn)行描述時(shí),ChatGPT是無法準(zhǔn)確提取檢索要素的。那么,如果連有益效果也不給出,ChatGPT能提取出準(zhǔn)確的檢索要素嗎?
圖6
可以看出,如果不限定檢索式,則會(huì)將技術(shù)文本中的所有關(guān)鍵詞進(jìn)行檢索式的構(gòu)建,檢索范圍太小,導(dǎo)致檢索不出專利。對(duì)比圖4至圖6ChatGPT給出的檢索式,認(rèn)為圖4的檢索式比較符合要求,我們采用字段“標(biāo)題+摘要+權(quán)利要求”驗(yàn)證圖4給出的檢索式,得到如下結(jié)果:
圖7
從圖7中可以看出,只有9篇檢索結(jié)果,而且大多是不相關(guān)的內(nèi)容。從上面可以看出,在完成關(guān)鍵詞的提取及檢索式構(gòu)建上,目前ChatGPT還不太勝任。也就是說,用戶如果不懂檢索的原理,不分析技術(shù)內(nèi)容,只是簡(jiǎn)單把技術(shù)文本交給ChatGPT進(jìn)行檢索式的構(gòu)建,檢索結(jié)果是有問題的,這樣會(huì)導(dǎo)致用戶認(rèn)為技術(shù)文本是具備創(chuàng)造性的錯(cuò)誤結(jié)論。
那么,ChatGPT是否能夠在專利代理師的配合下很好地完成檢索工作呢?我們進(jìn)一步進(jìn)行測(cè)試,這次,根據(jù)ChatGPT的強(qiáng)項(xiàng),我們先讓ChatGPT對(duì)技術(shù)文本進(jìn)行關(guān)鍵詞的提取:
圖8
可見,ChatGPT對(duì)技術(shù)文本的關(guān)鍵詞提取還是十分準(zhǔn)確的,分詞也是較為合理。這樣,專利代理師就可以直接在關(guān)鍵詞結(jié)果中選擇所需要檢索的檢索要素并讓chatgpt構(gòu)建檢索式(即專利代理師參與了基本檢索要素的選擇),例如:
圖9
從結(jié)果可以看出,ChatGPT對(duì)于關(guān)鍵詞的擴(kuò)展能力是比較優(yōu)秀的,而且生成的檢索式能夠直接復(fù)制到檢索數(shù)據(jù)庫(kù)中進(jìn)行檢索,不用再手動(dòng)輸入括號(hào)以及邏輯運(yùn)算符了。我們?cè)賹?duì)檢索式進(jìn)行驗(yàn)證,得到如下結(jié)果。
圖10
十分驚喜的是,這次的檢索結(jié)果比較理想,檢索結(jié)果都是目標(biāo)專利。也就是說,專利代理師通過分析技術(shù)方案,確定準(zhǔn)確的檢索要素,再由chatgpt進(jìn)行關(guān)鍵詞擴(kuò)展和檢索式構(gòu)建,能夠在一定程度上提高專利代理師的檢索效率,特別是在初檢的時(shí)候,專利代理師在閱讀完技術(shù)方案后,在chatgpt的輔助下能較快地得到專利的初檢結(jié)果,并且能夠方便地進(jìn)一步對(duì)檢索式進(jìn)行調(diào)整(例如增減關(guān)鍵詞、用分類號(hào)代替某個(gè)檢索要素、調(diào)整檢索字段等等)。
另外,是否能夠讓ChatGPT自動(dòng)找分類號(hào)呢?我們也進(jìn)行了測(cè)試:
圖11
可見,ChatGPT也能夠很快地給出分類號(hào),但需要警惕的是,每當(dāng)ChatGPT輸出數(shù)字或者號(hào)碼答案時(shí),一定要對(duì)其進(jìn)行驗(yàn)證,果不其然,分類號(hào)都是不準(zhǔn)確的。
圖12
從圖12可知,ChatGPT給出的分類號(hào)只是餐桌上的飲水器皿,并非傳統(tǒng)意義上的水杯。因此,用ChatGPT進(jìn)行分類號(hào)的提取準(zhǔn)確性較低,還不如對(duì)圖10中的檢索結(jié)果進(jìn)行分類號(hào)的統(tǒng)計(jì),這樣還能更快獲得水杯的分類號(hào)。
綜上所述,ChatGPT并不能自動(dòng)完成專利檢索任務(wù),雖然ChatGPT能夠較好地完成關(guān)鍵詞的提取,但是ChatGPT不能判斷哪些關(guān)鍵詞為基本檢索要素,而對(duì)基本檢索要素的把握是專利代理師能夠較好完成檢索任務(wù)的關(guān)鍵,也是專利代理師的核心價(jià)值所在,這部分是目前ChatGPT所不能取代的。因此目前的ChatGPT并不會(huì)導(dǎo)致專利檢索從業(yè)人員的失業(yè)。
那么是否讓ChatGPT成為專利代理師的檢索工具,提高檢索效率嗎?我認(rèn)為是有限的,一方面,專利代理師的檢索戰(zhàn)場(chǎng)是在專利數(shù)據(jù)庫(kù)中,檢索所花費(fèi)的大部分時(shí)間精力在于檢索式的調(diào)整和文獻(xiàn)的瀏覽,而ChatGPT僅僅提供了一種快速進(jìn)入“戰(zhàn)場(chǎng)”的方法。雖然ChatGPT的關(guān)鍵詞擴(kuò)展能力較優(yōu),但是一般的專利數(shù)據(jù)庫(kù)中都自帶了關(guān)鍵詞擴(kuò)展工具,也能很好地完成關(guān)鍵詞擴(kuò)展的操作,使用ChatGPT進(jìn)行關(guān)鍵詞擴(kuò)展是只應(yīng)用上更加方便,并不會(huì)為檢索質(zhì)量和效率帶來實(shí)質(zhì)性的飛躍。
由于ChatGPT的帳號(hào)注冊(cè)以及運(yùn)行環(huán)境均具有不小的門檻,因此我認(rèn)為沒有必要為了輔助檢索而特意使用ChatGPT。如果想嘗鮮使用ChatGPT進(jìn)行檢索的朋友,也可以參考上文中我和ChatGPT之間的對(duì)話。
當(dāng)然,隨著ChatGPT的迭代更新,未來可能會(huì)實(shí)現(xiàn)基本檢索要素的準(zhǔn)確識(shí)別,或者在專利文獻(xiàn)近似度判斷方面能有更好的表現(xiàn)。我們也會(huì)密切關(guān)注技術(shù)進(jìn)展,并為大家更新相關(guān)的資訊以及使用技巧。
(原標(biāo)題:探索ChatGPT在專利檢索中的應(yīng)用)
來源:IPRdaily中文網(wǎng)(iprdaily.cn)
作者:梁嘉琦 廣州嘉權(quán)專利商標(biāo)事務(wù)所有限公司
編輯:IPRdaily趙甄 校對(duì):IPRdaily縱橫君
注:原文鏈接:探索ChatGPT在專利檢索中的應(yīng)用(點(diǎn)擊標(biāo)題查看原文)
「關(guān)于IPRdaily」
IPRdaily是全球領(lǐng)先的知識(shí)產(chǎn)權(quán)綜合信息服務(wù)提供商,致力于連接全球知識(shí)產(chǎn)權(quán)與科技創(chuàng)新人才。匯聚了來自于中國(guó)、美國(guó)、歐洲、俄羅斯、以色列、澳大利亞、新加坡、日本、韓國(guó)等15個(gè)國(guó)家和地區(qū)的高科技公司及成長(zhǎng)型科技企業(yè)的管理者及科技研發(fā)或知識(shí)產(chǎn)權(quán)負(fù)責(zé)人,還有來自政府、律師及代理事務(wù)所、研發(fā)或服務(wù)機(jī)構(gòu)的全球近100萬用戶(國(guó)內(nèi)70余萬+海外近30萬),2019年全年全網(wǎng)頁面瀏覽量已經(jīng)突破過億次傳播。
(英文官網(wǎng):iprdaily.com 中文官網(wǎng):iprdaily.cn)
本文來自IPRdaily中文網(wǎng)(iprdaily.cn)并經(jīng)IPRdaily.cn中文網(wǎng)編輯。轉(zhuǎn)載此文章須經(jīng)權(quán)利人同意,并附上出處與作者信息。文章不代表IPRdaily.cn立場(chǎng),如若轉(zhuǎn)載,請(qǐng)注明出處:“http://m.jupyterflow.com”
文章不錯(cuò),犒勞下辛苦的作者吧