#本文僅代表作者觀點(diǎn),不代表IPRdaily立場(chǎng),未經(jīng)作者許可,禁止轉(zhuǎn)載#
“技術(shù)交底書作為發(fā)明人與企業(yè)IPR及專利代理師溝通的橋梁,其質(zhì)量不僅影響溝通效率,更是撰寫一份優(yōu)質(zhì)專利申請(qǐng)文件的基礎(chǔ)。那么,如何將一些專業(yè)術(shù)語(yǔ)轉(zhuǎn)化為發(fā)明人能聽懂的語(yǔ)言,教會(huì)發(fā)明人寫一份合格的AI技術(shù)交底書呢?”
來(lái)源:IPRdaily中文網(wǎng)(iprdaily.cn)
作者:陳會(huì)紅
人工智能(AI)領(lǐng)域的專利容易存在保護(hù)客體的問題,馬上消費(fèi)金融股份有限公司深耕AI領(lǐng)域多年,申請(qǐng)了近千件相關(guān)的專利。通過大量案例的實(shí)踐研究,總結(jié)出一套企業(yè)IPR與發(fā)明人溝通的方法論,詳細(xì)介紹如下:
技術(shù)交底書作為發(fā)明人與企業(yè)IPR及專利代理師溝通的橋梁,其質(zhì)量不僅影響溝通效率,更是撰寫一份優(yōu)質(zhì)專利申請(qǐng)文件的基礎(chǔ),直接影響專利申請(qǐng)的授權(quán)率,甚至?xí)绊憣@姆€(wěn)定性、維權(quán)及許可的價(jià)值。
AI領(lǐng)域的技術(shù)方案通常涉及算法,對(duì)于一名AI方向的企業(yè)IPR,你已熟知專利法、及專利審查指南中對(duì)涉及“算法特征的專利申請(qǐng)的審查規(guī)定”,了解到只有“權(quán)利要求包含技術(shù)特征、記載了對(duì)要解決的技術(shù)問題采用了利用自然規(guī)律的技術(shù)手段、并且由此獲得符合自然規(guī)律的技術(shù)效果”的專利申請(qǐng)才有可能獲得授權(quán)。然而,“技術(shù)特征,技術(shù)問題、技術(shù)手段、技術(shù)效果、自然規(guī)律”這些術(shù)語(yǔ),如果直接給到發(fā)明人,估計(jì)大部分發(fā)明人都暈菜了。
那么,如何將這些專業(yè)術(shù)語(yǔ)轉(zhuǎn)化為發(fā)明人能聽懂的語(yǔ)言,教會(huì)發(fā)明人寫一份合格的AI技術(shù)交底書呢?由于目前在中國(guó)的相關(guān)法規(guī)中,沒有非常明確的關(guān)于“技術(shù)”、“自然規(guī)律”等概念的定義,需要通過典型審查案例的研究和總結(jié),來(lái)給發(fā)明人撰寫技術(shù)交底書指明方向。
1.技術(shù)領(lǐng)域:技術(shù)應(yīng)用的具體技術(shù)領(lǐng)域,建議與技術(shù)實(shí)際應(yīng)用的至少一個(gè)應(yīng)用場(chǎng)景結(jié)合闡述。若為前瞻性的預(yù)研類技術(shù),建議與可能應(yīng)用到的至少一個(gè)應(yīng)用場(chǎng)景結(jié)合闡述。
示例如下:信息檢索和推薦……
2.技術(shù)問題:結(jié)合上述場(chǎng)景,先闡述現(xiàn)有的算法、模型在實(shí)際應(yīng)用中或預(yù)研過程中存在的問題,進(jìn)而從技術(shù)的角度推導(dǎo)出本方案能解決什么問題。
示例如下:將GAN應(yīng)用于信息檢索,為了解決IGRAN的問題,CFGAN以Vector-Wise Training的方式進(jìn)行訓(xùn)練:對(duì)于每個(gè)用戶,以他的歷史交互序列Vector作為模型輸入。但這一做法的問題在于Vector的粒度過大,僅僅依靠GAN的損失函數(shù)并不足以充分訓(xùn)練生成器,這樣將會(huì)導(dǎo)致GAN不能完全捕獲文本信息,導(dǎo)致訓(xùn)練GAN的預(yù)測(cè)能力較低。本方案通過添加G重構(gòu)后Vector的生成損失(Reconstruction Loss)來(lái)輔助訓(xùn)練……。
3.技術(shù)手段:對(duì)于上述的問題,闡述具體的解決方案。包括不限于:算法應(yīng)與具體技術(shù)領(lǐng)域(應(yīng)用場(chǎng)景)緊密結(jié)合闡述,緊密結(jié)合指的是至少算法的輸入、輸出數(shù)據(jù)應(yīng)在該具體技術(shù)領(lǐng)域中有技術(shù)含義。涉及到公式,寫明公式中各參數(shù)的技術(shù)含義。若算法的輸入、輸出數(shù)據(jù)是沒有技術(shù)含義的數(shù)據(jù),如僅為“樣本”、“訓(xùn)練數(shù)據(jù)”等,專利代理師在撰寫申請(qǐng)文件時(shí)亦無(wú)法知曉算法中各數(shù)據(jù)的含義,則專利申請(qǐng)存在較大的駁回風(fēng)險(xiǎn)。
示例如下:(基于篇幅問題,僅示出部分內(nèi)容以做克服客體問題示例說明,不是發(fā)明的全部?jī)?nèi)容,亦不涉及創(chuàng)造性問題)
DPGAN的整體架構(gòu)及流程:如下圖所示,DPGAN模型包含生成模型G和判別模型D兩個(gè)部分。其中,G采用DeepFM模型,D采用BPR模型,目的是在歷史數(shù)據(jù)中獲得更多的有效信息,更好的完成商品或者信息的推薦。【tips:與具體應(yīng)用場(chǎng)景結(jié)合】
tips:附圖可以更直觀的幫助理解技術(shù)方案
在數(shù)據(jù)方面,使用用戶基本數(shù)據(jù)和對(duì)象數(shù)據(jù),用戶基本數(shù)據(jù)包含……等結(jié)構(gòu)化數(shù)據(jù)及隱式信息,對(duì)象數(shù)據(jù)包含……等。推薦過程方面,輸入某一用戶數(shù)據(jù)信息,G生成該用戶的偏好序列,即圖中的生成向量;把生成向量和真實(shí)向量組成三元組的形式,即
其中,代表用戶u對(duì)物品i的喜愛程度。生成模型G得到的用戶偏好序列與真實(shí)序列的近似程度,決定著生成模型G性能的優(yōu)劣?!総ips:公式中各參數(shù)有具體的技術(shù)含義】
由此可得生成模型G的目標(biāo)函數(shù)為:
其中,是G的正則化系數(shù),是真實(shí)數(shù)據(jù)的序列,是G的生成序列。
判別模型D:
使用BPR作為判別模型,用于區(qū)分真實(shí)數(shù)據(jù)和生成數(shù)據(jù)。在BPR算法中,把用戶u對(duì)應(yīng)的物品進(jìn)行標(biāo)記,如果用戶u在同時(shí)有物品i和j的時(shí)候點(diǎn)擊了i,那么就得到了一個(gè)三元組
假設(shè)
其中,是正則化參數(shù),表示排序序列,表示與j相比用戶更偏愛i,是采樣獲得的數(shù)據(jù)集。
對(duì)判別模型D,可表示為:
其中,代表用戶u對(duì)物品i的喜愛程度,表示與j相比用戶更偏愛i的概率,和分別是用戶和物品的隱向量,是物品的偏置表示。
由此可得生成模型G的目標(biāo)函數(shù)為:
其中,是D的正則化系數(shù)。
生成模型G訓(xùn)練、優(yōu)化:
……
判別模型D訓(xùn)練、優(yōu)化:
……
4.技術(shù)效果:從技術(shù)角度推導(dǎo)出的效果,即技術(shù)手段和技術(shù)效果之間是強(qiáng)關(guān)聯(lián)的,需結(jié)合技術(shù)手段闡述技術(shù)效果的產(chǎn)生原因。技術(shù)效果若有實(shí)驗(yàn)數(shù)據(jù)證明,效果更直觀,如本方案的模型與現(xiàn)有模型的結(jié)果對(duì)比數(shù)據(jù)。若效果和技術(shù)手段是孤立的,或者僅為數(shù)學(xué)意義上、用戶體驗(yàn)上的效果,則不能被認(rèn)定為本方案的技術(shù)效果。
示例如下:如前所述,GAN網(wǎng)絡(luò)具有許多優(yōu)勢(shì),但是,GAN網(wǎng)絡(luò)也存在著訓(xùn)練過程復(fù)雜的問題。其一,訓(xùn)練不穩(wěn)定問題,容易出現(xiàn)震蕩和收斂假象。因?yàn)榕袆e模型 D 損失降級(jí)會(huì)改善生成模型 G 的損失,反之亦然,因此無(wú)法根據(jù)損失函數(shù)的值來(lái)判斷收斂。其二,模型崩潰問題,GAN的訓(xùn)練過程可能發(fā)生崩潰問題,生成模型開始退化,總是生成同樣的樣本點(diǎn),無(wú)法繼續(xù)學(xué)習(xí)。當(dāng)生成模型崩潰時(shí),判別模型也會(huì)對(duì)相似的樣本點(diǎn)指向相似的方向,訓(xùn)練無(wú)法繼續(xù)。
本方案使用模型預(yù)訓(xùn)練來(lái)優(yōu)化GAN網(wǎng)絡(luò)的訓(xùn)練問題,即分別對(duì)生成模型G和判別模型D進(jìn)行預(yù)訓(xùn)練。生成模型G是在DeepFM算法基礎(chǔ)上完成的,該算法既可以作為特征提取器,也可以獨(dú)立使用完成推薦過程,因此可以預(yù)訓(xùn)練生成模型G;判別模型D是在BPR算法基礎(chǔ)上完成的,依據(jù)采樣數(shù)據(jù)對(duì)的特點(diǎn),可采用矩陣分解的方式預(yù)訓(xùn)練判別模型D。當(dāng)生成模型G和判別模型D處于穩(wěn)定狀態(tài)時(shí),DPGAN模型再依據(jù)對(duì)應(yīng)的優(yōu)化方式不斷迭代持續(xù)優(yōu)化,進(jìn)一步提升網(wǎng)絡(luò)的效果,解決了訓(xùn)練困難的問題,進(jìn)一步提升了模型性能。
本方案基于GAN網(wǎng)絡(luò)思想的DPGAN網(wǎng)絡(luò)架構(gòu),DPGAN具備更好的特征抓取能力以及更加精確的推薦性能,解決了現(xiàn)有模型并不能完全捕獲文本信息,且模型精度較低,以及這些模型忽略了用戶的輔助信息以及隱式信息,因而不能更加準(zhǔn)確的獲取用戶的喜好的問題。
綜上,若發(fā)明人能參考上述建議撰寫算法類(AI)的技術(shù)交底書,專利代理師撰寫出的專利申請(qǐng)文件,通常都能滿足客體要求,即“權(quán)利要求包含技術(shù)特征、記載了對(duì)要解決的技術(shù)問題采用了利用自然規(guī)律的技術(shù)手段、并且由此獲得符合自然規(guī)律的技術(shù)效果”。
(原標(biāo)題:搭建專利授權(quán)的橋梁——教會(huì)發(fā)明人撰寫AI專利交底書)
來(lái)源:IPRdaily中文網(wǎng)(iprdaily.cn)
作者:陳會(huì)紅
編輯:IPRdaily趙甄 校對(duì):IPRdaily縱橫君
注:原文鏈接:搭建專利授權(quán)的橋梁——教會(huì)發(fā)明人撰寫AI專利交底書(點(diǎn)擊標(biāo)題查看原文)
「關(guān)于IPRdaily」
IPRdaily是全球領(lǐng)先的知識(shí)產(chǎn)權(quán)綜合信息服務(wù)提供商,致力于連接全球知識(shí)產(chǎn)權(quán)與科技創(chuàng)新人才。匯聚了來(lái)自于中國(guó)、美國(guó)、歐洲、俄羅斯、以色列、澳大利亞、新加坡、日本、韓國(guó)等15個(gè)國(guó)家和地區(qū)的高科技公司及成長(zhǎng)型科技企業(yè)的管理者及科技研發(fā)或知識(shí)產(chǎn)權(quán)負(fù)責(zé)人,還有來(lái)自政府、律師及代理事務(wù)所、研發(fā)或服務(wù)機(jī)構(gòu)的全球近100萬(wàn)用戶(國(guó)內(nèi)70余萬(wàn)+海外近30萬(wàn)),2019年全年全網(wǎng)頁(yè)面瀏覽量已經(jīng)突破過億次傳播。
(英文官網(wǎng):iprdaily.com 中文官網(wǎng):iprdaily.cn)
本文來(lái)自IPRdaily中文網(wǎng)(iprdaily.cn)并經(jīng)IPRdaily.cn中文網(wǎng)編輯。轉(zhuǎn)載此文章須經(jīng)權(quán)利人同意,并附上出處與作者信息。文章不代表IPRdaily.cn立場(chǎng),如若轉(zhuǎn)載,請(qǐng)注明出處:“http://m.jupyterflow.com”
對(duì)話女性知識(shí)產(chǎn)權(quán)人系列|程爽:二十年只做一件事,堅(jiān)守創(chuàng)新保護(hù)者的使命
中國(guó)科協(xié)學(xué)會(huì)服務(wù)中心舉辦“加強(qiáng)知識(shí)產(chǎn)權(quán)保護(hù) 服務(wù)科技創(chuàng)新發(fā)展”專題訪談
文章不錯(cuò),犒勞下辛苦的作者吧