來(lái)源:IPRdaily中文網(wǎng)(IPRdaily.cn)
原標(biāo)題:專(zhuān)利機(jī)器翻譯,到AIpatent這樣,如何?
近日,南京深思得信息科技有限責(zé)任公司聯(lián)合上海語(yǔ)智信息科技有限責(zé)任公司發(fā)布了專(zhuān)利跨語(yǔ)言綜合服務(wù)平臺(tái)“AIpatent”,并先期發(fā)布了專(zhuān)利專(zhuān)用機(jī)器翻譯服務(wù)(t.aipatent.com)和專(zhuān)利詞典服務(wù)(d.aipatent.com)兩個(gè)線上服務(wù)板塊。據(jù)悉,AIpatent通過(guò)在線機(jī)器翻譯、離線專(zhuān)利專(zhuān)用機(jī)器翻譯引擎定制、專(zhuān)利專(zhuān)用詞典、專(zhuān)業(yè)專(zhuān)利人工翻譯等解決方案,消除專(zhuān)利從業(yè)人員在調(diào)查、檢索、翻譯國(guó)外專(zhuān)利時(shí)經(jīng)常遇到的語(yǔ)言障礙。
t.aipatent.com 專(zhuān)利專(zhuān)用機(jī)器翻譯界面
d.aipatent.com 專(zhuān)利專(zhuān)用檢索詞典界面
據(jù)了解,AIpatent上述兩項(xiàng)服務(wù)的研發(fā)人員中的張方元,他曾于2007年至2012年就職于永新事務(wù)所的日本部,在涉外專(zhuān)利方面,有很多的經(jīng)歷和經(jīng)驗(yàn)。據(jù)他介紹,在涉外專(zhuān)利方面,行業(yè)人員經(jīng)常會(huì)遇到3個(gè)問(wèn)題:
1、雖然涉外所的翻譯業(yè)務(wù)收入所占比重能占到4成甚至更多,但是翻譯人員大部分時(shí)間浪費(fèi)在打字的重復(fù)性、低水平的勞作上。
近幾年,有的涉外所引入了trados輔助翻譯系統(tǒng),提升了重復(fù)內(nèi)容的應(yīng)對(duì)效率,但是機(jī)器翻譯這個(gè)終極解決方案卻始終未能實(shí)現(xiàn)突破,市面上做引擎的有很多家,現(xiàn)在NMT算法公開(kāi),好像有了語(yǔ)料都能做引擎,但是大部分還是沒(méi)有到能讓翻譯人從翻譯的角色轉(zhuǎn)變到思考(審校)的角色上來(lái),大部分用戶(hù)的感覺(jué)是:專(zhuān)利機(jī)器翻譯,離實(shí)用化還差的遠(yuǎn)。
2、代理人遇到不會(huì)的語(yǔ)種的對(duì)比文件而不得不求助其他部門(mén)的語(yǔ)言人員或是代理人。
這樣給雙方工作都帶來(lái)困擾,別人來(lái)問(wèn)了,你不能不幫,因?yàn)閷?lái)你也會(huì)遇到語(yǔ)言問(wèn)題要去請(qǐng)教對(duì)方;
3、審查員有時(shí)候引用對(duì)比文件,因?yàn)檎Z(yǔ)言不通僅僅靠附圖相似就給出不完全正確的審查意見(jiàn)。
據(jù)張方元介紹,為了將涉外專(zhuān)利工作人員,從語(yǔ)言的難題上解放出來(lái),AIpatent團(tuán)隊(duì),經(jīng)過(guò)數(shù)年研究,推出兩款專(zhuān)利常用工具,其分別為專(zhuān)利專(zhuān)用機(jī)器翻譯服務(wù):t.aipatent.com和專(zhuān)利專(zhuān)用檢索詞典:d.aipatent.com。
專(zhuān)利專(zhuān)用機(jī)器翻譯服務(wù) t.aipatent.com
專(zhuān)利的機(jī)器翻譯進(jìn)入到神經(jīng)網(wǎng)絡(luò)時(shí)代以來(lái),其可讀性大大提高,但是在細(xì)節(jié)方面仍然需要不斷地打磨。在專(zhuān)利領(lǐng)域,最近幾年無(wú)論是WIPO還是歐專(zhuān)局,或是Google都推出了適用于專(zhuān)利的機(jī)器翻譯服務(wù),其中尤以Google的影響力最大,Google的機(jī)器翻譯有時(shí)候異常精準(zhǔn),有時(shí)候斷句又讓人感到無(wú)厘頭。算法沒(méi)有太大差別的情況下,誰(shuí)家打磨的更細(xì),就意味著誰(shuí)家會(huì)脫穎而出,從點(diǎn)滴細(xì)節(jié)做起,滿(mǎn)足廣大涉外所的語(yǔ)言需求,是AIpatent的使命。而在隱私性方面,有的事務(wù)所全體電腦斷網(wǎng),只為保證數(shù)據(jù)不泄露,定制引擎的服務(wù)需求也愈發(fā)旺盛。
張方元舉了下面幾個(gè)例子,說(shuō)明具體產(chǎn)品的效果:圖1至圖6分別是日中、日英、英中、英日、中日、中英六個(gè)方向的權(quán)利要求的譯文。
圈內(nèi)人都知道權(quán)利要求的翻譯是翻譯時(shí)候最難的部分,那么AIpatent的機(jī)器翻譯處理的如何?
圖1 日中機(jī)器翻譯結(jié)果
圖2 日英機(jī)器翻譯結(jié)果
圖3 英中機(jī)器翻譯結(jié)果
圖4 英日機(jī)器翻譯結(jié)果
圖5 中日機(jī)器翻譯結(jié)果
圖6 中英機(jī)器翻譯結(jié)果
此外,為了方便廣大用戶(hù)方便的修改譯文以及下載譯文,AIpatent創(chuàng)新性的在右側(cè)增加了編輯框和下載按鈕,如下圖7、8所示。
圖7 批量替換編輯框=可進(jìn)行替換回退等操作
圖8 至頁(yè)面頂部、下載為tmx、excel、txt,copy、修改等快捷鍵一應(yīng)俱全
專(zhuān)利專(zhuān)用檢索詞典d.aipatent.com
在提到專(zhuān)利術(shù)語(yǔ)的痛點(diǎn),張方元這樣介紹,在涉外業(yè)務(wù)中,很多同行們會(huì)感同身受,有時(shí)候公司有了新客戶(hù),但需要抓緊時(shí)間確認(rèn)這個(gè)客戶(hù)的用詞特點(diǎn)。有的事務(wù)所的做法是專(zhuān)門(mén)派人整理這個(gè)客戶(hù)之前的同族,然后一篇篇去閱讀,提煉出客戶(hù)專(zhuān)屬詞典。有時(shí)候遇到新案件,碰到新詞,首先要看別家是怎么確詞的。一樣要去翻別家的同族,查找相關(guān)的術(shù)語(yǔ),費(fèi)時(shí)費(fèi)力。現(xiàn)在有了AIpatent的專(zhuān)利詞典,人工做詞典的事情,再也不需要了。
具體情況看下例子。
詞典分為常規(guī)檢索和高級(jí)檢索,常規(guī)檢索默認(rèn)完全匹配模式,高級(jí)檢索可以使用""+-等一般檢索引擎的高級(jí)檢索方式進(jìn)行檢索,比如可以同時(shí)限定公司名,IPC分類(lèi)號(hào)等。
在常規(guī)檢索中,如果用戶(hù)檢索詞命中了專(zhuān)利詞庫(kù),AIpatent詞典會(huì)給出參考譯詞,并將其在專(zhuān)利句對(duì)庫(kù)中的翻譯數(shù)量按從多到少排列,給用戶(hù)最直觀的提示。譬如用戶(hù)檢索“雷達(dá)”這個(gè)詞,AIpatent中英詞典和中日詞典會(huì)有如下呈現(xiàn),當(dāng)然,這里的譯詞和傳統(tǒng)詞典有些不同,是在幾千萬(wàn)句對(duì)庫(kù)中進(jìn)行分析和計(jì)算的,可以看到它在句對(duì)庫(kù)中最常用的翻譯。
圖9
圖10
而在高級(jí)檢索中,用戶(hù)可以設(shè)定一些條件進(jìn)行檢索,比如檢索谷歌公司的關(guān)于“向量”的翻譯,則可以如圖11所示輸入相關(guān)關(guān)鍵詞,即可得到圖12的結(jié)果,此外,點(diǎn)擊公開(kāi)號(hào)則可以直接鏈接到歐專(zhuān)局查看公開(kāi)文檔。
圖11
圖12
如果想查看其它公司的關(guān)于“向量”的翻譯時(shí),則得到如圖13的結(jié)果。
再看下左側(cè)公司名的排序,以及可以點(diǎn)擊對(duì)應(yīng)句對(duì)下方的公司名進(jìn)行深入確認(rèn)等。
圖13
張方元還提到,AIpatent的機(jī)器翻譯經(jīng)過(guò)語(yǔ)智公司以及南京深思得研發(fā)團(tuán)隊(duì)近80人的全職團(tuán)隊(duì),歷經(jīng)2年精細(xì)打磨。雖然現(xiàn)在已經(jīng)迭代到V4.1,但仍然有不少補(bǔ)足,還在不斷優(yōu)化中。歡迎大家多多試用,多提反饋意見(jiàn)。具體試用網(wǎng)站為專(zhuān)利專(zhuān)用機(jī)器翻譯服務(wù)(t.aipatent.com)和專(zhuān)利專(zhuān)用檢索詞典(d.aipatent.com)。
最后,IPRdaily記者就“AIpatent”系統(tǒng)的開(kāi)發(fā)目標(biāo)和未來(lái)規(guī)劃采訪了張方元,他提到,隨著貿(mào)易戰(zhàn)越來(lái)越激烈,“真”研發(fā)的重要性愈發(fā)凸顯。古人說(shuō),知己知彼百戰(zhàn)不殆,我們現(xiàn)在應(yīng)該是知己的。AIpatent的理解,所謂知彼,對(duì)我們廣大科研人員來(lái)說(shuō)干掉語(yǔ)言壁壘是第一位,干掉復(fù)雜的檢索邏輯,實(shí)現(xiàn)概念檢索則是第二位。AIpatent是為了實(shí)現(xiàn)上述兩個(gè)目標(biāo)而生。計(jì)劃三步走:1、提供專(zhuān)利多領(lǐng)域的高水平機(jī)器翻譯服務(wù),在此基礎(chǔ)上實(shí)現(xiàn)跨語(yǔ)言檢索;2、利用研發(fā)途中積累的大量經(jīng)驗(yàn),活用到相關(guān)概念挖掘中,實(shí)現(xiàn)概念檢索;3、在1和2的基礎(chǔ)上提供分領(lǐng)域?qū)@麛?shù)據(jù)定制服務(wù),總結(jié)歸納國(guó)外某些特定領(lǐng)域的研發(fā)數(shù)據(jù),提供類(lèi)調(diào)查服務(wù)。
IPRdaily作為全球知識(shí)產(chǎn)權(quán)產(chǎn)業(yè)媒體會(huì)一直關(guān)注知識(shí)產(chǎn)權(quán)的最新發(fā)展態(tài)勢(shì),如果您有更新,更具創(chuàng)新的知識(shí)產(chǎn)權(quán)工具,可以聯(lián)系我們。
來(lái)源:IPRdaily中文網(wǎng)
編輯:IPRdaily趙珍 校對(duì):IPRdaily縱橫君
推薦閱讀
【2天成為區(qū)塊鏈IP精英】區(qū)塊鏈知識(shí)產(chǎn)權(quán)精英特訓(xùn)營(yíng)來(lái)了!
大咖來(lái)了!這些重磅嘉賓將要出席2018全球區(qū)塊鏈知識(shí)產(chǎn)權(quán)峰會(huì)
“投稿”請(qǐng)投郵箱“iprdaily@163.com”
「關(guān)于IPRdaily」
IPRdaily成立于2014年,是全球影響力的知識(shí)產(chǎn)權(quán)媒體+產(chǎn)業(yè)服務(wù)平臺(tái),致力于連接全球知識(shí)產(chǎn)權(quán)人,用戶(hù)匯聚了中國(guó)、美國(guó)、德國(guó)、俄羅斯、以色列、澳大利亞、新加坡、日本、韓國(guó)等15個(gè)國(guó)家和地區(qū)的高科技公司、成長(zhǎng)型科技企業(yè)IP高管、研發(fā)人員、法務(wù)、政府機(jī)構(gòu)、律所、事務(wù)所、科研院校等全球近50多萬(wàn)產(chǎn)業(yè)用戶(hù)(國(guó)內(nèi)25萬(wàn)+海外30萬(wàn));同時(shí)擁有近百萬(wàn)條高質(zhì)量的技術(shù)資源+專(zhuān)利資源,通過(guò)媒體構(gòu)建全球知識(shí)產(chǎn)權(quán)資產(chǎn)信息第一入口。2016年獲啟賦資本領(lǐng)投和天使匯跟投的Pre-A輪融資。
(英文官網(wǎng):iprdaily.com 中文官網(wǎng):iprdaily.cn)
本文來(lái)自IPRdaily.cn 中文網(wǎng)并經(jīng)IPRdaily.cn中文網(wǎng)編輯。轉(zhuǎn)載此文章須經(jīng)權(quán)利人同意,并附上出處與作者信息。文章不代表IPRdaily.cn立場(chǎng),如若轉(zhuǎn)載,請(qǐng)注明出處:“http://m.jupyterflow.com/”
文章不錯(cuò),犒勞下辛苦的作者吧