正文

科技文献检索与分析的方法(第二部分:专利检索)

(2010-05-02 19:36:56) 下一个

第二部分

对于专利这块,将会介绍很多与专利相关得重要数据库及其特色,希望对大家的工作学习有所帮助,我会尽可能得客观评价数据库和软件,可能会有一些个人偏好,请大家见谅。

因为专利毕竟是法律文件,受法律保护,有严格的格式。同样,在专利领域中,检索专利的目的有很多种。做研发的,想了解目前的技术情况,看是否有人已经申请了专利;自己能否在被人的基础上加以改进,以绕过别人的专利保护圈;可能是为了进行专利战略分析,寻找新的发展机会;可能是为了寻找侵权者;无形资产评估等等方面。

不同的人对于检索专利有不同的要求。因此,目前在专利市场上有免费的数据库,例如各个国家的知识产权局,有收费的专利数据库,例如Delphion, Aureka,Dialog,STN,Questl-Orbit,Micropatent的PatentWeb等等。收费有收费的好处。免费的东西毕竟还是有些问题的,例如EP的专利检索,大家都喜欢到欧洲专利局去检索,但是去那里检索主要两个问题:

  1. 检索系统太糟糕,检索的结果有很多垃圾。为什么呢,在EP网站上检索,对于主题检索而言,可利用的字段就是标题和文摘,而很多专利的标题和文摘并不能完全反映专利技术的重点,因此在做检索的时候,会产生很大的漏检或是垃圾;
  2. 有500篇限制,即V2 和V3的区别。这些都极大的限制了用户对专利的获取。可能有人这时就会出来说,美国就很好啊。确实,这点我们要承认,毕竟美国有钱,做出来的东西确实不一样。而且还曾经获过大奖。但是有一点是没有错的,就是在专利申请时,为了避免被竞争对手发现自己的技术路线,会尽可能的将自己的专利用非常模糊的语言去改写,从而达到避免被人检索出来的目的。因此,就算在美国这么好的地方,在商用上,还是有问题。

在这,收费数据库有了市场。毕竟在商业社会,免费的东西有那么多的问题,用的让人太不放心了。比较好的收费数据库主要是指那些对专利经过深加工的数据库。专利数据领域内很有名的就是Thomson公司的 Derwent数据库,针对所有的专利,覆盖了全球几十个国家和地区专利,是世界上最好的专利数据库,还有美国的CA,主要针对化学,法国的 PharmPat药物数据库,中国在这方面也有一些比较不错的,例如国家知识产权出版社作的中医药数据库,北京东方灵盾科技有限公司作的世界传统医药数据库(好像还没有上市,网上有介绍)。

下面,我重点介绍一些Derwent数据库一些很好的特性。

这个数据库在Delphion,WOK(即在Web of Knowledge数据库中的DII),DIALOG(Dialogweb, Dialogone, Dialogclassic),STN(web和easy),QUESTEL-ORBIT。上述几个数据库,对于不同检索能力的用户可以选择不同的数据库,一般而言,DIALOGclassic,STNWEb,QUESTEL-ORBIT(这个国内用的人很少,偶也没有用过,无法评论),适合于专业的检索人员,用指令式检索。而Delphion,DII,Dialogweb则适合各个层次的用户。Dialogon,Stneasy则适合初学者。

Derwent对每条专利记录的标题和文摘都重新进行了改写,用更加简明易懂的语言,便于检索人员能够检索到这条记录。此外,Derwent还增加了很多字段,有申请人代码,Derwent手工代码(MC),Derwent分类(DC)等等。申请人代码非常有用,是Derwent汇集了世界上专利申请量很大的大公司,并对其进行分类得到的代码表。

你可以在下面这个网址进行在线查询你所需要的申请人代码http://scientific.thomson.com/support/patents/dwpiref/reftools/companycodes/lookup/ 。例如,IBM有很多分公司,其代码是IBMC,通过查找就可以得到如下IBM公司的列表:
IBMC CIE IBM FRANCE
IBMC IBM BRASIL IND MAQUINAS & SERVICOS LTDA
IBMC IBM CANADA LTD
IBMC IBM CORP
IBMC IBM DEUT GMBH
IBMC IBM DEUT INFORMATIONSSYSTEME GMBH
IBMC IBM INST MIKROTECHNIK MAINZ GMBH
IBMC IBM INT BUSINESS MACHINES CORP
IBMC IBM ISRAEL LTD
IBMC IBM JAPAN LTD
IBMC IBM KK
IBMC IBM NEDERLAND NV
IBMC IBM OESTERREICH
IBMC IBM PATENT OPERATION
IBMC IBM SEMEA SPA
IBMC IBM SEMEA SRL
IBMC IBM SVENSKA AB
IBMC IBM UK LTD
IBMC INT BUSINESS MACHINES CORP

如果在普通数据库中进行检索,很难保证一次性就把所有的IBM公司的专利检索全,但是你用Derwent的公司代码表,即可尽大可能的保证你的检索精度

Derwent手工代码(MC)则可以看作是专利领域中的IPC。IPC过几天就升级到第8版了。但是出发点不一样,一个是从功能角度,一个是从应用角度。举一个简单例子(引自《中外专利数据库检索指南》P199-203),现在要检索一个课题,名称是:一种装置,在录像机上能根据用户眼睛凝视的方向自动对物体定位(自动聚焦)。用正常的方法,关键词,自动对焦,录像机?检索结果有很多垃圾,在这个例子中用关键词很难描述这个装置,但是在IPC中也没有什么合适的分类可以利用。

这时可以考虑用Derwent手工代码,在初检索中所有与录像机测距和聚焦有关的记录相关的代码是W04-M01D2C,而 S05-D01C5A则包含了非医疗用物体的电气或电子测量,可用于检索依靠手指按压控制或依靠飞行员眼睛运动以控制飞机的方面的课题。将上述两个代码进行逻辑组配,即得到了非常相关的结果。从这个例子可以看出,用Derwent手工代码可以得到一个很满意的结果。

在专利检索中,检索的思路和科技文献大致相同。但是由于专利的一些特点,其检索的自由度可能会更大些。在这,假设你已经对专利有了解了,不懂就去看书吧。

偶的一般做法,了解课题,看需要检索什么,而后就开始初检,找到一些很合适的纪录,找IPC,MC,DC,到处撒网,然后找到一些合适的,同时也排出一些垃圾,再次进行检索,有的时候还会用上一些统计分析方法,找到最合适的MC,DC。这些步骤可能来回好几次,最终才能确定一个很好的检索式。有人觉得很麻烦,但是如果你的数据是用来做分析的时候,就非常有必要的。Rubbish in,Rubbish Out。

在Derwent中还有一个很好的功能就是引证专利检索。可以找到一篇专利所有引证他人或是被引证的数据。这个功能好在,可以看到那些公司引证了这篇专利,你就大概可以做出如下判断:

  1. 技术是否从这篇专利所有人那里流失,即别人在上面作了很多开发,改进;
  2. 是否后来人有授权可能性;
  3. 技术走向,这时可以参考IPC,MC,DC等等。

专利引证这个在专利评估领域非常复杂,可以写本书了,偶也研究不深,不敢乱发言,到此为止。
这些引证数据可在Delphion和Aureka中以非常直观的图形显示。在Delphion还有一些其它功能可以帮助你更好的检索和分析数据。例如文本聚类,还有一个统计功能。这些回头贴图。
在Aureka中,专利检索,分析,管理的功能更强大。可以做出非常好的文本聚类分析,形成直观的专利地图,很强。太强了。

说明:文中“我”指的是原文作者。文章来源于互联网,作者不详,在此表示感谢。

[ 打印 ]
阅读 ()评论 (5)
评论
目前还没有任何评论
登录后才可评论.