1对检索要素的处理
考虑到使用关键词检索必将带来无法估量的噪声,而与3D技术相关的分类号相对集中,因此在构建查全文献库时,贯彻以分类号为主,关键词为辅的原则。1.1对分类号的处理核心分类号的特点在于其噪声率很低,补充分类号的噪声率偏高,但为了避免遗漏,对其进行了必要的上位组扩展,虽然会带来大量噪声,但其必然符合查全的需要。针对分类号与3D技术的相关程度,筛选出核心分类号(H04N13,H04N15,G02B27/22)与补充分类号(G02B27/、G02C5/、G02F1/00、G03C、G03B19/、G03B35/、G06T9/、G06T15/、G06T17/、H04N5/、H04N7/、H03M13)。1.2对关键词的处理对于关键词,将其细分为宏观关键词(3D、立体、三维、3维、三D)与微观关键词(偏光、偏振、快门、透镜、光栅);另一方面,从关键词与检索结果的相关程度这一角度,将关键词分为显性关键词与非显性关键词。显性关键词为与技术主体明显相关且在本领域出现频次较高的词,例如3D、立体、裸眼、眼镜、偏振、主动快门等。而非显性关键词则是看似与技术主题无明显关系但通过阅读全文技术能确定出与技术主题相关的关键词。非显性关键词是在3D技术的高速发展过程中出现的,在摘要文献库检索过程中容易被漏掉。例如近几年在裸眼3D技术中出现的各种透镜等词,围绕其所提出的专利申请的发明点大多在于对透镜技术的改进,在摘要文献库的描述中不会体现其具体在3D技术中的应用。基于非显性关键词的检索所获得的文献量小,准确度高,但对应的分类号杂且噪声多,而在CPRS中无法构建针对非显性关键词的有效检索式,因此选择全文库CNTXT作为非显性关键词的补充检索文献库,在全文中使用“显性关键词and非显性关键词”来获得检索结果。
2检索要素分析
检索要素通常包括分类号与关键词,为了保证数据的查全率,必须对分类号进行适当的上位组扩展。在关键词的选取上,尽量对特定的关键词进行全面扩展,在这一过程中,使用了读秀、wiki等工具进行关键词的扩展挖掘,并就重点技术分支的关键词与技术专家进行交流,从而确定用于检索的关键词集合。首先,主要分类号确定为:H04N13/00立体电视系统;其零部件(专用于彩色电视的入H04N15/00)。H04N15/00立体彩色电视系统;其零部件。G02B27/22用于产生立体或其他三维效果的。G02B光学元件、系统或仪器。G02C+眼镜;太阳镜或与眼镜有同样特性的防护镜。G02F1/00控制来自独立光源的光的强度、颜色、相位、偏振或方向的器件或装置,例如,转换、选通或调制;非线性光学。G03C9/00立体摄影或类似的摄影工艺过程。G03B19/00摄影机(零部件入G03B17/00)。G03B35/00立体摄影术(全景或宽屏幕系统入G03B37/00;摄影测量入G01C。G06T9/+图像编码,如从位像到非位像。G06T15/00三维(3D)图像的加工,例如从一个模型到一个位像图形。G06T17/00三维(3D)模型,例如3D目标的数据绘图。G03C照相用的感光材料(照相制版用的入G03F);照相过程,例如,电影、X射线、彩色、立体照相过程;照相的辅助过程(以本身可分类在G03B的设备的使用或操作为特征的照相过程参见G03B;图纹面的照相制版入G03F;电记录术,电照相,磁记录入G03G)。H04N5/+电视系统的零部件。H04N7/+电视系统。H04N101静止视频摄像机。H03M13用于检错或纠错的编码、译码或代码转换;编码理论基本假设;编码约束;误差概率估计方法;信道模型;代码的模拟或测试。与3D技术相关的分类号的特点在于,IPC分类号与技术分支的对应关系不明显。原因是3D技术的发展速度快于IPC分类表的更新速度,以3D显示技术为例,与之相对应的分类号H04N13、H04N15/00下的细分匮乏,因此3D显示技术下的二级、三级技术分支的文献都分散在其他的分类号下,且由于其技术细节涉及光学、电视、材料等多个领域,因此3D显示技术分之下的二级、三级技术分支的文献分散程度高。关键词检索要素分为中文库关键词检索要素和英文库关键词检索要素。
例如,3D技术相关的中文库关键词检索要素和英文库关键词检索要素如下所示。3D影像:左像+右像+左象+右象+左视+右视+左眼+右眼+左图+右图+左帧+右帧+左桢+右桢+左场+右场+左画面+右画面+左影像+右影像+左影象+右影象+左目+右目+"3-D"+3D+3维+三D+立体+三维+多角度+深度+景深+视差+裸眼+两视+双目+多目+双眼+双视+多视+双画面+双影像+双影象+多眼+多个视+两个视+3D影像:((LEFTDEYE)OR(RIGHTDEYE))OR((LEFT2DPICTURE)OR(RIGHT2DPICTURE))OR((RIGHT2DIMAGE)OR(LEFT2DIMAGE))OR((RIGHT2DMAP)OR(LEFT2DMAP))OR((RIGHT2DFRAME)OR(LEFT2DFRAME))OR((RIGHT2DFIELD)OR(LEFT2DFIELD))OR((RIGHTDVIEW+)OR(LEFTDVIEW+))OR((RIGHTDVISION)OR(LEFTDVISION))OR((RIGHT2DMAP)OR(LEFT2DMAP))OR((RIGHTDVISUAL)OR(LEFTDVISUAL))OR((RIGHTDVIDEO)OR(LEFTDVIDEO))OR((PICTUREORIMAGEORVIDEO)P((LEFT2DSTREAM)OR(RIGHT2DSTREAM)))OR((PICTUREORIMAGEORVIDEO)P((LEFT2DCHANNEL)OR(RIGHT2DCHANNEL)));"3D"OR"3-D"OR("3"WDIMENSION+)OR(THREEWDIMENSION+)OR(THREEW"D")ORTRIDIMENSION+OR(TRIWDIMENSION+)ORSTEREOSCOPEORSTEREOSCOPICORSTEREOORSTEREOSCOPY;PARALLEXORPARALLAX;(TWOWVIEWPOINT?)OR("2"WVIEWPOINT?)OR(TWOWVIEW?)OR("2"WVIEW?)OR(TWOWVISION?)OR("2"WVISION?)OR(BINOCULARWVISION?)OR(BINOCULARWVIEW?)OR(BINOCULARWVIEWPOINT?)OR(DOUBLEWVIEWPOINT?)OR(DOUBLEWVIEW?)OR(DOUBLEWVISION?)OR(SECONDWVIEWPOINT?)OR(SECONDWVIEW?)OR(SECONDWVISION?);(MULTIWANGULAR?)OR(MULTIWVIEWPOINT?)OR(MULTIWVIEW?)OR(MULTIWVISION?)ORMULTIVIEW?ORMULTIANGULAR?ORMULTIVIEWPOINT?ORMULTIVISION?OR(MULTIPLEWANGULAR?)OR(MULTIPLEWVIEWPOINT?)OR(MULTIPLEWVIEW?)OR(MULTIPLEWVISION?)OR(MULTI+WVISUAL+)or3D技术分支包括3D影像的获取、3D影像的传输存储、3D影像的编解码、3D影像的显示,3D影像的显示又分为眼镜式、裸眼式。同理,各技术分支分为对应的中文库关键词和英文库关键词检索要素。检索要素中没有直接体现3D影像的存储、裸眼式中的指向光源与多层显示技术。原因在于:首先,上述技术分支下的文献量相对较少;其次,若加上与上述技术特征相关的关键词将带来大量的噪声,为数据清理工作造成不便;最主要的,经过前期的统计分析发现,上述与技术特征相关的文献大多已经被3D影像相关的关键词所检索得到的文件集合覆盖。因此,通过前期工作调整并确定出哪些检索为必要的检索要素至关重要。
3结语
检索结果的评估是贯穿在整个检索过程中的,在确定好检索关键词和分类号后,为后续的专利分析作好数据准备,后续的查漏和去噪过程中需要分阶段对所获得的数据文献集合进行检索结果的评估,以确保检索结果的客观性。
作者:胡妮 单位:国家知识产权局专利局