摘要:随着网络的发展,社交网络下的垃圾信息过滤技术已经成为当前研究普遍关注的热点问题。其中,电子邮件作为最自由和便捷的交流方式之一,垃圾邮件的危害已经引起世界各国的高度重视,为了有效遏制垃圾邮件的传播、保障电子邮件服务的正常运营秩序、维护网络安全,反垃圾邮件技术孕育而生。本文将基于专利文献分析,对现有的垃圾邮件过滤技术作综述性介绍,并对垃圾邮件过滤技术的专利申请情况、垃圾邮件过滤技术的分类以及重点企业进行一定的分析。
关键词:垃圾邮件;过滤技术;专利
中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2016)12-0013-02
1垃圾邮件过滤技术概述
电子邮件通常具有几个重要特征,标准电子邮件地址(包括收发件人邮箱名、收发人邮箱服务器IP地址或域名)、主题、信件内容(包括正文、关键字、附件)等相关字段,这些特征是过滤技术判断、分析、统计和提取的依据。过滤技术作为目前反垃圾邮件产品运用的核心技术,可以划分为以下三代技术:第一代技术:通过IP过滤,关键字过滤,邮件(附件)大小控制以及SMTP连接时间频率控制来进行垃圾邮件的区分。第二代技术:通过基于统计算法(如贝叶斯)的智能内容过滤,RBL过滤进行垃圾邮件的区分。第三代技术:通过基于对垃圾邮件发送行为的研究和统计而发展出来的行为识别技术对垃圾邮件进行区分。
2垃圾邮件过滤技术专利申请概况
垃圾邮件起源于1994年的绿卡事件,使得垃圾邮件登上了互联网的历史舞台。2000年8月,中国电信制定了垃圾邮件处理办法;2002年5月20日,中国教育和科研计算机网公布了《关于制止垃圾邮件的管理规定》,其中对垃圾邮件的定义为:凡是未经用户请求强行发到用户信箱中的任何广告、宣传资料、病毒等内容的电子邮件,一般具有批量发送的特征。垃圾邮件过滤技术专利在这样的背景下孕育而生。下面主要分析一下全球和国内垃圾邮件过滤技术专利申请情况以及国内外专利重要申请人分布。关于历年专利申请量的分布情况如图1所示:图1和图2分别显示了垃圾邮件过滤技术在全球和中国历年专利申请量分布情况。可以看出,垃圾邮件过滤技术在中国的发展趋势与全球专利申请发展趋势大致相同。基于中国互联网技术发展较晚于世界科技大国,垃圾邮件过滤技术也较世界起源技术发展较晚。从整体申请情况可以看出,2001年之前申请量不大。从2001-2002年左右,随着互联网的发展,人们对邮件的使用越来越频繁,使得解决垃圾邮件传播的问题越来越急迫,垃圾邮件过滤技术也得到较快的发展,到2005年和2008年是垃圾邮件过滤技术的发展高峰期。从2008年后,相关的垃圾邮件过滤技术也开始走向成熟,其专利申请量也基本保持稳定。近两年来,由于2014-2015部分申请还没有公开,导致统计出申请量有明显下滑的趋势。从图3中可看出,申请量较大的申请人集中在大型企业,如:MicroSoft、GOOGLE、IBM等,且主要集中在科技强国-美国。而中小型企业在垃圾邮件过滤技术方面,相对于国际大型企业,发展较晚,同时在技术上也难以与其抗衡。从上述排名较靠前的公司来看,中国的垃圾邮件过滤技术发展也较为迅猛,以腾讯、华为、中兴为代表的中国企业也在该领域上崭露头角,且已进入稳步上升的时期。
3垃圾邮件过滤技术重要申请人的技术路线—腾讯
近年来,国内许多公司也掀起了垃圾邮件过滤技术的研究热潮,其中腾讯作为国内较早推出邮箱产品的大公司对国内垃圾邮件过滤技术作出了较大的贡献。下面以腾讯公司作为重要申请人进行专利分析。图4显示了腾讯公司自2004年以来在垃圾邮件过滤技术上申请专利数量的比例分布情况。2002年开始上线的腾讯的QQ邮箱,从2005年重新改版推出的QQ邮箱开始迅猛发展。垃圾邮件泛滥激励腾讯开始研究垃圾邮件过滤技术。在2005-2006年间,腾讯在该技术上的专利申请量达到了一个高峰。此后,随着腾讯邮箱的客户迅猛增加,到2012年作为国内最大的企业邮箱提供商腾讯对解决垃圾油过滤的问题刻不容缓。近年来,腾讯的垃圾邮件过滤技术稳步发展,在专利申请量上保持相对稳定的状态。腾讯科技(深圳)有限公司在2004年6月5日申请的发明专利200410027521.2公开了一种通过将寄来电子邮件的地址先与预设的白名单内的邮件地址比对提供了一种可靠性高,且可杜绝大部分垃圾邮件入侵的反垃圾邮件方法;在2005年9月27日申请的发明专利200510037520.0公开了一种通过邮件客户端和邮件服务器端的共同配合来过滤垃圾邮件的反垃圾邮件的方法和系统,该方案减少了网络带宽的使用,缩短邮件的接收时间;在2005年12月22日,申请的发明专利200510131988.6公开了一种通过对贝叶斯方法的改进有效地减少同一类别的负样本重复录入贝叶斯负样本学习库的次数,来提高贝叶斯学习库的工作精确度以降低了垃圾邮件的误判率的技术方案;在2006年1月13日,申请的发明专利200610001155.2公开了一种通过在现有的垃圾邮件过滤模块上添加了一个相似度分类模块和相似度判定模块,对现有垃圾邮件过滤模块初步判断为垃圾邮件的那部分数量庞大的邮件进行进一步判断,得出垃圾邮件和非垃圾邮件以降低了邮件误判率的方法和系统;在2007年6月15日,申请的发明专利200710074970.6公开了一种在发件人建立IP连接后进行IP地址过滤,对于未通过IP过滤的邮件再进行白名单检查的电子邮件的过滤方法来防止用户白名单中的邮件被误拦截;在2008年9月27日,申请的发明专利200810167115.4公开了一种确定可疑垃圾邮件范围的方法和系统通过预先确定可疑垃圾邮件的范围,从而提高判断邮件是否为垃圾邮件的效率;在2009年3月26日,申请的发明专利200910080732.5公开了一种通过对发帖内容进行预定的语义分析判断,有效地实现社区垃圾内容的屏蔽的垃圾内容过滤的方法。在2012年7月19日,申请的发明专利201210251064.X提供了一种基于系统与用户共同判断垃圾邮件的方法来提高用户体验。在2012年7月31日,申请的发明专利201210271378.6公开了一种通过将邮件添加在预定文件中进行集中存储的垃圾邮件处理方法以减少邮件存储耗时。可见,以腾讯科技有限公司为代表的IT企业一直致力于发展垃圾邮件过滤技术。该公司致力于多种垃圾邮件技术,而非单一一种方式的垃圾过滤技术,并也有将多种技术融合以提高垃圾邮件过滤效率与正确率。腾讯科技公司早期申请的相关专利不仅数量较多同时被授予专利权的比例也较高,说明近年来,腾讯公司在该方面的技术研究趋于稳定,且越来越多的其他企业也致力于该方面的技术研究,竞争日益激烈。
4总结
随着互联网技术的飞速发展,用户对垃圾邮件问题越来越敏感,解决垃圾邮件问题,完善垃圾邮件过滤技术已经刻不容缓。随着第三代图片垃圾邮件的出现,第三代垃圾邮件过滤技术还在不断更新发展,其涉及的发件人特征识别技术、多重图片识别技术、意图分析技术等成为最新关键过滤研究技术。而纵观垃圾邮件过滤技术的发展历程,单靠某一种技术手段是无法解决的,如今研究的重点都从单项、单点的技术研究转移到了对多技术体系融合、协作式的垃圾邮件过滤体系研究,使得多技术整合分层过滤技术成为当今垃圾邮件过滤技术的发展趋势。目前,国外在该方面的研究虽然较为靠前,但中国相关企业与高校也紧随其步伐并稳步发展。通过专利分析,可以了解相关技术的发展脉络和研究的趋势,知晓国内外的研究现状。通过学习,国内企业应该加大力度在核心研发上,研发核心专利,提高知识产权意识,才能更好地占据市场,和大企业抗衡。未来的路还很远,需要不断实践,我国企业也应该加大研发重视度,力求创新,提高企业核心竞争力。
参考文献:
[1]王希忠,叶在伟,张国印.反垃圾邮件过滤技术探讨[J].北京:信息技术,2006(3):2.
[2]贾云刚.垃圾邮件过滤技术研究[J].通信与信息技术.2009(2):55-58.
[3]王斌,潘文峰.基于内容的垃圾邮件过滤技术综述[D].中国科学院计算技术研究所,2004.
作者:罗婧雯 单位:国家知识产权局专利局 专利审查湖北中心