1国内外电子图书长期保存现状分析
目前,图书馆、出版商、长期保存机构均在积极开展电子图书的长期保存活动,但由于电子图书长期保存活动起步晚,相关保存机构投入少,以及电子图书本身的复杂性,使得电子图书长期保存发展缓慢,并呈现出长期保存项目少、机构参与度低的现状。
1.1长期保存项目少
目前,美国、英国、德国、澳大利亚等国家均开展了数字资源长期保存项目[17],但面对当前各种形式的电子资源(如电子期刊、电子图书、数据等),其并未给出保存内容的对象类别。笔者调查发现,目前仅有Portico、LOCKSS(LotsofCopiesKeepStuffSafe,多备份资源保存)、CLOCKSS(ControlledLOCKSS)、e-Depot等项目开展电子图书长期保存活动,其中仅Portico提供专门的电子图书长期保存服务。Portico是一家非营利性信息存储服务机构,一直致力于数字资源长期保存策略的探索,并形成了较为完善的保存模式。自2005年该项目开展电子期刊的长期保存服务以来,其已经经历了两次较大的调整。2009年,Portico将电子图书纳入长期保存范畴,并提供电子期刊与电子图书混合保存模式。2011年1月1日,该项目又创立了独立于电子期刊的专门的电子图书长期保存服务,该服务旨在满足图书馆和出版商馆藏不断发展的需求,提供可选择的、合适的保存服务[18]。CLOCKSS是由学术出版商和科研图书馆共同参与和管理的非营利性项目,致力于建立可持续的、全球分布式的存档系统,确保基于网络的学术资源的长期保存。CLOCKSS于2008年开始启动电子图书长期保存服务,至2011年2月,实现了该服务向用户开放,开始实行电子期刊与电子图书的混合保存模式。目前,CLOCKSS仅公布了参与电子图书保存的出版商信息,但并未给出可供选择的保存模式及保存经费来源等相关信息。LOCKSS是由美国国家科学基金和梅隆基金共同资助,斯坦福大学图书馆负责实施的数字资源长期存取项目,采取分布式的数字资源保存策略,但目前也尚未公布电子图书长期保存项目的相关信息。笔者通过对Springer电子图书的保存策略进行分析得知,LOCKSS已经开展电子图书长期保存项目。荷兰国家图书馆(KoninklijkeBibliotheek,简称KB)利用可操作性的数字存档系统e-Depot保存电子出版物。除了电子期刊外,KB正积极致力于其他形式电子出版物(如电子图书、视频图书和网站资源)的长期保存。目前,KB仅对荷兰布里尔学术出版社(BrillAcademicPress)以印本形式出版的2000册图书进行数字化并保存。
1.2机构参与度低
电子图书长期保存的发展依赖于电子图书的出版社、出版商、集成商及图书馆的参与,但由于电子图书长期保存还处于探索阶段,保存模式尚未完善,保存机构的参与度也相对较低。就国内而言,我国主要的电子图书出版商、出版社均未参与电子图书的长期保存,现阶段也仅有中国科学院文献情报中心与Springer签署了电子图书长期保存协议。与之相比,国外电子图书出版社、出版商、集成商在对电子图书进行简单备份的同时,也加入了电子图书长期保存的行列之中,但总体来说,参与电子图书长期保存的机构数量仍有限。就电子图书保存机构而言,仅有Portico和CLOCKSS公布了参与长期保存的机构数目和相关信息。到目前为止,相对于参与Portico电子期刊长期保存的174家机构而言,电子图书长期保存机构的参与度明显偏低仅仅为37家,占电子期刊保存机构数量的21%[19]。参与CLOCKSS电子图书长期保存的机构数发展较快,从2011年2月Springer第一个加入CLOCKSS电子图书保存服务开始,截止到2013年1月,已经有21家机构参与CLOCKSS电子图书保存服务。
2图书馆电子图书长期保存面临的问题及解决方法
电子图书长期保存发展缓慢的主要原因是电子图书不同于电子期刊等数字资源,其在内容格式、版权归属及数字版权管理方面具有特殊性,而这些因素阻碍了电子图书保存内容的摄取。内容摄取是长期保存活动的起点,在长期保存过程中发挥着关键性作用。因此,图书馆要实现电子图书长期保存,首先应关注并解决这些问题。
2.1电子图书格式多样,难以统一
2012年,国际数字出版平台服务公司“阿普瑞”(Aptara)发布了一项关于全球电子图书市场整体发展状况的调查报告,其指出电子图书的阅读器和内容格式的兼容性问题是电子图书面临的主要挑战[20]。目前,电子图书市场尚未形成统一的电子图书格式标准,电子图书出版商、集成商使用各自支持的电子图书格式。电子图书按照其格式的通用性可划分为4类[21],分别是基础格式、开放/通用格式、半开放格式及私有格式。基础格式是非专有格式,具有良好的可拓展性和移植性,如XML;开放/通用格式是由官方或国际性标准组织认可的,其具有高普及率和高认知度,如TXT、HTM、EPUB、PDF等;半开放格式在一定程度上是开放的,但其核心技术由格式制定机构掌握,如方正CEBX;私有格式是在专门阅读器或软件的支持下方可使用的格式,如亚马逊AZW等。电子图书用户最喜欢的格式为以PDF、EPUB3为代表的开放/通用格式[22]。应用户需求,目前Portico采用PDF格式保存电子图书,并声称在未来将会考虑EPUB3格式。EPUB3格式由于其强大的系统兼容性备受出版商青睐,但其并不是为保存而专门设计的格式[23]。因此,在电子图书格式多样化的情况下,电子图书的内容摄取及存储转化等过程变得尤为繁琐和复杂,这无疑将阻碍电子图书长期保存活动的顺利开展。图书馆应积极呼吁电子图书市场中的相关者参与制定国际认可的开放性的电子图书通用格式,使其规范化、标准化、统一化,并寻求现有格式的转化技术和工具。例如,针对基础格式,图书馆可以利用现有技术和软件进行格式转换;对于半开放格式和私有格式,图书馆需要与出版商、集成商沟通协调,获得电子图书内容转化的许可权利。
2.2版权归属不清晰,很难获取保存权
电子图书版权归属是指电子图书数字版权归谁所有,即电子图书数字版权的权利主体的确认。目前,国内外电子图书授权纠纷案件不断,主要在于电子图书的数字版权归属不清晰,表现在数字版权主体不明确、授权内容不清晰。电子图书长期保存需要明确电子图书的数字版权的权利主体是作者还是出版社,这样才有利于从权利主体获得保存许可权。与电子期刊的版权归属相比,电子图书的数字版权一般掌握在作者手中,而不是由出版社享有。在我国,电子图书数字版权的80%左右掌握在作者手中[24]。根据中国文字著作权协会曾对全国580多家出版社进行的统计显示,20%左右的出版社拥有其出版的电子图书的数字版权[25]。在电子图书市场中,同一作品多次转让、多方转让的现象已经很普遍,而作品经多级转让后,权利主体和授权内容变得难以分辨。美国最大的图书出版商兰登书屋起诉罗塞塔图书公司是由于授权内容不清晰而导致诉讼的典型案例,其争论的焦点在于是作者还是出版商拥有将图书电子化的权利。针对上述问题,图书馆在电子图书长期保存过程中,应当明确电子图书的权利主体,保障电子图书内容的完整授权,并对获得的授权许可做好权利审查工作。为了明确电子图书的权利主体,图书馆一方面可以与电子图书出版商、集成商签署购买许可协议的相关规定,另一方面可以利用电子图书的权利管理信息获得权利人的信息。
2.3数字版权管理制约内容获取
数字版权管理(DigitalRightsManagement,简称DRM)是以保护数字版权为核心的数字版权保护技术。DRM通过安全和加密技术锁定和限制数字内容传播,从而能够从技术上防止数字作品的非法复制和使用。我国北大方正Apabi电子图书系统以数字出版保护技术为核心,实现了电子图书的制作、发行、阅读及受控传播等,防止电子图书的非授权拷贝,是第一个基于数字版权保护的中文电子图书解决方案。国外许多电子图书出版商和集成商也应用了数字版权保护技术。DRM在保护数字版权内容的同时,在一定程度上限制了电子图书的复制和使用,阻碍了电子图书长期保存内容的摄取。DRM嵌入在电子图书内容和电子图书阅读器中,对用户的使用行为进行限制,如电子图书的借阅时间、并发用户数量、用户阅读的地址位置等[26]。在此种情况下,电子图书保存首先应去除DRM,以获取电子图书内容。Springer之所以能参与多项电子图书长期保存项目,在于其未实施数字版权管理而易于保存[27]。图书馆在开展电子图书长期保存的过程中应积极与出版商、集成商沟通协调,提倡实行宽松的数字版权保护技术或者“无DRM”。目前,O'Reilly出版社、Carina出版社、微软出版社和麦克米伦英国出版社对出版的数字出版物进行了“无DRM”处理。同时,2011年法国100家出版商已经停止使用DRM,他们更愿意使用水印、版权教育、社会道德这样柔性的方式来保护作品的数字版权。
3结语
电子图书具有重要的保存价值,图书馆有必要对其进行长期保存,但在该过程中面临着诸多问题。电子图书本身的特点导致图书馆电子图书长期保存不能完全照搬电子期刊的保存模式,图书馆应吸取电子期刊保存的经验,并与电子图书出版商、集成商积极协调制定电子图书长期保存的政策和标准,形成由图书馆为主导的电子图书长期保存模式。
作者:崔剑颖 郑建程 单位:中国科学院国家科学图书馆 中国科学院大学