1影响生命科学信息公共获取的障碍分析
1.1生命科学信息公共获取地带有限
早在2013年初,英国《自然》杂志就对今年有可能发生的科技热点事件作出预测,基因专利的法律纠纷正是其中之一。发达国家打着各种旗号,纷纷将发展中国家作为争夺基因的“狩猎场”,进行“基因殖民主义”。有专家预计,在今后不到10年的时间里,大自然馈赠给我们人类的10万多个基因将全部受到专利保护,成为制药、化学、农业和生物技术公司独有的知识产权。随着专利保护的范围和领域的逐步扩大,公众获取生命科学信息的空间受到严重“挤压”。如美国生物芯片公司Combima-trix向美国商标专利局提交了60份涉及SARS治疗方法和可能抑制SARS病毒的药物专利申请书;我国知识产权局收到了国内外数十件有关SARS医学研究的专利申请书,内容涉及到对SARS病人的治疗方法、病毒基因测序与冠状病毒的蛋白质结构等。专利申请成功后,刺激了生物医药的研究开发和商业化,但是在很大程度上制约了公众对生命科学信息的公共获取。
1.2生命科学信息公共获取成本较高
一些著名的生物数据库,如SWISS-PROT、德国转录因子数据库等开始向用户每年收取数千至数万美元不等的使用费。日前世界各地的许多遗传学家联合起来,抗议美国IncyteGenomics公司对其蛋白质数据库收取每年2000美元的费用。该公司提供生物学家们研究蛋白质结构和功能信息,在这之前数据库是能够免费进入的,但是IncyteGenomics最近宣布了它的收费标准:每个实验室每年收费2000美元。而遗传学家们认为这一举措给他们的研究工作带来了许多困难,纷纷进行抗议。在中国本土生物数据库严重缺乏的情况下,如果一些重要的生物数据库开始对学术研究部门收费,甚至限制读取、关闭,这将是生命科学信息的公共获取的一个沉重打击。
1.3生命科学信息公共获取渠道不畅
目前由国家投资、通过有关部门和科研单位获取的科学数据至少达几百万亿字节,相当于几亿本百万字乃至千万字的书。政府部门掌握着社会资源中80%有价值的信息,能有效利用的信息库仅占10%左右。但政府机构、企事业单位、各高校和科研机构所收集的生命科学信息大部分只对本单位提供服务,甚至个人垄断专用,视为“私有财产”,生怕其他人在生物科研成果上捷足先登,缺乏部门间的交流和沟通,更没有形成面向社会的资源共享,造成资源的严重浪费。而欧美早已成立国家级生命科学信息中心,建立了规模可观的生命科学信息资源共享平台,如美国的GenBank、欧洲的EMBL、日本DDBJ共同构成了数据库国际核酸序列数据库,每天交换数据,并且同步更新,形成了全球性的生命科学信息共享平台。但我国目前只有北京、上海等分布式生物信息中心,国家级生命科学信息资源平台建设相对滞后。
1.4生命科学信息公共获取法律缺失
相比美国的《信息自由法》、加拿大联邦的《信息准入法》、澳大利亚的《信息自由法》以及俄罗斯、日本、新加坡的信息法和欧盟委员会提出的《电子欧洲:为所有人建造的信息社会》等而言,我国有关生命科学信息资源保护与共享的法律法规立法分散,位阶比较低。大部分只是实施办法、管理条例、暂行办法,而不是由全国人大制定的专门法律。并且大部分法律法规着重于基因的专利保护、基因工程的安全以及植物新品种保护(如《基因工程安全管理办法》、《人类遗传资源管理暂行办法》等),并没有涉及到生命科学信息资源的共享、开放与获取。此外,国务院发布的《农业转基因生物安全管理条例》、农业部颁布的关于农业转基因生物安全评价、进口和标识的配套管理办法,都没有涉及公众参与的条款。
2推进生命科学信息公共获取零障碍建议
2.1以积极态度应对生命科学领域的专利池,扩展信息公共获取范畴
在生命科学领域,目前较为熟知的是金色大米专利池和AvGFP专利池。虽然专利池争议不断,但是2010年美国国立卫生研究院(NIH)以加入药物专利池的实际行动表明了积极态度。该专利池由国际药品采购机制(UNITAID)建立,其目的是找到一条让穷人获得昂贵药物的道路。事实上,通过专利池,可以消除专利实施中的授权障碍。2001年美国专利和商标局(USPTO)发布的《专利池白皮书》认为:“专利池可以克服生物技术专利许可中存在的障碍,有利于促进生物专利技术和信息的获取,因而能推动研发并通过授予专利促进竞争”。此外,专利池还可以显著降低专利许可中的交易成本,因为专利池实行一站式打包许可,并采用统一的标准许可协议和收费标准。面对生物领域的专利池,中国政府一方面应努力进入专利池获得交叉许可,另一方面在《专利法》、《专利法实施条例》及相关的法律解释中增加规范专利池的条款。此外,政府可作为专利申请人,申请建立生物信息领域的公共专利数据库,把有关生命安全和公共健康的专利保留在公共领域,确保公众获取所需的生物医药专利信息。
2.2充分利用“百慕大原则”、“合理使用”等条约和条款,降低信息公共获取成本
百慕大原则的核心是数据公开、资源共享。第一,保证一旦获得大于2000个单位的DNA序列,就以最快的速度与人共享;第二,保证在24小时内把新得到的测序结果通过互联网提交给公共数据库GenBank。中国科学家可以通过GenBank等公共数据库来获取基因信息。事实上,人类基因组计划也遵循了“共有、共为、共享”这一原则。此外,在基因表达数据分析中,研究者多采用反向工程的方法。若用户为科学研究、教学和实验目的、个人及其他非为生产经营目的,可以不经知识产权人的许可,也不视为侵权行为。根据TRIPS的规定,发展中国家享有进行软件反向工程的自由,生物实验室中的反向工程不视为侵权。为了公共健康的目的,建议制定反垄断方面的法律和规定。如《TRIPS协议和公众健康多哈宣言》规定成员国为获得药品以解决公共健康危机,可以实施强制许可。
2.3构建国家级生命科学信息资源平台,提高信息公共获取效率
生命科学不同于一般科学,必须进行海量数据存储、传输和计算,但生物数据通常以不同的格式存储在异构、自治和分布式的网络数据库中,给公共获取造成了很大的障碍。建议通过生物信息网格技术(数据网格、计算网格、知识网格)有效整合生物信息资源,实现网络虚拟环境上的资源共享和协同。如英国MyGrid在分布式环境下工作的科学家提供了个性化协作解决问题的平台,解决后基因组时代的数据密集型功能分析。建议我国以国内生物学研究为基础,利用生物网格技术,构建符合国际标准的国家级生命科学信息中心[9],将国家生物信息中心和地方生物信息中心相结合,对全国生命科学信息资源进行统筹和宏观调控,形成一个集中与分布式、多级纵横的共享结构,为生物科研工作者自由、低成本、方便、快捷地获取生命科学信息资源提供一个资源与技术集成的平台,实现对生命科学信息的高效获取和利用。
2.4健全生命科学信息公开法律法规体系,保障信息公共获取
公众享有知情权和参与权,应该了解转基因生物环境释放、商业化种植以及所消费的转基因产品的真实状况,也应该参与转基因生物研究、试验、商业化生产、市场销售等各阶段的评价、决策和立法过程。目前我国的科技进步法、知识产权保护法以及《政府信息公开条例》都是生命科学信息公共获取的法律依据。政府和环保、医疗卫生的公共部门应在网站设立涉及公共健康信息的生命科学信息查询点,将有关转基因食品、药品安全等信息资料在网上适当公开,将行政主管部门的决定公布于众,在必要时征询公众意见,做到公正、公平、便民。特别是要建立突发公共事件的信息发布制度,采取便于公众知晓的方式发布,遵循基本的发布流程,坚持及时准确、客观全面的原则,更好地保障公众获取信息、利用信息的合法权益。此外,除了已有的法律规范外,还应该加强有关数据开放、共享的激励机制。以美国、英国经验为鉴,可根据数据投资来源严格区分共享管理机制,即将政府拥有、产生和资助产生的数据纳入到“完全和开放”的范畴,将私营公司投资产生的数据,纳入到“平等竞争”的市场化共享管理体制。这两种机制互相补充,促进全社会对生命科学信息的公共获取和广泛应用。
作者:陈鹏 单位:武汉大学信息管理学院