ICPSR共有大约120名员工,其中15名有博士学位,其他至少有本科学位,包括3名图书馆员,3名网站开发人员,16名计算机网络服务人员。
ICPSR目前存储有8000个数据集,超过500000个文件,每年增加300-400个数据集。数据的来源包括研究者存放的数据、资助机构授权、拷贝数据库、系列收藏等。专题数据集包括:儿童保育与早期教育关系研究、人口研究数据共享、健康和医疗保健档案、老龄化数据国家档案等。ICPSR不仅仅包含数据,还有:与数据相关的书目记录,超过60000个图书、期刊文献、论文等的引文,很多出版物的全文等。来自ICPSR成员机构的任何人可获取所有的网站数据,非成员机构的研究者仅可以获取提到的专题数据。为了保护研究对象的隐私,有些数据信息的访问是受限制的。
ICPSR提供的服务包括:研究人员可以直接下载数据,将数据与根据数据发表的出版物通过DOI相连接,为用户提供免费的支持,开展定量研究方法暑期课程,网站提供在线学习中心(主要教授社会科学中的量化推理)。
PSID始于1968年,是美国历史最为悠久的两大跟踪调查项目之一。PSID启动初期,在全国范围内抽取了5000个家庭,18000个个人。40多年来,这些个人和他们后代的信息被持续采集,覆盖就业、财富、收入、支出、健康、婚姻、生育、抚养、捐赠、教育等方方面面,采集的变量超过50000个。PSID调查数据经过一定的隐私保护处理后,在网络上公开发布,研究者可以免费获取和使用。
PSID调查数据被全球的科研人员、政策分析家及教师等广泛使用,目前已发表了超过3000篇基于PSID的匿名审稿论文,论文作者包括多位诺贝尔经济学奖得主。许多国家由于认识到PSID的重要性而发起了类似调查,促进了跨国比较研究。2010年,PSID的成就被美国NSF确认为近60年来NSF资助项目中的60项重大进展之一。
2.3 CHRR和NLS项目
CHRR成立于1965年,是一家以社会调查研究见长的跨学科研究机构,管理和维护着美国历史最长的跟踪调查——全国跟踪调查(National Longi-tudinal Surveys,NLS)。
CHRR目前共有专职人员100余人,主要从事NLS调查、Survey Suite调查系统的开发、运行与维护、对外承接社会调查等工作。CHRR的专业特长主要在于调查设计、调查指导、数据采集与发布等,注重调查研究方法的创新,与政府部门、研究及教育机构等建立了广泛的合作关系。在基于社会调查的劳动力市场行为的经济学、社会学及心理学分析等研究方面处于领先地位,其研究结果对美国政府劳工政策的决策具有重要影响。CHRR同时也是NORC的技术支持提供者。
NLS是CHRR执行和维护的最大的长期跟踪调查项目,始于1966年。其在线数据库已成为经济学家、社会学家及其他学者研究劳动力供应、收入分配、求职与离职、劳动力市场不平等问题的重要工具,在研究政府劳工政策及各种社会心理等因素对劳动参与者的影响方面也极具价值。
NLS由美国劳工部的劳工统计局发起和最先资助,主要采集美国居民在劳动力市场的经历信息,至今已跟踪调查了超过5万名美国居民。每个NLS受访者队列均以美国特定年龄的人群为总体进行抽样,经过挑选和加权后得出全国性的结论。此项唯一性的调查可以为研究者提供分别针对成年男性、女性和儿童生活的重要方面的面板数据。
NLS调查数据可以在线获取。CHRR还创建和维护着一个关于NLS研究的资料库网站,提供近几十年来基于NLS调查数据的期刊论文、工作论文及学位论文的详细目录资料,极大地促进了NLS的研究和推广。
2.4 HMDC
HMDC的前身哈佛数据中心成立于20世纪60年代初,最初主要用来存放美国政府的数据,归属于政府的艺术和科学部。其在1996年签订了一项协议,将服务延伸到麻省理工学院的用户,允许他们存储和检索数据,并提供数据分析支持。之后更名为HMDC,2005年成为IQSS的成员之一。
HMDC收集了超过100TB的数据、音频和视频资料,它的网站拥有罗珀民意研究中心、ICPSR和沃顿的研究数据,用于服务美国人口普查网站、国家中心卫生统计局和特殊兴趣收藏公司等的数据档案。著名的亨利·A·穆雷研究典藏库源于哈佛的捐赠,用来永久保存IQSS定量和定性的研究数据,并为整个IQSS Dataverse网络提供物理存储。
1997年,HMDC完成了第一个网络版本的虚拟数据中心的项目。1999年,HMDC获得美国国家科学基金会和其他五家资助机构数百万美元的赠款,用于开发操作性更强、资源开放、定量研究数据的数字化图书馆。此后,HMDC从美国国会图书馆等处获得额外的补助和资金支持,继续研究和开发项目。Dataverse是2007年推出的在线数据平台,提供引用标准、数据归档和在线分析等功能。
HMDC通过IQSS Dataverse网站(http:∥dvn.iq.harvard.edu/dvn/)提供研究数据和结果的长期托管,使研究人员能够轻松地将社会科学数据以标准格式存储,让其他人更快速更可靠地审阅和复制实验结果。HMDC提供数据管理、研究方法和计划、软件培训、编程支持等方面的技术咨询,并开办统计讲习班。此外,HMDC还提供先进的计算设施和基础设施,其中包括功能强大且易于使用的研究计算工具、集群的计算能力、应用程序和服务器托管、现场计算机实验室。
3 社会科学数据共享平台及在线分析软件
美国社会科学数据中心拥有的数据平台分为两种:自建或采用成熟的软件产品。ICPSR的共享平台是自行研发,已有多年的历史,异常庞大,并不适合移植。当前比较成熟的产品有两个:Dataverse和Nesstar。除此之外,美国也有一些科研机构采用机构库软件Fedora和Dspace来存放科学数据。