大数据时代来临。继物联网、云计算之后,“大数据”已迅速成为信息化技术发展的主流,各行业对大数据技术的应用也渐呈白热化状态。如何更方便地管理大数据,如何更快速地将大数据技术应用到企业业务中,如何更有效地实现企业大数据的价值,成为了各大企业争相竞逐的热点。
赛思信安凭借在海量数据技术领域的多年积累,推出了Scistor dataFusion(赛思大数据管理平台),可满足各类企业级用户大数据应用中的如下需求:对结构化数据、半结构化数据、非结构化数据进行快速整合和统一管理,支撑PB级数据存储管理;对海量数据进行多语义高速检索;对文本数据和结构化数据进行统一检索和统计分析;对Hadoop平台和传统关系型数据库中的数据进行关联分析;实现操作可视化、数据可视化;构建跨地域多数据中心,实现多数据中心的统一管理和访问。
Scistor dataFusion是一个基于分布式框架,采用并行处理技术,对外提供大容量数据存储、多源数据整合、数据即时检索、数据离线分析、海量小文件管理、内存分析的大数据管理平台,具有高性能、高可靠性、高性价比等特性,适合各类企业级用户根据自身业务模式构建高可用的大数据一体化管理平台,轻松驾驭大数据。
强大的数据管理能力
Scistor dataFusion具有以下特点:它支持在线扩展/缩减节点,支持异构多源数据PB级存储;集群有效整合内存计算框架,实现毫秒级响应,集群每秒可处理百GB数据,加载能力可达千万条/秒;支持数据多副本,副本数量可灵活设定,支持所有节点集群化;可提供类SQL和MR分析接口,提供多格式文档、多语言等强大全文检索能力;无缝整合现有关系型数据库,数据分析(图计算、R语言等)和BI工具。
Scistor dataFusion支持跨数据中心部署和应用,提供国家级数据中心解决方案,且单集群节点数达上千台;支持图形化安装配置部署,提供集群监控报警功能。
创新的架构
Scistor dataFusion采用了创新的架构。
从架构图中可以看到,iIntegrator主要负责外部数据源的收集、复杂数据的清洗加工以及多存储引擎中数据的交换;iManager负责整体系统的管理与监控;iSentry负责存储资源的申请与回收,同时负责用户权限控制;HDFS、LFS、HBase、RDBMS组成了差异化存储,根据用户业务不同对数据进行分类存储;iQuery,iDriller,iStream都是对数据进行处理的组件,其中iStream专注于内存数据处理应用、iQuery专注于海量记录高效检索应用、iDriller专注于海量数据分析统计应用。
广泛的应用领域
Scistor dataFusion可广泛应用于政府、商业智能、金融、能源、互联网/物联网、教育科研、医疗卫生、智能交通、智慧城市等诸多领域。
在这些应用中,Scistor dataFusion首先帮助用户解决激增的多源异构数据的统一存储与管理;其次,充分满足用户对海量数据快速检索、分析与挖掘的需求;最后,根据数据分析结果为用户提供报表、趋势等多形态效果展示,实现用户与数据的智能沟通,去除一个个信息孤岛,助力用户在大数据时代创造更大的商业价值和社会价值。