1多维分析视角的同构信息网络分析
1.1多维网络
同构信息网络属于新型的数据形式,为了对其进行分析需要实现简单模型的建立,以该模型为基础进行分析操作。将同构信息网络进行抽象之后就得到了多维网络模型。例如一个小型的社交网络,将社交网络中的每一个人都视为一个节点,每一个节点都具有姓名、国籍、职业、年龄、学历等多维属性。两个节点之间的连线代表着两人的朋友关系,可以实现信息的共享,因此两节点之间的线中都包含了多条信息,而每条信息中又包含了ID、信息、主题等多维属性。通过多维网络实现了对社交网络的建模,从而对社交网络中的实体信息进行了展示,从而将实体与实体之间具体的关系进行了表示。
1.2简单嵌套立方体中的联机分析处理操作
在对简单嵌套立方体进行分析的过程中,选取双向两层联机分析处理查询方式,主要包括点到边的查询与边到点的查询两种类型。为了能够对这种查询进行更好的理解,沿用上文社交网络的例子来进行说明。在多维网络中可能存在的联机分析处理类型的查询包括:第一,不同国家的人如何实现信息的共享及信息在不同类别如何发布;第二,对特点信息进行分享的人在职业方面的结构分布。这两个查询都涉及到多维网络的聚集操作,首先从对应的图立方体中找到对应的度量网络,之后从对应的数据立方体中找到答案对应的度量。首先,点到边的查询。首先对结点进行分析,之后再对边进行分析,也就是所谓的先对图立方体进行多维分析,之后再对动态生成的数据立方体进行多维分析。在对上面的第一个类型进行查询的过程中,首先依据国籍维度对所有的节点进行分组,将在国籍方面具有相同值的节点划分到同一组中,同时将这些节点对应的边进行合并,从而得到不同国籍之间所分享的信息,之后再对这些分享信息按照类别对其进行划分。其次,边到点的查询。首先对边进行联机分析查询,之后再对节点进行分析,也就是说先对内层数据立方体进行分析,之后再对动态生成的图立方体进行分析。在对上文第二类型进行查询的过程中,首先应该对所有的共享信息的类别分布进行计算,之后在对特定的类型进行选定,从而对该类别信息进行分享的人进行选择,之后在对这些选择的人的职业拓扑情况进行计算。通过对共享信息类别的分布进行计算得知人们对政治信息关注较多,在选定了政治类别的信息之后,对共享这些政治信息的人们的职业拓扑分布进行计算,从而得知教师、医师之间进行政治信息共享的较多。
2多维分析视角的异构信息网络分析
2.1多维异构网络
图1代表一个小型的多维异构网络,其中结点代表两种实体,方形代表的是作者,三角形代表的是论文,两者之间的连线代表论文是该作者所发表,若两个三角形指向一个方形,则证明两篇论文为同一位作家所发表,如果两个方形指向一个三角形,则证明两位作家共同发表了一篇论文。图1中的多维异构网络对文献网络进行了形象的刻画,一方面对作者的合作关系与论文的出处关系进行了表达,另一方面对作者与论文两种之间类型之间的关系进行了表达。在多维网络中包含了两种不同类型的实体,因此将其称之为两类型多维异构网络。
2.2两层嵌套立方体
通过两类型多维异构网络可以实现两层嵌套立方体的获得,由图1所示的两类型多维异构网络可知两层嵌套立方体主要包括两种情况:第一,重视对V1类型实体与实体之间的关联进行重点研究,则V1类型实体的属性构成了未曾图立方体的维度,通过对其属性子集聚集进行计算得到图立方体,将图立方体的度量作为度量网络,将V1实体进行分组,不同小组之间的V2类型实体的属性构成了内层数据立方体的维,通过对其属性子集聚集进行计算得到数据立方体。数据立方体存在与图立方体的度量中,两者之前形成嵌套关系。第二,重视对V2类型实体与实体之间的关联进行重点研究,将V2实体集合构成外层他立方体,V1类型实体结合构成内层数据立方体,两者自检相互嵌套。综上所述,两层嵌套立方体指的是外层图立方体中包含内层数据立方体,同一种类型的实体既可以构成内层图立方体,也可以构成外层的数据立方体。因此,同一个两种类型多维异构网络依据分析角度可以分为两个两层嵌套立方体。在两层嵌套立方体中,两类对象存在既独立又关联的关系。
2.3多层嵌套立方体
两种类型的多维网络能够形成对应的两层嵌套立方体。在异构信息网络中,实体类型包括多种类型,两层嵌套立方体可以扩展成为多层嵌套立方体。例如三种类型的异构网络能够形成六个不同的三层嵌套立方体。因此,多方体中同样适应。此外,还可以通过复合查询的方式对多层嵌套立方体中的多种类型分析对象进行查询。在多层嵌套立方体的联机分析处理操作过程中,N层嵌套立方体上的复合查询需要N-1次转换分析对象操作,从而形成N-1个部分立方体。
3总结
在信息网络多维分析方法的研究方面已经取得了一定的成果,在已有的研究方法中不能够实现对同构信息网络的联系进行深入分析,而且对异构信息网络的研究也较为缺乏。本文通过立方体相互嵌套的思想对信息网络的多维视角分析问题进行了解决。针对同构信息网络提出了简单嵌套立方体,针对异构信息网络提出了多层嵌套立方体,对两者之间的区别与联系进行了研究,为基于多维分析视角的信息网络研究奠定了理论基础。
作者:刘峰 叶红