互联网发展背景下,当今社会每天都会产生海量数据。然而这些数据往往相互隔离,不是一个可方便流通的整体,而呈现出一种各自分散的孤岛状态。当不同行业不同系统间想要互相使用对方的数据时非常困难,而单独的数据孤岛能创造的价值又十分有限。现有技术提供的移动端数据和固网数据的映射方法,能够将移动端数据和固网数据关联起来,建立终端及宽带账号信息关联。结合ID-Mapping与用户专项标识,把碎片化的数据全部串联起来,消除数据孤岛,将个人的所有信息都纳入用户信息视图之中,提供一个用户的完整信息视图,使得不同行业不同系统不同领域间的数据实现互联互通,成为数据互通的核心。
综合利用用户所属信息、业务信息以及上网行为信息等,可以对每个用户个体进行几乎全方位的标识信息整合,并且通过其中部分标识,可以对用户关系进行识别,为建立用户关系模型提供参考依据。
1) 用户信息视图建立过程中,首先对用户不同属性信息进行分类,并针对每一类信息建立专项用户标识库;
2) 在专项标识库中,为每一个标识找到关联项。即建立专项标识库内映射网络;
3) 以各类标识作为复杂网络中的节点,操作系统、IP、时间序列数据以及许多其他的用户访问特征数据作为节点属性,标识之间的关联关系使用边表示,如果标识节点之间有关联关系,则建立一条有向边。通过两两标识节点对的节点属性进行比较,使用算法分析匹配,推断这两个标识属于同一个用户的可能性大小,达到某一个可接受的阈值,将这两个标识识别为同一个用户。
输入步骤 |
关系图状态 |
在IT侧移动用户数据表中有2条关系: ACCS_NUM_1与身份证(ID_NUM) ACCS_NUM_1与客户ID(CUST_ID) |
3个节点(ACCS_NUM_1,ID_NUM,CUST_ID),2条关系被加入图中。 |
在IT侧宽带用户数据表中有2条关系: ACCS_NUM_2与身份证(ID_NUM) ACCS_NUM_2与客户ID(CUST_ID) |
1个节点(ACCS_NUM_2),2条关系被加入图中。 |
在IT侧固话用户数据表中有2条关系: ACCS_NUM_3与身份证(ID_NUM) ACCS_NUM_3与客户ID(CUST_ID) |
1个节点(ACCS_NUM_3),2条关系被加入图中。 |
在网络侧移动用户表中有1条关系: ACCS_NUM_1与 QQ1 |
1个节点(QQ1),1条关系被加入图中。 |
在网络侧固网用户表中有1条关系: ACCS_NUM_2与 QQ1 |
1条关系被加入图中。 |