在线社交网络下基于信任度的消息传播模型

在线社交网络下基于信任度的消息传播模型

2016-02-20 12:13:52热度:作者:来源:

话题:传播模型 电子商务 幽默笑话 学习的方法 在线社交网络下基于信任度的消息传播模型 

摘 要:

社交网络作为一种新兴的媒体具有广泛的社会影响力,且基于社交网络的营销方式逐渐成为一种新的发展趋势,因此研究社交网络中消息的传播具有重大的现实和经济意义。通过借鉴日常生活中人与人之间的信任原理,提出了一种基于信任度的消息传播模型。该模型首先利用个体的公开信息,使用数据挖掘的算法对个体进行分类;然后,根据同类和不同类个体之间的关系计算个体之间的信任度;最后,使用消息与个体的属性相似性以及信任度来计算消息可能传播范围。给出了相应的计算方法,并与两种基准方法对比,结果表明,该模型在准确度上提升15%左右,而所用时间降低50%以上。与数据集统计结果对比,该实验的结果与统计结果相差5%左右,充分表明该模型在实际应用中有比较好的效果。
关键词:
社交网络;数据挖掘;分类算法;信任度;网络的结构聚类算法;消息传播模型
中图分类号:
TP393.4
文献标志码:A
Trust-based information propagation model in online social networks
Abstract:
As a new media, social network gains a wide range of social influence, and the social network based e-commerce becomes more and more popular, which make the study of information propagation of great significance. A trust based information propagation model was presented in this paper according to the trust relationship between people in daily life. First, the algorithm of data mining was employed on personal information to make the classification of the users. And then the value of trust between the users was calculated according to their relationships. At last, this paper predicted the range of information propagation by using the trust value between the users and messages. Compared with two basic methods, the final experiment shows that the results generated by the model are enhanced by 15% in precision, while the time used decreases more than 50%. The results differ with the statistic results on the dataset at 5%, which shows that the model preforms well in practice.
Key words:
social network; data mining; classification algorithm; trust; Structural Clustering Algorithm for Networks (SCAN); information propagation model
0 引言
近年来社交网络得到了迅猛的发展,信息化革命让人们越来越依赖网络获取资讯,大批的社会性网络服务(Social Networking Service, SNS)网站受到越来越多用户的欢迎,如国外的Twitter,以及国内的新浪微博等。用户通过社交网络分享新闻、日志、视频等,维持和开拓人际关系,正是由于社交网络的开放性,人与人之间很容易建立起关系且这种关系不受时间、空间的限制。与传统的社交网络相比,社交网络上的消息传播有其随意性、不可控性以及其前所未有的传播优势和巨大的影响力,使其成为拥有强大舆论动员力的传播工具。同时由于电子商务的发展,基于SNS的网络营销越来越受到人们的重视,而SNS上的消息受众的多少也直接影响营销的效果,了解消息的受众范围往往可以收到事半功倍的效果。因此,对社交网络上的消息传播的研究具有非常重要的社会意义和经济意义。
在现实生活中,熟人之间的通信是消息传播的重要方式,而社交网络是现实中人际关系的反映,因此在消息传播模型中加入信任度的概念,不仅能有效地了解消息在社交网络中的传播,同时大大降低了研究消息传播的用户的规模。
在之前对信任度的研究中,很多优秀的模型和算法被提出来,文献[1]提出了P2P网络中节点之间的通过信任度建立下载关系;针对P2P网络中信任计算方法,文献[2]提出了基于名誉度的计算模型,文献[3]通过P2P网络中节点之间的交互记录来计算节点之间传递的信任度。文献[4]总结了对等网络环境下信任机制的体系结构,并对信任模型进行了相关总结。虽然这些信任模型在P2P对等网络中有非常显著的作用,然则社交网络并不完全等同于P2P网络,因此需要对信任模型加以修改。文献[5]将信任模型引入到社交网络中,提出了二度信任模型来解决社交网络中人与人之间的关系;文献[6]将拍卖中审计的机制引入社交网络的信任模型,防止了用户之间信任度的欺骗行为,然而在信任度的计算过程中,却仅仅使用粉丝数的多少来确定个人的原始信任度;文献[7]通过用户之间的熟悉性和相似性计算用户之间的信任度,但是没有考虑到社交网络中用户数量的庞大,因此只能计算部分用户的信任度,达不到预期的目的。纵观这些方法,其缺陷在于这些模型是基于最基本的统计模型。基于统计得来的结果往往能达到比较好的效果,然而随着数据的爆炸式增长,大量的伪数据可能会给这些统计结果带来偏差。据统计分析,Twitter用户的人均粉丝数为51人,人均推文数高达307条,且该数量以每月20%的速度增长[8]。面对大量数据,依靠统计模型已经不能充分说明消息传播的途径和范围。本文通过借鉴之前的研究成果,结合当前社交网络中的具体情况,提出了基于数据挖掘的信任度计算方法,然后使用该方法来模拟消息在社交网络中的传播。本文中的信任与心理学中人与人的信任的概念稍有不同,在本文中信任是指消息接收者对于消息发布者发布或者转发的消息,相信并转发该消息的可能性。在本模型中,首先利用数据挖掘中的分类方法对群体进行分类,然后通过消息发布者与消息接收者之间的历史交互记录,计算个体之间的信任度,通过这种方式来评估消息在社交网络群体中的传播途径和传播范围。
1 社交网络的消息传播机制
1.1 社交网络中的信任关系
本文用图论中的加权有向图G(N,E,W)来表示社交网络。其中:节点N表示群体中的个体,有向边E表示两个个体的关系,权重W表示两个体之间的信任关系。社交网络在逻辑形式上表现如图1所示。
在现实生活中,人们之间存在很多关系,其中部分关系是由兴趣相同而产生的。根据常识,一般兴趣相同的人的话更容易被接受,也就是说他们更信任与自己有相同爱好的人。因此,可以将每个人的爱好等这类内部属性总结出来,如果两个人之间的属性更加相近,则他们之间的信任度会更高。当这些属性确定之后,就可以根据个体的这些属性以及在群体中的社交关系将社交网络中的个体划分类别,之后可以计算个体在所在类别中的信任度;当群体中的个体对其所有邻居的信任值都确定之后,就可以通过信任度来预测消息可能的传播范围。