Research on “Many-to-Many” User Interaction Model under the Influence of Opinion Leaders
-
摘要: 大数据时代的来临使得在线社交网络中,舆论大V与普通用户影响力差异日趋明显。以共同受到舆论大V影响的普通用户的行为表现为研究对象,从“舆论领袖—普通用户”的“一对多”信息传播模式入手,在宏观层面分析用户行为随时间的变化,在微观层面引入社团发现算法探寻用户间的交互特征。实证方面,选取两个案例、六个试验样本进行试验,发现在“一对多”影响下的普通用户之间存在“多对多”用户交互模式。实验结果表明,“多对多”模式交互周期较短,同时发现帕累托法则适用于交互形成的社团。Abstract: The advent of big data age makes the influence of public opinion leaders and ordinary users significantly different. On the basis of " one-to-many” information dissemination mode between public opinion leaders and ordinary users, this paper analyzes the changes of user behavior with time at the macro level, and at the micro level, it analyzes the characters of ordinary users with the help of community detection algorithm. To carry out empirical analysis, two cases as test samples are selected, and it is found that the " many-to-many” interaction mode exists under the influence of the " one-to-many” mode. The results show that the " many-to-many” mode has a shorter interaction period, and the Pareto law can be applied to communities, which are formed through interaction.
-
Keywords:
- big data /
- public opinion leader /
- community detection /
- Pareto rule
-
引言
大数据时代,信息的获取与分析面临着很多新的问题。网络舆情方面,数据的“大”一方面体现在“数据体积”上,热点事件产生海量、高增长率和多样化的舆情信息数据;另一方面体现在“数据逻辑”上,社交网络用户并非独立存在,用户间存在复杂的社交关系作为支撑。Web2.0的到来使社交网络中的每个用户既是信息的产生者,又是信息的接受者,舆论领袖的影响日益显现,网络社交圈的内在机理愈发复杂。“舆论领袖”的概念于20世纪40年代由拉扎斯菲尔德、贝雷尔森等人首次提出[1]。Huffaker认为舆论领袖常常通过制造或激发某一特定主题的对话来设置议程,甚至能影响人们讨论话题的方式[2]。雷海平认为微博话语场中的信息和意见日益为意见领袖所掌控和引领[3]。彭兰则表示,某种意义上意见领袖是网民话语权的集成者,但同时也认为网络现在未必赋予了所有人平等的话语权[4]。整体而言,社交网络中信息的传播存在“一对多”的舆论大V主导现象。当前,微博作为重要的社交平台得到了迅速的发展,微博大V的粉丝动辄数百万,回复转发动辄上万,而普通用户发布的信息鲜有关注,舆论大V与普通用户影响力差异悬殊,舆论大V已然成为微博平台中的舆论领袖。
舆论领袖的影响力不可小觑,但社交网络中仍存在着千千万万影响力远不及舆论领袖的普通用户。现有对舆论领袖的研究中,宏观层面多关注舆论领袖对舆论的影响,季丹等对意见领袖在危机信息传播中发挥作用的关键因素进行了探究[5]。梦非则以社会化商务为研究背景,研究了意见领袖对购买意愿的影响[6]。李卓卓、顾品浩等人则结合舆论领袖对具体案例进行了舆情分析[7~8]。微观层面对舆论领袖的研究多集中于舆论领袖的识别。陈远等将社会网络分析的方法应用到舆论领袖的识别[9]。马宁等则运用动态网络分析法识别出了网络舆论中的六类不同特点意见领袖[10]。樊兴华等则将改进后的影响力扩散概率模型运用到了网络意见领袖的筛选中[11]。舆论领袖对舆情的影响不容小视,但舆论领袖却不能完全代表普通用户的行为特征,而当前对舆论领袖的研究中,尚缺少将舆论领袖影响下普通用户作为研究主体的研究。
相较于现有研究,本文以共同受到舆论大V影响的普通用户群体为主要研究对象,从“数据逻辑”的角度,着重探讨普通用户间的行为表现、交互特点,发现在舆论大V“一对多”的影响下,普通用户之间存在“多对多”的用户交互模式。研究视角上,从宏观、微观两个层面分析“多对多”的用户交互模式。研究方法上,结合社会网络分析的同时,引入社团发现算法挖掘用户的交互特征。
一、舆论大V影响下的用户行为
信息来源日趋多元化的使得,舆论大V要有足够的舆论引导力,关注度必不可少。杨晓茹认为在微博上想要发布的信息受到关注,博主需具备如下条件:(1)处于信息源的上端;(2)具有权力社会身份;(3)发言能引起共鸣[12]。然而网民作为独立的个体,关注不意味着观点上的认同。与此同时,作为一个动态的社区,在线社交网络中的话题、参与人、交互模式与情感趋向不可能一成不变,网民对舆论大V的认同感也会因时、因事而变。舆论大V对舆情的整体影响固然不容小觑,但在舆论大V影响下的普通网民群体的行为特征与趋向却不能与舆论大V的行为特征与趋向一概而论。
对舆论大V发布于在线社交网络上的信息,网民最直接的行为可总结为:转发、回复与点赞,其中转发行为的意义偏重于对信息的传播,点赞行为的意义则主要为对信息的认同,相较之下,网民对舆论大V发布信息的回复不仅意味着网民已获知该信息,更意味着网民对该信息形成了自己的观点。与此同时,网民不仅可以直接回复舆论大V发布的信息,更可以对回复该信息的其他网民进行二级回复。对观点的认同和反对均能促使用户对特定信息进行回复,这使得“回复”这一行为俨然促成了一个因舆论大V而聚合的二级舆论场,而对“回复”产生信息的研究有助于我们认识舆论大V影响下普通网民群体的行为特征。
This page contains the following errors:
error on line 1 at column 1: Start tag expected, '<' not foundBelow is a rendering of the page up to the first error.
“社团”可视为网络中具有相似特性或紧密链接的点和线的集合。网络舆情中的社团发现有助于挖掘人群、观点集合,并在此基础上进一步分析舆情的传播与演化。社团发现也可看作一种聚类算法,可依据社团之间是否有重叠而分成重叠社团发现算法和非重叠社团发现算法两类[19],也可依据网络社团特性,将其分为依据层次性的算法、依据重叠性的算法和层次性和重叠性同时体现的算法三类[20]。模块度被视为评价社团发现算法的重要指标,模块度modularity[21]计算公式如下:
${\rm{modularity}} = \mathop \sum \limits_{c \in C} \left( {\frac{{{l_c}}}{m} - {{\left( {\frac{{{D_c}}}{{2m}}} \right)}^2}} \right)$
其中,m为图中总边数,lc代表社团c中所有内部边数,Dc则代表社团c中所有顶点的度之和。fast unfolding算法是当前基于模块度这一评价指标的最优秀的算法之一,故在此采用fast unfolding算法对回复图RG进行社团发掘[22]。
二、 宏观层面下“多对多”交互模式的时序特征
为对舆论大V影响下的普通用户行为特征进行实证分析,从而进一步探究其中规律,以新浪微博为研究平台,抽取具有千万粉丝的官方媒体代表微博“央视新闻”为舆论大V样本,该样本满足关注度高、社会地位高、居于信息源上端等特点。事件选取方面,取2016年、2017年的“男童坠井”和“榆林产妇”两件突发性事件作为事件样本,从央视新闻发布的事件相关微博中各选取三条作为研究对象。基于数据采集平台,抓取每条微博的评论信息,经数据预处理后,得到具体数据信息见表1。
表 1 样本信息表案例 微博发布时间 微博内容 采集回复条数 榆林产妇事件 2017年9月6日 【国家卫计委:榆林产妇事件让人痛心 已责成当地认真调查核实】今天,在例行发布会上,国家卫计委表示关于榆林产妇事件,让人非常痛心,是谁都不愿看到的,对家属表示深切慰问。国家卫计委对此高度重视,已责成当地卫生计生部门认真调查核实,依法依规严肃处理。(央视记者史迎春) 1843 2017年9月6日 【陕西产妇坠楼事件监控曝光 院方与家属仍各执一词】8月31日20时左右,陕西榆林第一医院绥德院区,一名待产孕妇从5楼坠亡,初步排除他杀。医院今天凌晨公布监控。院方称,因胎儿头部偏大曾建议剖宫产,但家属坚持顺产。产妇丈夫则表示,“我们要求剖腹产他们不同意”。 3788 2017年9月7日 【一图|顺产还是剖腹产?准妈妈们看完这篇就不用再纠结了】近日,陕西榆林产妇跳楼身亡一事引发广泛关注,涉事医院和产妇家属虽各执一词,但毫无疑问的是产妇在跳楼前承受了难以忍受的临产痛苦。那么生孩子顺产还是剖腹产好?这些数据给你参考。 2035 男童坠井事件 2016年11月8日 【6岁男童不慎掉入40米枯井 60台挖掘机持续救援】6日上午,河北保定一6岁男童不慎掉入约40米深枯井。为保证井下氧气充分供应,现场有60台挖掘机持续救援,预计救援挖掘土方量在200万方左右。因井下温度高雾气大,救援人员目前还无法观察到男童的具体情况。愿孩子挺住!(央视记者宾超) 5350 2016年11月10日 【河北蠡县通报:落井男童已找到,已无生命体征】据营救副总指挥吴素杰介绍,在救援超100小时后,河北保定6岁坠井男童终于被找到,但遗憾的是孩子已无生命体征。据@河北日报:11月6日上午,蠡县中孟尝村村民赵向阳带女儿和儿子赵梓聪到地里挖白菜,赵梓聪在玩耍时不慎落入废弃机井。(央视记者谢宾超) 3279 2016年11月12日 【沉重!河北男童坠井事件背后还有大问题!】6日,河北蠡县6岁男童赵梓聪和家人去地里收白菜时不慎坠入枯井。历经107个小时救援,救援人员终于从井底抱出男童,但经现场医护人员确认,已无生命体征。为何近年来废井“吃人”事件不断?枯井从何而来? 1091 时间因素和体量因素是宏观层面反映回复信息特征的重要因素,在此基础上对抓取的回复信息进行分析。获取每条回复信息的时间标签进行统计整理,得到回复信息数量折线图如图2。
分析发现除男童坠井事件的第二条微博,其他微博中的评论信息在第一天即达到峰值,前三天随着时间的推移而急剧下降,后趋于平缓。追溯男童坠井事件的第二条微博,发现该微博发布时间为当天的23时37分,这意味着,23分钟内该微博的评论量就高达981条,若将事件发生后的24小时记为第一天,则这与上述结论在根本上并不矛盾。
进一步统计微博发布前三天微博回复信息占比如表2。由表2可知,微博发布前三天的回复数占总数近99%,网民的回复热情消退迅速,这说明在舆论大V影响下,网民对信息“喜新厌旧”的心理明显,作用到行为上则表现为大V影响下普通用户间交互的周期较短。
表 2 前三天微博评论信息占比表案例 微博 前三天回复信息占总信息比例 榆林产妇事件 微博1 0.984160507 微博2 0.988206388 微博3 0.99240369 男童坠井事件 微博1 0.992149533 微博2 0.993596 微博3 0.9990834 结合图1、表2可知:(1)相较于新闻的“七天原则”,舆论大V发布的单条微博评论信息的高关注期较短,仅为三天左右,大V影响下普通用户间交互周期较短。(2)每例事件舆论大V都在不同时间发布了多条信息,故就事件整体而言舆论高关注期在5~7天。
三、 微观层面下“多对多”交互模式的行为表现
从宏观层面深入到微观,具体探究普通用户间的行为模式。发现基于评论对象,评论信息可分为两类:(1)对舆论大V的直接评论;(2)对普通用户评论信息的二次评论。在本实验样本中,间接评论占比如表3。
表 3 间接评论占比如表案例 微博 间接评论占比 榆林产妇事件 微博1 0.443505808 微博2 0.4997543 微博3 0.469886055 男童坠井事件 微博1 0.466168224 微博2 0.309240622 微博3 0.477543538 若对舆论大V的直接评论主要体现着舆论大V与普通用户之间“一对多”的影响,间接评论则代表着普通用户之间“多对多”的交互模式。通过表3可知,整体而言间接评论占比接近50%,这说明因舆论大V影响而聚合到一起的普通用户社团中仍存在着复杂的用户交互行为。
从数据集中抽取间接评论数据构建回复关系图RG(相同的回复关系仅计一次)。运用Gephi对回复关系图进行可视化,以榆林产妇事件中的微博1和男童坠井事件中的微博2为例进行可视化,可视化结果如图2、图3。
通过两类事件的网络图不难发现间接回复构成网络中的各点呈现两种趋势,一方面存在较为明显的集聚效应,另一方面又存在大量的游离用户集合。在此基础上,运用fast unfolding社团发现算法对回复图RG进行社团发掘。发掘后,统计各微博对应的平均社团规模如表4。
表 4 平均社团规模案例 微博 总结点数 社团数 平均节点数 榆林产妇事件 微博1 1108 63 17.5873 微博2 581 66 8.80303 微博3 481 39 12.33333 男童坠井事件 微博1 1879 87 21.5977 微博2 666 58 11.48276 微博3 258 28 9.214286 分析表4,从社团数和平均节点数两方面入手:
(1)社团数:整体而言,可以发现社团数基本与总结点数成正比,这一定程度上意味着由间接回复关系构成的回复图RG中,其社团结构存在一定的规律性。
(2)平均节点:各条微博在平均节点方面存在较大差异,但可以发现每例事件中,平均节点数最高者较最低者高出约一倍,且都为总结点数最高的微博。结合图3、表4,推测总结点数较高的微博中存在大型社团致使平均节点数被拉高。
为进一步分析回复图RG中的社团关系,需进一步了解不同规模社团的分布状况。设社团i包含的节点数为cn(i),当cn=x时,社团数累计占比acR的计算公式为:
${acR}\left( {\rm{x}} \right) = \frac{{\mathop \sum \nolimits_{i \in C} 1}}{{sumCommunity}},\;\;{\rm{for}}\;i\;{\rm{in}}\;C,\;cn\left( i \right) \ge x,$
节点数累计占比acnR的计算公式为:
${acnR}\left( {\rm{x}} \right) = \frac{{\mathop \sum \nolimits_{i \in C} cn\left( i \right)}}{{sumNode}},\;{\rm{for}}\;i\;{\rm{in}}\;C,cn\left( i \right) \ge x.$
其中sumCommunity代表社团总数,sumNode代表节点总数。
针对样本数据,计算使acnR>20%时最大的x值,及对应的社团数累计占比和节点数累计占比得表5。
表 5 累计占比表案例 微博 x acnR(x) acR(x) 榆林产妇事件 微博1 28 0.879061 0.206349 微博2 11 0.819277 0.212121 微博3 28 0.64657 0.205128 男童坠井事件 微博1 4 0.923363 0.218391 微博2 22 0.716216 0.206897 微博3 17 0.593023 0.214286 平均值 18.33333 0.762919 0.210529 表5数据显示,对于使acnR>20%时最大的x值,对应的节点数累计占比平均值约为76%,接近80%,也就是社团规模数最大的前20%个社团涉及的用户占总用户数的80%,这说明在舆论大V影响下的普通用户间交互形成的社团适用于帕累托法则。帕累托法则的适用在进一步证实了之前提到的回复图RG中集聚与分散并存现象的同时,对该现象进行了定量化的解释。
值得注意的是,从图3可以发现大型社团中多存在一个作为焦点的核心节点,且多为被回复节点。从结构上看,与舆论大V在舆论传播网络中所处的地位类似,但追溯到具体回复内容时发现,这类核心节点有时收到的是用户赞同的回复,说明其具备了一定的影响力,但有时这类节点不仅不具备舆论大V的影响力,还可能是聚合了相反观点的“众矢之的”,图3中的规模最大社团中的核心节点便是这种情况。在舆论大V影响下普通用户间交互形成的拓扑结构中,存在着“同形不同义”的现象,该现象的存在值得后续在对观点的进一步研究时给予关注。
四、 结语
自媒体时代,舆论大V可视为民众观点的集成者,但在舆论大V影响下的普通网民群体的行为特征与趋向却不能与舆论大V的行为特征与趋向一概而论。在此基础上,本文从大数据“数据逻辑”的角度出发,以舆论大V影响下的普通网民群体的行为特征与趋向为研究对象。通过分析网民对舆论大V的反馈行为,选定回复关系构造回复图,结合社会网络分析从宏观、微观两个层面进行研究,发现从宏观层面,网民对舆论大V发布的微博“喜新厌旧”的心理明显,对单条微博的关注度消退迅速;微观层面,从拓扑结构来看,大V影响下的普通网民群体中集聚与离散现象并存,经社团挖掘和进一步分析发现帕累托法则适用于舆论大V影响下的普通用户间交互形成的社团规模。
在研究中我们发现,普通用户间的行为模式与潜在逻辑关系要比我们的预想更为复杂,“同形不同义”的现象就可见一斑。这种复杂性是主观层面人类的心理、行为与客观层面信息的发布、传播多系统交叉结合的产物。为进一步探讨,该领域在今后应全面地结合多元信息,构筑复杂系统进行刻画与研究。
-
表 1 样本信息表
案例 微博发布时间 微博内容 采集回复条数 榆林产妇事件 2017年9月6日 【国家卫计委:榆林产妇事件让人痛心 已责成当地认真调查核实】今天,在例行发布会上,国家卫计委表示关于榆林产妇事件,让人非常痛心,是谁都不愿看到的,对家属表示深切慰问。国家卫计委对此高度重视,已责成当地卫生计生部门认真调查核实,依法依规严肃处理。(央视记者史迎春) 1843 2017年9月6日 【陕西产妇坠楼事件监控曝光 院方与家属仍各执一词】8月31日20时左右,陕西榆林第一医院绥德院区,一名待产孕妇从5楼坠亡,初步排除他杀。医院今天凌晨公布监控。院方称,因胎儿头部偏大曾建议剖宫产,但家属坚持顺产。产妇丈夫则表示,“我们要求剖腹产他们不同意”。 3788 2017年9月7日 【一图|顺产还是剖腹产?准妈妈们看完这篇就不用再纠结了】近日,陕西榆林产妇跳楼身亡一事引发广泛关注,涉事医院和产妇家属虽各执一词,但毫无疑问的是产妇在跳楼前承受了难以忍受的临产痛苦。那么生孩子顺产还是剖腹产好?这些数据给你参考。 2035 男童坠井事件 2016年11月8日 【6岁男童不慎掉入40米枯井 60台挖掘机持续救援】6日上午,河北保定一6岁男童不慎掉入约40米深枯井。为保证井下氧气充分供应,现场有60台挖掘机持续救援,预计救援挖掘土方量在200万方左右。因井下温度高雾气大,救援人员目前还无法观察到男童的具体情况。愿孩子挺住!(央视记者宾超) 5350 2016年11月10日 【河北蠡县通报:落井男童已找到,已无生命体征】据营救副总指挥吴素杰介绍,在救援超100小时后,河北保定6岁坠井男童终于被找到,但遗憾的是孩子已无生命体征。据@河北日报:11月6日上午,蠡县中孟尝村村民赵向阳带女儿和儿子赵梓聪到地里挖白菜,赵梓聪在玩耍时不慎落入废弃机井。(央视记者谢宾超) 3279 2016年11月12日 【沉重!河北男童坠井事件背后还有大问题!】6日,河北蠡县6岁男童赵梓聪和家人去地里收白菜时不慎坠入枯井。历经107个小时救援,救援人员终于从井底抱出男童,但经现场医护人员确认,已无生命体征。为何近年来废井“吃人”事件不断?枯井从何而来? 1091 表 2 前三天微博评论信息占比表
案例 微博 前三天回复信息占总信息比例 榆林产妇事件 微博1 0.984160507 微博2 0.988206388 微博3 0.99240369 男童坠井事件 微博1 0.992149533 微博2 0.993596 微博3 0.9990834 表 3 间接评论占比如表
案例 微博 间接评论占比 榆林产妇事件 微博1 0.443505808 微博2 0.4997543 微博3 0.469886055 男童坠井事件 微博1 0.466168224 微博2 0.309240622 微博3 0.477543538 表 4 平均社团规模
案例 微博 总结点数 社团数 平均节点数 榆林产妇事件 微博1 1108 63 17.5873 微博2 581 66 8.80303 微博3 481 39 12.33333 男童坠井事件 微博1 1879 87 21.5977 微博2 666 58 11.48276 微博3 258 28 9.214286 表 5 累计占比表
案例 微博 x acnR(x) acR(x) 榆林产妇事件 微博1 28 0.879061 0.206349 微博2 11 0.819277 0.212121 微博3 28 0.64657 0.205128 男童坠井事件 微博1 4 0.923363 0.218391 微博2 22 0.716216 0.206897 微博3 17 0.593023 0.214286 平均值 18.33333 0.762919 0.210529 -
马宁, 刘怡君. 基于超网络的舆论领袖识别应用研究[J]. 中国科学院院刊, 2012, 27(5): 586-594. HUFFAKER D. Dimensions of Leadership and Social Influence in Online Communities[J]. Human Communication Research, 2010, 36(4): 593-617.
雷海平. 微博话语场中的意见领袖[J]. 现代交际月刊, 2011(8): 5-7. 彭兰. 微博话语权力格局的现实图画[J]. 人民论坛, 2013(10): 58-59. 季丹, 郭政. 网络意见领袖对危机信息传播效果的影响因素研究[J]. 情报杂志, 2015, 34(02): 22-27. 梦非. 社会化商务环境下意见领袖对购买意愿的影响研究[D]. 南京: 南京大学, 2012. 李卓卓, 丁子涵. 基于社会网络分析的网络舆论领袖发掘—以大学生就业舆情为例[J]. 情报杂志, 2011, 30(11): 67-70+66. 顾品浩, 蒋冠. 突发性公共事件中的网络意见领袖分析—以" 杨达才事件”为例[J]. 情报杂志, 2013, 32(5): 20-24. 陈远, 刘欣宇. 基于社会网络分析的意见领袖识别研究[J]. 情报科学, 2015, 33(4): 13-19+92. 马宁, 田儒雅, 刘怡君, 李倩倩. 基于动态网络分析(DNA)的意见领袖识别研究[J]. 科研管理, 2014, 35(8): 83-92. 樊兴华, 赵静, 方滨兴, 李欲晓. 影响力扩散概率模型及其用于意见领袖发现研究[J]. 计算机学报, 2013, 36(2): 360-367. 杨晓茹. 传播学视域中的微博研究[J]. 当代传播(汉文版), 2010(2): 73-74. 甘丹. 博客世界交流模式的社会网络分析[D]. 济南:山东大学, 2007. 罗瑶. 虚拟社区成员知识分享动机研究[D]. 上海:复旦大学, 2013. 于乐. 社会网络中社团发现及网络演化分析[D]. 北京: 北京邮电大学, 2014. 邹聪. 基于股票价格相关系数的上证股市社会网络分析[D]. 北京: 北京工业大学, 2013. 张伟. 基于复杂社会网络的网络舆情演化模型研究[D]. 哈尔滨: 哈尔滨工业大学, 2014. 蒋侃, 唐竹发, 张炜. 基于微博的企业网络舆情结构测度与分析——以" 3.15”江淮汽车" 生锈门”事件为例[J]. 情报杂志, 2014, 33(04): 112-116+111. 骆志刚, 丁凡, 蒋晓舟, 等. 复杂网络社团发现算法研究新进展[J]. 国防科技大学学报, 33(1): 47-52, 2011. 汪小帆, 刘亚冰. 复杂网络中的社团结构算法综述[J]. 电子科技大学学报, 2009, 38(5): 537-543. NEWMAN M E J, GIRVAN M. Finding and evaluating community structure in networks[J]. Phys Rev E, 2004, 69 (2): 026113.
BLONDEL V D, GUILLAUME J-L, LAMBIOTTE R, LEFEBVRE E. Fast unfolding of communities in large networks[J]. Journal of Statistical Mechanics, 2008 (10): 155-168.
-
期刊类型引用(1)
1. 张雪雁. 基于大数据时代背景下的中职计算机专业社团化教学模式. 教育现代化. 2020(08): 52-54 . 百度学术
其他类型引用(2)