在线产品类型的调节效应研究:评论主题分散度视角

方佳明, 殷娜嘉

方佳明, 殷娜嘉. 在线产品类型的调节效应研究:评论主题分散度视角[J]. 电子科技大学学报社科版, 2021, 23(1): 46-54. DOI: 10.14071/j.1008-8105(2020)-6021
引用本文: 方佳明, 殷娜嘉. 在线产品类型的调节效应研究:评论主题分散度视角[J]. 电子科技大学学报社科版, 2021, 23(1): 46-54. DOI: 10.14071/j.1008-8105(2020)-6021
FANG Jia-ming, YIN Na-jia. Research on the Moderation Effect of Online Product Type: From the Perspective of Review Dimension[J]. Journal of University of Electronic Science and Technology of China(SOCIAL SCIENCES EDITION), 2021, 23(1): 46-54. DOI: 10.14071/j.1008-8105(2020)-6021
Citation: FANG Jia-ming, YIN Na-jia. Research on the Moderation Effect of Online Product Type: From the Perspective of Review Dimension[J]. Journal of University of Electronic Science and Technology of China(SOCIAL SCIENCES EDITION), 2021, 23(1): 46-54. DOI: 10.14071/j.1008-8105(2020)-6021

在线产品类型的调节效应研究:评论主题分散度视角

基金项目: 

国家自然科学基金面上项目(71571029)

详细信息
    作者简介:

    方佳明(1982– )男,博士,电子科技大学经济与管理学院教授、博士生导师

    殷娜嘉(2000– )女,电子科技大学经济与管理学院本科生

Research on the Moderation Effect of Online Product Type: From the Perspective of Review Dimension

  • 摘要:
    目的/意义评论主题分散度指一条评论中涉及的产品属性维度的数量。评论主题分散度越大,该评论更全面。在线产品的评论主题传递了该产品多维度的特征信息,可以显著影响消费者的购买决策,但目前尚无有关评论主题分散度成因的研究。
    设计/方法通过获取了天猫平台商品评论数据共248 881条,分析了两个评论文本特征——评论长度、评论情感强度对评论主题分散度的影响,并阐释了不同产品类型对评论主题分散度的调节效应。
    结论/发现通过建立回归模型,发现相较于购买搜索型产品的消费者,购买体验型产品的消费者能够提供更为全面的评论信息。同时,回归结果表明,产品类型分别调节了评论长度、评论情感强度与评论主题分散度之间的关系。使用了六种不同的稳健性方法进一步确保了上述结论的可靠性。该研究结果丰富并拓展了评论主题分散度的相关理论研究,并对电商平台管理者和线上零售商优化在线评论管理策略具有指导价值。
    Abstract: [Purpose/Significance] Review dimension refers to the number of product attribute dimensions involved in an online review. The more the review dimension is, the more comprehensive the review is. Review dimension conveys the multi-dimensional information of a product, which saliently affects consumers' purchase decisions. But there is little study on the causes of review dimension. [Design/Methodology] In this paper, 248,881 pieces of review data on Tmall platform were analyzed, and the influence of two review content characteristics, review length and sentimental strength, and product type on review dimension was demonstrated. A regression model was conducted. [Findings/Conclusions] The results indicate that consumers of experience products tend to deliver more information than consumers of search products. The results also reveal that review length and sentimental strength have positive impacts on the review dimension, and product type has a significant moderation effect upon the relationships. Six methods were used to confirm the reliability of the above conclusions. The findings not only enrich the researches on review dimension, but offer suggestions for e-commerce platforms and online retailers to effectively manage online reviews.
  • 不同于传统购物,在线购物的消费者难以接触感受产品,因此,消费者的决策更加依赖平台提供的产品信息[1]。为克服该局限,电商平台为消费者构建了一个富含在线评论的虚拟社区,已有消费经历的消费者在该社区中发表在线评论,分享自己的购物体验,推荐或抱怨所购买的产品。此类线上交流提供了丰富的产品信息[2]。受益于这些有价值的信息,消费者购买决策效率明显提高[3],产品销量也得到了提高[4]。在线评论对消费者决策的重要性日益凸显[5]。现有研究表明,查阅在线评论已成为消费者制定购买决策的关键步骤[6]。因此,高效管理在线评论、帮助消费者寻找有价值的评论,对电商平台极具意义。

    学者们引用了评论有用性这一概念以评估在线评论对消费者的帮助,即“消费者认为评论对他们的价值如何”。评论有用性反映了在线评论对于消费者购买决策的劝说效果与潜在价值[7],有鉴于此,国内外学者聚焦于评论有用性的成因,开展了一系列研究。已有研究发现,评论内容质量[8~9]、评论情感[10~11]、写作风格[12]、评论者[13]等对评论有用性产生影响。其中,针对评论文本特征的研究表明,评论主题分散度是决定在线评论有用性和产品销量的重要因素[3,14~15]。但是,目前尚无研究探讨哪些因素会促进消费者撰写更多主题的评论。因此,本文的第一个目标是从产品特征和评论内容特征的视角,提出一个概念框架,以部分阐述在线评论主题分散度的成因。评论主题分散度指一条评论中涉及的产品属性维度的数量[3]。评论内容信息所传达的属性维度数量越多,该评论更全面。

    进一步,以往的电商研究将产品划分为搜索型产品和体验型产品两类[16],已有研究表明产品类型对消费者搜集信息行为、降低不确定度、情感不一致的评论效应和评论有用性都存在调节作用[17]。有鉴于此,产品类型也可能是评论主题分散度的影响因素,因此,本文将聚焦于分析产品类型对评论主题分散度的影响。结合已有的对评论文本特征的研究,并考虑产品类型的影响效应,我们建立了评论主题分散度的研究模型,如图1。具体地,我们基于从天猫平台获取的248 881条产品评论信息,借助PTW-LDA模型[3]和信息熵[18],对产品类型关于评论主题分散度的调节效应进行实证分析。结果表明,相比于搜索型产品的购买者,购买体验型产品的消费者将撰写包含更多主题数量的评论信息。

    图  1  研究模型及关系假设

    本研究的主要贡献在于,它提供了对促使消费者进行多主题评论的因素的理解。这些发现可以帮助在线零售商和平台在线评论管理者根据自身不同情况,采取有效措施以提供更好的产品和服务。

    鉴于挖掘在线评论主题对企业和消费者决策具有重要意义,国内外学者对在线评论主题开展了系列研究。崔永生指出评论主题分析有助于企业了解消费者真正的购物需求,以更好地进行产品定价、产品升级、质量改进[19]。张振华等认为在线评论主题挖掘有利于企业改进产品和服务质量[20]。金吉琼等通过对电子烟市场的评论主题分析,为相关企业的产品设计提供实证支持[21]。同时,研究发现,多主题的在线评论是评论可信度的决定性因素[22],为消费者购买决策提供了有价值的参考[23]。另一方面,由于在线评论主题研究具有丰富的实践价值,学者已在电商[3]、医疗[24]、新闻媒体[25]等多个领域提出了多种有效的评论主题提取方法,以更好地适应各领域评论的特点。

    现有文献表明在线评论主题对企业和消费者具有双重重要性。评论主题分散度越大,其包含的信息更全面,将更有利于企业和消费者的后续决策。但是,由于评论主题分散度是对在线评论信息量化后的潜在特征,电商平台的管理者和线上零售商在实践中难以直接改变这一潜在特征。因此,本文希望通过理解评论主题分散度的影响因素来改善评论主题分散度,使评论主题的价值得以在实践中充分显示。本文为相关的影响因素研究开拓了新的思路,在具有实践意义的同时,又富含理论意义。

    线上消费者需要完成信息搜集、产品评估等步骤来制定购买决策[26~27]。由于网络购物的虚拟性,出于降低购买风险的动机,消费者可通过阅读已有评论等信息搜集方法来降低产品不确定度[28]。基于以往经验和搜寻信息,消费者对该产品的各属性做出预期并做出购买决策。根据期望确认理论,可将购买过程分为使用前和使用后两个阶段,在购买产品前,消费者会对产品属性的效果形成预期,在使用产品后,消费者对产品的使用绩效进行评估,并将其与购前预期进行比较,由此产生正面不确认(产品绩效高于期望)、确认(产品绩效等于期望)和负面不确认(产品绩效低于期望)[29]。其中,期望不确认带来的情感是消费者评论行为的重要驱动因素。根据平衡效用,消费者对购物体验的非常满意或不满意将导致消费者的感知不平衡,需要消费者通过评论行为来分享愉悦或发泄不满以寻求感知平衡[30]。简而言之,消费者的购前预期和实际产品绩效的差异将影响消费者评论行为,从而影响评论内容[31]

    根据消费者能否在购买前确定产品质量,学者将产品划分为可事先知道质量的搜索型产品和不可知质量的体验型产品[18]。搜索型产品的消费者可以在使用产品前初步估计产品绩效,而体验型产品消费者只能在使用产品后进行绩效评估[32]。源于此特性,产品类型是学者解释消费者行为的重要因素之一[33]。在购买意愿方面,研究发现产品类型在消费者心理意象与购买意愿间起到调节作用[34]。评论有用性的相关研究表明,产品类型对信息质量与评论有用性[35]、评论不一致与评论有用性[36]、评论者个体特征与评论有用性[37]都具有调节作用。因此,我们认为在研究评论主题分散度的影响因素时,将产品类型纳入考量范围是有必要的。

    评论长度即评论的字数,是评论主题分散度的影响因素。通常而言,评论长度越长,其包含的内容越多,该评论更可能涉及产品在具体情况下的使用细节[30,38]。李恒在研究中指出评论长度与评论信息量呈正向关系,长度越长,评论提供的参考更全面[39]。Qazi等指出简短的评论更可能缺乏对产品特性的全面评估[40]。可见评论长度对评论主题分散度存在正向影响力。同时,评论长度对评论主题分散度的影响受产品类型的调节。Mudambi等认为由于搜索型产品的评论通常基于客观事实,也有统一的表达形式,因此搜索型产品的属性特征描述所需的文字更少[41]。相反,体验型产品没有统一的术语去概括其特性,消费者倾向用更多的文字来描述产品的某一特征。可见,对于相似长度的评论,搜索型产品的评论内容会比体验型产品的评论涉及更多的主题。由此提出假设:

    H1a. 评论长度越长,评论主题分散度越大。

    H1b. 其他情况相同时,对于搜索型产品,评论长度对评论主题分散度的影响更加显著。

    鉴于消费者评论行为存在时间或机会成本等评论成本[42],消费者发布的评论内容具有选择性,并不涉及事先做出的全部预期[43]。当消费者期望与实际绩效相差较大时,即正向或负向确认不明显时,消费者将产生较强烈的正向或负向情感,造成感知不平衡。换而言之,期望与实际绩效差异越大,消费者的情感强度越大。由平衡效用,为寻求情感平衡带来的效益,这类消费者更可能不计评论成本,撰写包含更多的购前预期内容的评论。即消费者情感强度越强,发表的评论越全面,评论主题分散度越大。情感强度和评论主题分散度的关系同样受产品类型的调节。搜索型产品的客观性使得消费者可以根据搜寻的信息对产品进行较为精确的评估[44]。而体验型产品的主观性增加了消费者期望确认的难度[45],从而导致体验型产品的消费者购后的情感强度更加强烈,发表评论分散度更大的评论。于是提出以下假设:

    H2a. 评论情感强度越大,评论主题分散度越大。

    H2b. 其他条件相同时,对于体验型产品,情感强度对评论主题分散度的影响更显著。

    搜索型产品的消费者强调产品所提供的功能价值,体验型产品的消费者强调产品带来的体验价值[41],并在评论中有所体现。搜索型产品的消费者出于具体的产品功能需要购买产品,相应地,其评论建立在产品的功能性属性之上,体现出功能导向[46],集中且客观[41]。而体验型产品的消费者出于满足审美和愉悦购买产品,其评论体现出个体的产品体验,主观性强[47]。因此,体验型产品评论所含信息主题更依赖于评论者的偏好,不局限于产品的功能性属性。因此,相较而言,体验型产品的消费者会提供更全面的评论[17]。于是提出假设:

    H3. 相比于搜索型产品,体验型产品的评论主题分散度越大。

    在提取每条评论的维度特征时,我们借鉴Li等提出的PTW-Guided LDA模型,以更好地适应在线评论简短、语句不全、可能无法涉及所有主题的特性[3]。参考之前的研究[37],我们将评论主题分散度归为以下四个主题。基于这四个主题,我们在随机的评论样本中分别筛选出37、19、8和20个特征词作为搜索主题的关键词。

    商品信息:商品客观信息的真实性。

    服务态度:商家在消费者整个购买过程中的服务质量。

    物流配送:物流公司配送产品时的可靠性和响应性。

    产品价值:消费者在使用产品后对产品价值相对于实际价格进行的评估。

    信息熵是衡量分散度的常用度量[3,48],本文将采用信息熵来量化不同产品类型下的评论主题分散度。评论主题分散度的计算按下述方法得出。首先,假定上述四个主题相互独立。对于每条评论中的每个句子,如果该句子中出现上述任一主题对应的关键词,则视为相关的主题xi出现。如果一句中出现两个及以上主题对应的关键词,则将其分为相应数量的主题句。将包含主题xi的句数与总句数的比值视为该主题在此评论中出现的概率。每条评论的总信息熵等于四个主题信息熵之和,即联合熵,详细可见公式(1)(2)。对于每条评论,信息熵越大,说明该评论涉及的内容越广泛,评论主题分散度越强[43]。如果评论内容不涉及任一主题,则该评论信息熵为0。

    对于每一个主题,有信息熵:

    $$H({x_i}) = - {\rm{P}}({x_i}) * {\log _2}{\rm{P}}({x_i})$$ (1)

    对于每一条评论,其信息熵为该评论所含主题的信息熵的加和:

    $$H(x) = \sum\limits_{i = 1}^4 {H({x_i})} $$ (2)

    随着NLP的发展,学界通过对在线评论进行文本分析,获取用户情感[49~51]。为了更好地适应与上述评论主题的提取方法,本文将对一条评论的每一句分别进行情感分析。首先建立情感词典。由于中文词汇的情感语义易随语境的变化而变化,我们只选用在任何情况都绝对表征积极或消极情感的词语。最后选出积极情感词24个,消极情感词23个。参照已有文献[49,52],我们同时考虑了情感词语和情感程度词语的作用,词语具体的得分如表1。对于评论j中的句子i,其出现的每个正向情感词数值为+1,负向情感词的数值为–1,再乘以出现的情感程度词语的对应分值,加和得到句子i的评论情感。加和评论j每一句话的情感强度,作为该条评论的总情感强度。由于用户情感强度可能是正向期望不确认或负向期望不确认导致的,因此取绝对值。显然,情感强度越大,消费者的情感越强烈。详见公式(3)(4)。

    表  1  情感词表得分对照表(部分)
    情感程度词语分值积极情感词语分值消极情感词语分值
    极其4满意+1不满意–1
    3喜欢+1生气–1
    2+1–1
    下载: 导出CSV 
    | 显示表格
    $$ {\text{句子}}i{\text{情感强度}}={\sum }_{m=1}^{n}{\text{情感程度得分}}*{\text{情感极性得分}}$$ (3)
    $$ {\text{评论}}j{\text{的情感强度}}=\left|{\sum }_{i=1}^{n}{\text{该评论中句子}}i{\text{的情感强度}}\right| $$ (4)

    为了控制消费者本身偏好的差异,本文只关注电子类产品及与之配套的装饰类产品的消费者。本文基于Python随机爬取了天猫平台相关产品的在线评论,并剔除无效评价(如“未填写评价”显示、“好评模板”),最终共获得248 881条评论,其中搜索型产品122 897条,体验型产品125 984条。其概括性描述可见表2

    表  2  概括性描述
    变量
    搜索型产品122 897
    手机113 031
    电脑8 109
    平板1 757
    体验型产品125 984
    手机保护壳110 494
    电脑包13 319
    平板保护壳2 171
    下载: 导出CSV 
    | 显示表格

    表3阐明了本文实证分析的主要变量。为减少数据偏差,我们对评论主题分散度、评论长度进行对数化。由于产品类型没有专门的数学表达,引入虚拟变量(0~1变量),令搜索型产品的值为0,体验型产品的值为1。最后,我们从已有文献中收集到了现有数据集可用的控制变量。具体地,我们将考虑产品价格和商家提供的图片及视频数量作为控制变量。产品价格会影响消费者对产品的感知质量[53],因此,价格可以通过影响消费者对产品的购前期望,影响消费者评论主题分散度。同样,产品信息的传递形式会对消费者感知产生显著影响[54]。已有研究表明,相较于文本形式而言,图片和视频等视觉形式可承载更多的产品信息,将更有利于消费者评估产品[55]。即图片和视频也会通过影响消费者对产品的购前期望,影响评论主题离散度。

    表  3  变量说明
    变量名变量含义
    Entropyi评论i的评论主题分散度,原数值+1,再取对数LN()
    Lengthi评论i的评论长度,取对数LN()
    Strengthi评论i的总情感强度
    Typei评论i的产品类型,搜索型产品为0,体验性产品为1
    Pricei评论i对应商品的价格,取对数LN()
    Picturei评论i对应商品的图片和视频数
    下载: 导出CSV 
    | 显示表格

    对总体样本和按产品类型划分的子样本做描述性统计分析(见表4表5)。在248 881条评论中,评论主题分散度、评论长度、情感强度的平均值分别为0.234、3.897和2.720。单从产品类型来看,体验型产品的评论主题分散度显著高于搜索型产品,与假设H3相符。表6列出了变量的相关矩阵。由于产品类型与产品价格的相关系数为–0.884,这可能与样本选取的两类产品的价格差异相关,后续步骤需要进行共线性检验。

    表  4  样本的描述性统计
    变量平均值标准差最小值最大值样本数
    Entropyi0.2340.26840.0001.136248 881
    Lengthi3.8970.5252.6396.723248 881
    Strengthi2.7204.4440.00021.000248 881
    Typei0.5100.5000.0001.000248 881
    Pricei5.5931.8552.0799.680248 881
    Picturei5.8100.3965.0006.000248 881
    下载: 导出CSV 
    | 显示表格
    表  5  子样本的描述性统计
    变量搜索型产品均值(标准差)体验型产品均值(标准差)p
    Entropyi0.195(0.262)0.271(0.268)0.000
    Lengthi4.028(0.478)3.769(0.538)0.000
    Strengthi2.510(4.456)2.930(4.422)0.000
    Pricei7.253(0.944)3.973(0.782)0.000
    Picturei5.750(0.433)5.860(0.384)0.000
    N122,897125,984
    下载: 导出CSV 
    | 显示表格
    表  6  主要变量的协相关矩阵
    变量123456
    Entropyi1.000
    Typei0.1421.000
    Lengthi0.293–0.2461.000
    Strengthi0.1680.0470.3301.000
    Pricei–0.124–0.8840.195–0.0471.000
    Picturei0.0640.1370.005–0.002–0.1251.000
    下载: 导出CSV 
    | 显示表格

    在不考虑产品类型的调节作用的情况下,根据假设H1a、H2a、H3,以评论主题分散度为因变量,以评论长度、情感强度和产品类型为自变量,我们可以得到相应的主效应回归模型1:

    $$ \begin{split} {\rm{Entrop{y}}}_{i}=&{\beta }_{1}*{\rm{Lengt{h}}}_{i}+{\beta }_{2}*{\rm{Strengt{h}}}_{i}+{\beta }_{3}*{\rm{Typ{e}}}_{i}+\\ &{\beta }_{4}*{{\rm{Price}}}_{i}{+\beta }_{5}*{{\rm{Picture}}}_{i}+\varepsilon \end{split} $$

    考虑产品类型的调节作用,根据假设H1b、H2b,引入相应的交互项,可得到回归模型2:

    $$ \begin{split} {\rm{Entrop{y}}}_{i}=&{\beta }_{1}*{\rm{Lengt{h}}}_{i}+{\beta }_{2}*{\rm{Strengt{h}}}_{i}+{\beta }_{3}*{\rm{Typ{e}}}_{i}+\\ &{\beta }_{4}*{\rm{Typ{e}}}_{i}*{\rm{Lengt{h}}}_{i}\text{+}{\mathrm{\beta }}_{5}*{\rm{Typ{e}}}_{i}*{\rm{Strengt{h}}}_{i}+\\ &{\beta }_{6}*{{\rm{Price}}}_{i}{+\beta }_{7}*{{\rm{Picture}}}_{i}+\varepsilon \end{split} $$

    将数据分别带入模型1和模型2,回归结果如表7的M1和M2列所示。回归结果表明,产品类型的调节作用改善了回归的效果。同时,为了证实结果的可靠性,进行稳健性分析。为防止模型的显著性是过大的样本导致,我们分别对回归模型2进行了50%和10%的随机抽样,回归结果分别如表7的M3、M4列所示。统计性显著的结果表明,样本规模没有误导显著性检验。进一步,由于评论主题分散度不存在小于0的情况,属于受限因变量,用Tobit模型进行验证。表7的M6列显示了剔除2个标准差之外的离群点后的回归结果。表7中M7列为对样本自主抽样1000次后的结果。为了验证本文所采用的分析在线评论情感强度的方法的准确性和可靠性,我们利用Python的snownlp模块对情感强度重新进行计算,并对新数据集进行回归分析,如表7中M8列所示。结果表明,本文提出的情感强度分析方法比较合理。

    我们对模型进行了共线性检验,数据显示,最大的方差膨胀系数为4.755且条件系数为不超过50,说明模型的共线性问题不显著。由表7,比较M1和M2,加入交互项后(Typei *Lengthi, Typei*Strengthi),各变量显著且可决系数增大,说明模型2的解释力更强。进一步,各稳健性检验的结果表明,模型2的回归结果可信。然而,尽管上述的回归结果验证了评论长度、情感强度和产品类型对评论主题分散度的影响,但该计量模型可能存在内生性问题,需要进一步检验。具体地,评论长度与评论主题分散度的正相关关系,既可能是评论长度影响了评论主题分散度导致的,也可能是评论主题分散度影响评论长度所造成的结果。为排除评论主题分散度与评论长度两者互为因果而产生的内生性对回归结果造成的影响,我们将对模型2进行使用工具变量的2SLS回归分析。首先,对内生变量的内生性进行可靠性检测,结果表明内生变量对估计的影响是存在的(χ2(1)=10.129,p<0.01)。接着,我们选定每件商品的平均评论长度作为工具变量。显然,评论平均长度与每条评论的长度有关,但对某一条评论的全面性并没有做出贡献。进一步,第一阶段弱工具变量检验超过临界值10(F=21950.4,p<0.01),说明该工具变量与内生变量高度相关[56]。该标准化的回归结果见表7,M9列。我们将M9列的数据作为最终的回归结果来验证所提假设。

    表  7  全部的回归结果
    变量M1M2M3M4M5M6M7M8M9
    Lengthi 0.169***
    (0.001)
    0.229***
    (0.002)
    0.227***
    (0.002)
    0.233***
    (0.005)
    0.528***
    (0.003)
    0.229***
    (0.002)
    0.229***
    (0.002)
    0.232***
    (0.001)
    0.214***
    (0.005)
    Strengthi 0.003***
    (0.000)
    0.001***
    (0.000)
    0.001***
    (0.000)
    0.003***
    (0.001)
    0.001*
    (0.000)
    0.001***
    (0.000)
    0.001***
    (0.000)
    0.004***
    (0.007)
    0.002***
    (0.000)
    Typei 0.136***
    (0.002)
    0.549***
    (0.008)
    0.546***
    (0.012)
    0.576**
    (0.026)
    1.541***
    (0.017)
    0.549***
    (0.008)
    0.549**
    (0.008)
    0.498**
    (0.010)
    0.491***
    (0.005)
    Typei*Lengthi –0.110***
    (0.002)
    –0.110***
    (0.003)
    –0.117***
    (0.007)
    –0.320***
    (0.004)
    –0.110***
    (0.002)
    –0.110***
    (0.002)
    –0.095***
    (0.002)
    –0.095***
    (0.006)
    Typei*Strengthi 0.004***
    (0.000)
    0.005***
    (0.000)
    0.002**
    (0.001)
    0.008***
    (0.000)
    0.004***
    (0.000)
    0.004***
    (0.000)
    0.021**
    (0.010)
    0.004***
    (0.000)
    Pricei 0.006***
    (0.001)
    0.004***
    (0.001)
    0.004***
    (0.001)
    0.004***
    (0.002)
    0.010***
    (0.001)
    0.004***
    (0.001)
    0.004***
    (0.001)
    0.005***
    (0.001)
    0.004***
    (0.001)
    Picturei 0.022***
    (0.001)
    0.016***
    (0.001)
    0.015***
    (0.002)
    0.016***
    (0.004)
    0.041***
    (0.003)
    0.016***
    (0.001)
    0.016***
    (0.001)
    0.016***
    (0.001)
    0.017***
    (0.001)
    常量 –0.664*** –0.855*** –0.835*** –0.867*** –2.505*** –0.855*** –0.855*** –0.869*** –0.803***
    (0.009) (0.010) (0.014) (0.032) (0.022) (0.010) (0.010) (0.011) (0.021)
    N 248881 248881 124025 24935 248881 248881 248881 248881 248881
    R-squared 0.138 0.148 0.146 0.150 0.148 0.148 0.144 0.147
    注:因变量为Entropyi。括号内为系数的标准误。***p<0.01, **p<0.05, *p<0.1。M1为回归模型1;M2为回归模型2;M3和M4为回归模型2的50%和10%的样本随机抽样;M5为模型2的Tobit回归;M6为剔除2个标准差以外的离群点后的模型2回归分析;M7为模型2的自主抽样1000次下的回归;M8是利用Python的snownlp模块计算求得的情感强度下的模型2回归分析;M9是模型2使用工具变量下的2SLS回归。
    下载: 导出CSV 
    | 显示表格

    M9列的数据显示评论长度(β=0.214,p<0.01)、情感强度(β=0.002,p<0.01)和产品类型(β=0.491,p<0.01)的系数正向显著,说明产品类型、评论长度和情感强度分别对评论主题分散度产生积极影响,假设H1a、H2a和H3成立。产品类型对评论长度与评论主题分散度的调节作用呈负向显著(β=–0.095,p<0.01),说明搜索型产品的评论长度对评论主题分散度的促进效果更明显,假设H1b成立。而产品类型对情感强度与评论主题分散度的调节作用为正向显著(β=0.004,p<0.01),表明搜索型产品的评论情感对评论主题分散度的促进效果更弱,假设H2b成立。进一步检验产品类型分别对评论长度与评论主题分散度、情感强度与评论主题分散度的调节作用,结果如图2图3图2表明,相比于体验型产品,搜索型产品的评论长度对评论主题分散度的正向影响更显著。图3表明,相比于搜索型产品,体验型产品的评论情感强度对评论主题分散度的正向影响更显著。假设H1b、H2b再次被验证。

    图  2  产品类型对评论长度与评论主题分散度之间的调节作用
    图  3  产品类型对情感强度与评论主题分散度之间的调节作用

    虽然现有研究对评论主题分散度对评论有用性和产品销量的作用颇有关注,但少有研究关注哪些因素会影响评论主题分散度。本研究旨在通过建立和验证模型来增进我们对评论主题分散度成因的理解。从产品类型和评论内容维度特征的角度,我们有效识别了三个相关变量——评论长度、情感强度和产品类型,并通过天猫平台的评论数据验证了相应模型。

    回归结果表明,评论长度、情感强度和产品类型都与评论主题分散度相联系。在评论长度方面,评论长度对评论主题分散度具有积极作用。这表明消费者倾向用更多的文字来描述尽可能多的产品属性,而非专注于深入描述产品的某个属性。这可能是消费者注意力缺乏导致的,使得他们不易集中精力于关注某一维度的信息。这项研究还表明,评论情感强度对评论主题分散度的积极影响。评论情感强度反映了消费者对产品或购物过程的期望确认程度。正向期望不确认和负向期望不确认更可能激发消费者撰写评论的使命感,他们将尽可能多地推荐或抱怨产品,从而发表了主题分散度更大的评论。最后,在产品类型方面,研究结果表明,体验型产品较于搜索型产品更能激发消费者撰写多维度的评论。这表明体验型产品较大的确认难度导致的消费者对产品主观性预期与实际产品绩效的差异可以促使消费者评论更多。

    本文回归结果也表明了产品类型分别对评论长度和评论主题分散度,情感强度和评论主题分散度之间存在调节作用。对于搜索型产品,评论长度对评论主题分散度的正向影响更显著。说明统一的表达减少了消费者评论描述搜索型产品的属性特性所需要的文字。对于相同长度的在线评论,体验型产品评论描述的产品属性更少。相反,在情感强度方面,对于搜索型产品,情感强度对评论主题分散度的正向影响更弱。表明搜索型产品的客观性导致消费者购前预期与实际产品绩效的差异较小,减少了他们撰写全面的评论的动力。

    本文对现有评论主题分散度的研究做出了重要的理论贡献。首先,通过实证分析评论长度、情感强度和产品类型如何影响评论主题分散度,本文为初步理解消费者多主题评论行为提供了理论支持。尽管本文识别的变量可能不够详尽,但本文的研究仍有助于加深我们对在线评论文本特征的理解。通过深化对多主题评论行为的理解,本文的研究将有助于在线零售商和平台管理者制定有效降低消费者信息搜索成本的策略。

    其次,本文是应用信息熵来量化评论主题分散度的文章。在线评论数据集的使用可以让我们从量化的角度,更好地理解促使消费者撰写多维度评论的因素。同时,大量计量经济学的分析细致化了产品类型、评论内容特征和多维度评论行为之间的关系。

    我们的研究可以帮助线上零售商认识什么因素会导致多主题的评论,并采取行之有效的运营策略。同时,该研究也可以使在线评论管理者有效帮助消费者降低商品不确定度。我们的实证研究表明,评论长度是促使消费者撰写多维度评论的重要因素。因此,各零售商对发表长篇评论的评论者进行适当奖励是有必要的。同时,在线零售商应该重视完善消费者购物体验以增强其正向期望不确认来促使他们对自己关注的多个产品属性进行评论。进一步,以往研究表明,对产品了解较少的新顾客,提供产品全面属性维度的多主题评论比低主题评论更有用;而对产品有一定了解的消费者,专注于某一主题的在线评论更有益处[2]。对于平台在线评论管理者,由于多主题评论可以极大程度降低新顾客的不确定度,将优质的多主题评论放在评论前排,可以帮助新顾客建立对有关产品的基本认识。同时,将低主题的评论紧随其后,或者另设有关评论浏览渠道,从而帮助特定消费者加深对自己在意的产品属性的了解。通过对不同主题数量的评论进行分类,可以极大提高消费者搜索产品信息、降低不确定度的效率。

    该研究也强调了产品类型对评论主题分散度的重要影响。这使得线上零售商可以采取更加细致有效的管理策略。对于体验型产品的消费者,商家应该更加注重增强他们的购物体验和鼓励他们发表新内容。而对于搜索型产品的消费者,商家应该将重点放在激励消费者写长评上。

    本文研究也存在一些局限需要考虑。首先,该研究提取的评论主题分散度的关键词样本较小,可能导致评论主题分散度的概括词汇不够全面。之后的研究可以扩大随机评论样本,并选取更多评论主题及相关词汇。其次,本文只从产品和消费者行为的角度考虑评论主题分散度,忽略了由于消费者自身差异而可能导致的评论行为和内容差异。未来的研究可以聚焦于消费者本身,并通过问卷或者实验,探究其与评论主题分散度的联系。同时,鉴于产品类型对评论主题分散度的影响,后续研究可以关注不同产品类型的评论主题分散度对评论有用性和产品销量的影响,以更细致地指导在线零售商和在线评论管理者优化决策。

  • 图  1   研究模型及关系假设

    图  2   产品类型对评论长度与评论主题分散度之间的调节作用

    图  3   产品类型对情感强度与评论主题分散度之间的调节作用

    表  1   情感词表得分对照表(部分)

    情感程度词语分值积极情感词语分值消极情感词语分值
    极其4满意+1不满意–1
    3喜欢+1生气–1
    2+1–1
    下载: 导出CSV

    表  2   概括性描述

    变量
    搜索型产品122 897
    手机113 031
    电脑8 109
    平板1 757
    体验型产品125 984
    手机保护壳110 494
    电脑包13 319
    平板保护壳2 171
    下载: 导出CSV

    表  3   变量说明

    变量名变量含义
    Entropyi评论i的评论主题分散度,原数值+1,再取对数LN()
    Lengthi评论i的评论长度,取对数LN()
    Strengthi评论i的总情感强度
    Typei评论i的产品类型,搜索型产品为0,体验性产品为1
    Pricei评论i对应商品的价格,取对数LN()
    Picturei评论i对应商品的图片和视频数
    下载: 导出CSV

    表  4   样本的描述性统计

    变量平均值标准差最小值最大值样本数
    Entropyi0.2340.26840.0001.136248 881
    Lengthi3.8970.5252.6396.723248 881
    Strengthi2.7204.4440.00021.000248 881
    Typei0.5100.5000.0001.000248 881
    Pricei5.5931.8552.0799.680248 881
    Picturei5.8100.3965.0006.000248 881
    下载: 导出CSV

    表  5   子样本的描述性统计

    变量搜索型产品均值(标准差)体验型产品均值(标准差)p
    Entropyi0.195(0.262)0.271(0.268)0.000
    Lengthi4.028(0.478)3.769(0.538)0.000
    Strengthi2.510(4.456)2.930(4.422)0.000
    Pricei7.253(0.944)3.973(0.782)0.000
    Picturei5.750(0.433)5.860(0.384)0.000
    N122,897125,984
    下载: 导出CSV

    表  6   主要变量的协相关矩阵

    变量123456
    Entropyi1.000
    Typei0.1421.000
    Lengthi0.293–0.2461.000
    Strengthi0.1680.0470.3301.000
    Pricei–0.124–0.8840.195–0.0471.000
    Picturei0.0640.1370.005–0.002–0.1251.000
    下载: 导出CSV

    表  7   全部的回归结果

    变量M1M2M3M4M5M6M7M8M9
    Lengthi 0.169***
    (0.001)
    0.229***
    (0.002)
    0.227***
    (0.002)
    0.233***
    (0.005)
    0.528***
    (0.003)
    0.229***
    (0.002)
    0.229***
    (0.002)
    0.232***
    (0.001)
    0.214***
    (0.005)
    Strengthi 0.003***
    (0.000)
    0.001***
    (0.000)
    0.001***
    (0.000)
    0.003***
    (0.001)
    0.001*
    (0.000)
    0.001***
    (0.000)
    0.001***
    (0.000)
    0.004***
    (0.007)
    0.002***
    (0.000)
    Typei 0.136***
    (0.002)
    0.549***
    (0.008)
    0.546***
    (0.012)
    0.576**
    (0.026)
    1.541***
    (0.017)
    0.549***
    (0.008)
    0.549**
    (0.008)
    0.498**
    (0.010)
    0.491***
    (0.005)
    Typei*Lengthi –0.110***
    (0.002)
    –0.110***
    (0.003)
    –0.117***
    (0.007)
    –0.320***
    (0.004)
    –0.110***
    (0.002)
    –0.110***
    (0.002)
    –0.095***
    (0.002)
    –0.095***
    (0.006)
    Typei*Strengthi 0.004***
    (0.000)
    0.005***
    (0.000)
    0.002**
    (0.001)
    0.008***
    (0.000)
    0.004***
    (0.000)
    0.004***
    (0.000)
    0.021**
    (0.010)
    0.004***
    (0.000)
    Pricei 0.006***
    (0.001)
    0.004***
    (0.001)
    0.004***
    (0.001)
    0.004***
    (0.002)
    0.010***
    (0.001)
    0.004***
    (0.001)
    0.004***
    (0.001)
    0.005***
    (0.001)
    0.004***
    (0.001)
    Picturei 0.022***
    (0.001)
    0.016***
    (0.001)
    0.015***
    (0.002)
    0.016***
    (0.004)
    0.041***
    (0.003)
    0.016***
    (0.001)
    0.016***
    (0.001)
    0.016***
    (0.001)
    0.017***
    (0.001)
    常量 –0.664*** –0.855*** –0.835*** –0.867*** –2.505*** –0.855*** –0.855*** –0.869*** –0.803***
    (0.009) (0.010) (0.014) (0.032) (0.022) (0.010) (0.010) (0.011) (0.021)
    N 248881 248881 124025 24935 248881 248881 248881 248881 248881
    R-squared 0.138 0.148 0.146 0.150 0.148 0.148 0.144 0.147
    注:因变量为Entropyi。括号内为系数的标准误。***p<0.01, **p<0.05, *p<0.1。M1为回归模型1;M2为回归模型2;M3和M4为回归模型2的50%和10%的样本随机抽样;M5为模型2的Tobit回归;M6为剔除2个标准差以外的离群点后的模型2回归分析;M7为模型2的自主抽样1000次下的回归;M8是利用Python的snownlp模块计算求得的情感强度下的模型2回归分析;M9是模型2使用工具变量下的2SLS回归。
    下载: 导出CSV
  • PARK D H, LEE J, HAN I. The effect of on-line consumer reviews on consumer purchasing intention: The moderating role of involvement[J]. International Journal of Electronic Commerce, 2007, 11(4): 125-148.

    GHOSE A, IPEIROTIS P G. Designing novel review ranking systems: predicting usefulness and impact of reviews[C]. Minneapolis: Proceedings of the Ninth International Conference on Electronic Commerce, 2007.

    LI J, GE Y, HONG Y, et al. Textual review dimensionality and helpfulness: a multi-method study[J/OL]. (2017-03-13). https//ssrn.com/abstract=2931934.

    YE Q, LAW R, GU B. The impact of online user reviews on hotel room sales[J]. International Journal of Hospitality Management, 2009, 28(1): 180-182.

    CHINTAGUNTA P K, GOPINATH S, VENKATARAMAN S. The effects of online user reviews on movie box office performance: accounting for sequential rollout and aggregation across local markets[J]. Marketing Science, 2010, 29(5): 944-957. doi: 10.1287/mksc.1100.0572

    WANG H, GUO X H, ZHANG M Y, et al. Predicting the incremental benefits of online information search for heterogeneous consumers[J]. Decision Sciences, 2016, 47(5): 957-988.

    殷国鹏. 消费者认为怎样的在线评论更有用?—社会性因素的影响效应[J]. 管理世界, 2012(12): 115-124.

    KORFIATIS N, GARCÍABARRIOCANAL E, S SÁNCHEZALONSO. Evaluating content quality and helpfulness of online product reviews: the interplay of review helpfulness vs review content[J]. Electronic Commerce Research and Applications, 2012, 11(3): 205-2017. doi: 10.1016/j.elerap.2011.10.003

    LIN H. Measuring online learning systems success: applying the updated DeLone and McLean model[J]. Cyberpsychology & Behavior, 2008, 10(6): 817-820.

    CAO Q, DUAN W, GAN Q. Exploring determinants of voting for the “helpfulness” of online user reviews: a text mining approach[J]. Decision Support Systems, 2011, 50(2): 511-521.

    MALIK M, HUSSAIN A. Helpfulness of product reviews as a function of discrete positive and negative emotions[J]. Computers in Human Behavior, 2017(73): 290-302.

    KARIMI S, WANG F. Online review helpfulness: impact of reviewer profile image[J]. Decision Support Systems, 2017, 96: 39-48.

    SCHINDLER R M, BICKART B. Perceived helpfulness of online consumer reviews: The role of message content and style[J]. Journal of Consumer Behaviour, 2012, 11(3): 234-243. doi: 10.1002/cb.1372

    闵庆飞, 覃亮, 张克亮. 影响在线评论有用性的因素研究[J]. 管理评论, 2017, 29(10): 95-107.

    TOPALOGLU O, DASS M. The impact of online review content and linguistic style matching on new product sales: the moderating role of review helpfulness[J/OL]. (2019-05-01).https://www.researchgate.net/publication/332906970.

    NELSON P J. Information and consumer behavior[J]. Journal of Political Economy, 1970, 78(2): 311-329. doi: 10.1086/259630

    LUAN J, YAO Z, ZHAO F T, et al. Search product and experience product online reviews: an eye-tracking study on consumers review search behavior[J]. Computers in Human Behavior, 2016, 65: 420-430. doi: 10.1016/j.chb.2016.08.037

    SHANNON C E. A mathematical theory of communication[J]. The Bell System Technical Journal, 2001, 5(3): 3-55.

    崔永生. 在线评论文本挖掘对电商的影响研究[J]. 中国商贸, 2018(33): 17-23.
    张振华, 许柏鸣. 基于在线评论文本挖掘的商业竞争情报分析模型构建及应用[J]. 情报科学, 2019, 37(2): 149-153.
    金吉琼, 刘鸿, 郑赛晶. 基于在线评论文本挖掘技术的电子烟市场消费热点分析[J]. 烟草科技, 2019, 52(12): 106-114.
    魏宝祥, 陆路正, 王耀斌. 三人可成虎?—旅游产品在线评论可信度研究[J]. 旅游学刊, 2019, 34(8): 78-86.
    董爽, 王晓红, 葛争红. 基于文本挖掘的B2C购物网站在线评论内容特征分析[J]. 图书馆理论与实践, 2017(6): 54-58.
    高慧颖, 刘嘉唯, 杨淑昕. 基于改进LDA的在线医疗评论主题挖掘[J]. 北京理工大学学报, 2019, 39(4): 427-434.
    夏火松, 李保国, 杨培. 基于改进K-means聚类的在线新闻评论主题抽取[J]. 情报学报, 2016(1): 55-65. doi: 10.3772/j.issn.1000-0135.2016.001.006

    DUAN W, GU B, WHINSTON A B. Do online reviews matter? —an empirical investigation of panel data[J]. Decision Support Systems, 2008, 45(4): 1007-1016.

    ESLAMI S P, GHASEMAGHAEI M. Effects of online review positiveness and review score inconsistency on sales: a comparison by product involvement[J]. Journal of Retailing and Consumer Services, 2018, 45: 71-80.

    SIERING M, MUNTERMANN J, RAJAGOPALAN B. Explaining and predicting online review helpfulness: the role of content and reviewer-related signals[J]. Decision Support Systems, 2018, 108: 1-12.

    BHATTACHERJEE A. Understanding information systems continuance: an expectation-confirmation model[J]. MIS Quarterly, 2001, 25(3): 351-370. doi: 10.2307/3250921

    彭丽徽, 李贺, 张艳丰. 基于ACSI的网络口碑发布行为影响因素研究[J]. 情报资料工作, 2019, 40(5): 92-102.
    李宗伟, 张艳辉. 体验型产品与搜索型产品在线评论的差异性分析[J]. 现代管理科学, 2013, 8: 44-47. doi: 10.3969/j.issn.1007-368X.2013.09.015

    HONG Y, CHEN P Y, HITT L M. Measuring product type with dynamics of online product review variance[J/OL]. (2012-08-30). https://www.researchgate.net/publication/256031406_Measuring_Product_Type_With_Dynamics_of_Online_Product_Review_Variance.

    GIRARD T, DION P. Validating the search, experience, and credence product classification framework[J]. Journal of Business Research, 2010, 63(9-10): 1079-1087. doi: 10.1016/j.jbusres.2008.12.011

    郭婷婷, 李宝库. “看得见”还是“摸得着”?—在线评论中感官线索引发的意象体验效应[J]. 财经论丛, 2019(9): 82-91.

    CHUA A Y, BANERJEE S. Helpfulness of user-generated reviews as a function of review sentiment, product type and information quality[J]. Computers in Human Behavior, 2016, 54: 547-554. doi: 10.1016/j.chb.2015.08.057

    邱凌云, 肖娴, 庞隽. 个体评论与总体评分一致性对评论有用性的影响[J]. 南开管理评论, 2019(6): 200-210. doi: 10.3969/j.issn.1008-3448.2019.06.016
    张艳辉, 李宗伟. 在线评论有用性的影响因素研究: 基于产品类型的调节效应[J]. 管理评论, 2016, 28(10): 123-132.
    严建援, 张丽, 张蕾. 电子商务中在线评论内容对评论有用性影响的实证研究[J]. 情报科学, 2012, 5: 713-718.
    李恒. 在线评论特征的维度综述[J]. 企业技术开发, 2015, 3: 119-120.

    QAZI A, SYED K B S, RAJ R G, et al. A concept-level approach to the analysis of online review helpfulness[J]. Computers in Human Behavior, 2016, 58: 75-81.

    MUDAMBI S M, SCHUFF D. What makes a helpful online review?[J]. MIS Quarterly, 2010, 34(1): 185-200.

    李亚琴. 电商平台用户在线评论动因研究[J]. 商业经济与管理, 2017(5): 29-41.

    PICAZO-VELA S, CHOU S Y, MELCHER A J, et al. Why provide an online review? An extended theory of planned behavior and the role of Big-Five personality traits[J]. Computers in Human Behavior, 2010, 26(4): 685-696. doi: 10.1016/j.chb.2010.01.005

    WANG Y, WANG J, TANG Y. What makes a helpful online review? A meta-analysis of review characteristics[J]. Electronic Commerce Research, 2019, 19(2): 257-284. doi: 10.1007/s10660-018-9310-2

    GUPTA A, SU B C, WALTER Z. An empirical study of consumer switching from traditional to electronic channels: a purchase-decision process perspective[J]. International Journal of Electronic Commerce, 2004, 8(3): 131-161.

    STRAHILEVITZ M, MYERS J G. Donations to charity as purchase incentives: how well they work may depend on what you are trying to sell[J]. Journal of Consumer Research, 1998, 24(4): 434-446.

    PAN Y, ZHANG J Q. Born unequal: a study of the helpfulness of user-generated product reviews[J]. Journal of Retailing, 2011, 87(4): 598-612. doi: 10.1016/j.jretai.2011.05.002

    LEE J H, JUNG S H, PARK J H. The role of entropy of review text sentiments on online WOM and movie box office sales[J]. Electronic Commerce Research and Applications, 2017, 22: 42-52. doi: 10.1016/j.elerap.2017.03.001

    刘甲学, 陶易. 基于情感分析的评论数据用户满意度影响因素研究[J]. 现代情报, 2017(7): 68-71.
    刘桂琴. 政府数据开放平台用户评论情感差异分析[J]. 数字图书馆论坛, 2019(2): 18-23.
    耿晓利, 陈淋. 基于情感分析与LDA模型的在线用户满意度影响因素研究[J]. 微型电脑应用, 2019, 35(6): 38-41. doi: 10.3969/j.issn.1007-757X.2019.06.013
    涂海丽, 唐晓波. 基于在线评论的游客情感分析模型构建[J]. 现代情报, 2016, 36(4): 70-77. doi: 10.3969/j.issn.1008-0821.2016.04.013

    EL-SAID O A. Impact of online reviews on hotel booking intention: the moderating role of brand image, star category, and price[J]. Tourism Management Perspectives, 2020(33): 100604.

    XU P, CHEN L, SANTHANAM R. Will video be the next generation of e-commerce product reviews? Presentation format and the role of product type[J]. Decision Support Systems, 2015, 73: 85-96. doi: 10.1016/j.dss.2015.03.001

    LI M, WEI K, TAYI G, et al. The moderating role of information load on online product presentation[J]. Information & Management, 2016, 53(4): 467-480.

    STOCK J H, YOGO M. Testing for weak instruments in linear IV regression[M]//ANDREWS D W K, STOCK J H. Identification and inference for econometric models: essays in honor of Thomas Rothenberg. Cambridge: Cambridge University Press, 2005: 80-108.

图(3)  /  表(7)
计量
  • 文章访问数:  2863
  • HTML全文浏览量:  398
  • PDF下载量:  49
  • 被引次数: 0
出版历程
  • 收稿日期:  2020-05-21
  • 网络出版日期:  2020-09-16
  • 刊出日期:  2021-02-25

目录

/

返回文章
返回