
科学研究与应用
Journal of Scientific Research and Applications
- 主办单位:未來中國國際出版集團有限公司
- ISSN:3079-7071(P)
- ISSN:3080-0757(O)
- 期刊分类:科学技术
- 出版周期:月刊
- 投稿量:4
- 浏览量:444
相关文章
暂无数据
基于迁移学习的消费者投诉识别方法研究
Research on Consumer Complaint Identification Method Based on Transfer Learning
引言
社交媒体上的消费者投诉为企业带来了巨大的风险。特别是,这些投诉引发了大量的旁观者共情与负面情绪的传播,所以识别投诉对于企业来说至关重要。因此,在企业服务中,识别潜在的消费者投诉越来越受到关注。先前的研究表明,用户在社交媒体中记录生活,并分享使用产品或体验服务后的体验,其中也包括他们的投诉。尽管社交媒体中的消费者投诉信息对于企业来说很重要,但它们大多以短文本的形式存在,同时是非结构化的,且数量一直在快速增长。所以,为了有效分析可用的数据并识别消费者投诉,研究人员和从业者需探索一种人工干预程度低、可实现投诉信息大规模过滤的方法。近期,一些研究开始使用大数据方法来分析数据。机器学习以及自然语言处理的最新发展使得研究人员能够更快速地分析文本数据及其语义。最近,Singh等引入了基于图的半监督学习范式方法,利用推文的句法和语义表示,在基准数据集上的结果表明,在解决投诉识别任务方面,所提出的方法优于最先进的分类模型,并证实了所提出方法的有效性。但是,这些方法需要人工的处理步骤,这可能影响其可扩展性及产生人为错误。所以,本文提出一种更高效的迁移学习方法去识别社交媒体当中的消费者投诉。本文使用的BERT模型是一种先进的基于transformer的机器学习模型,能够更好地理解非结构化的文本数据内容,并在已经标注的数据上进行训练,将生成的模型转移到相似但不同用例当中。具体而言,本文收集了88984条数据,其中包括44492条黑猫投诉数据和44492条其他常见的在线资源文本。然后利用基于transformer架构的Bert模型,将这些投诉数据同其他的文本区分开来。随后,迁移经过训练的模型,以识别社交媒体中潜在的消费者投诉。在119988条社交媒体(微博)评论数据的基础上,测试了微调模型。最初的微调模型对帖子是否为投诉的准确率达到了99.6%。将训练后的模型应用到社交媒体数据后,模型将其中的449条(占比0.3%)归类为消费者投诉。随后,通过人工验证模型在子样本上的性能,发现准确率为92.5%。此外,应用该模型将筛选出消费者投诉的比例从大约7.5%增加到了78%,证明了迁移学习可用于识别社交媒体中的消费者投诉,从而有助于最大限度地减少此类机器学习方法的人工工作,而无需人工标注和过滤步骤。总体而言,这项研究的方法为未来的研究人员和研究提供了一个方法视角,以应对来自社交媒体不断增长的数据带来的挑战。
1相关研究
1.1 社交媒体中的消费者投诉
学者们从不同的角度对社交媒体上的消费者投诉进行了界定。有的研究认为社交媒体上的消费者投诉与传统投诉有所不同,另有研究指出,大多数社交媒体上的消费者投诉是首次服务补救失败后,由双重偏差引发的行为,此外还有研究认为社交媒体上的消费者投诉包括消费者在社交媒体上表达对企业的悲伤、痛苦或不满等负面情绪。在本文,消费者投诉是消费者在经历产品或服务失败或遭受双重偏差后,由于愤怒或无助等负面情绪的驱动,在社交媒体上公开发布消极内容以表达不满的行为。这种行为通常会引起在线旁观者的关注,并促使企业采取相应措施进行回应。
消费者投诉与消费者满意度密切相关,是消费者在不满情况下的一种行为。在某些情况下,即使消费者对他们购买的产品或服务不满意,他们也可能会保持沉默,不采取任何行动。然而,大多数时候,消费者表现出投诉行为,他们可以采取各种行动。社交媒体的相对匿名性也促进了消极唤醒的表达。企业面临着越来越大的舆论压力,需要快速响应投诉以降低负面口碑的影响。近年来,信息技术的发展增加了消费者投诉的重要性。此外,社交媒体环境下沟通的公开性和互动性使消费者发布的消息在短时间内被众多受众阅读、转载和讨论,有时甚至会发展成网络群体性投诉或群体抵制事件,给企业的经营带来巨大的负面影响,这为企业的消费者投诉管理提出了新的挑战。
1.2 消费者投诉识别
过去,学者们开发了不同的方法来识别投诉。识别投诉的传统方法主要是依靠情感分析,通过负面情绪去识别。Jin等将一组基于Transformer的神经模型与语言信息相结合,在公开的投诉数据集上进行的实验表明优于以前最先进的方法。Singh等在2021年提出了一种基于图的半监督学习范式,利用推文的句法和语义表示,在基准数据集上的结果表明,在解决投诉识别任务方面,所提出的方法优于最先进的分类模型,并证实了所提出方法的有效性。随后,该团队利用弱监督学习来用情绪标签注释语料库,提出了一个深度多任务框架,该框架使用Affective Space将常识性知识注入学习过程,同时对投诉识别(主要任务)和情绪分类(补充任务)进行建模。最近,他提出的基于方面的投诉检测模型,能够识别给定评论中有关产品的各个方面,还能发现评论中提到的方面是投诉还是非投诉。然而,这些方法都不适用于大规模以及快速增长的社交媒体数据量,需要消耗大量的算力,为此,本文探索采用更先进的自然语言处理方法识别消费者投诉。
2 方法
2.1迁移学习方法与基于Transformer的自然语言处理技术
本文试图解决将社交媒体上用户撰写的帖子归类为消费者投诉的任务。分类是机器学习中的一项常见任务,例如,可以通过监督学习来执行。为了应用监督学习,模型(例如人工神经网络)需要人工标注的数据进行训练。例如,为了训练机器学习模型对狗和猫的图像进行分类,该模型必须在先前标记的狗和猫的图像数据集上进行训练。本文决定应用迁移学习,而不是人工将在线帖子标注为消费者投诉来训练机器学习模型。迁移学习是一种将学到的技能或知识应用于不同但相似的领域的方法。与监督学习类似,迁移学习可以对先前标记的数据执行。然而,迁移学习不是针对感兴趣的任务进行训练,而是针对类似的任务进行训练。随后,假设训练的模型可以转移到实际任务中。例如,可以训练一个模型来对类似的任务(例如,狗和猫)进行分类,然后转移对动物的玩具进行分类,而不是标记真实猫和狗的图像。在自然语言处理的背景下,迁移学习已成功应用于各种问题。模型在一般任务上进行了预训练以理解语言,并且可以微调到更具体的任务,例如回答问题、总结或文本分类。
为了应用迁移学习将社交媒体用户撰写的在线帖子分类为消费者投诉,需要一个与实际任务相似但已经标记的数据集。具体而言,需要寻找现有公开可用的在线数据集,作为代表消费者投诉的数据。
另外,近年来,硬件进步和大型文本数据集的广泛使用,促进了包括深度人工神经网络在内的先进自然语言处理方法的发展。Vaswani等引入了一种称为Transformer的新方法,该方法利用人工神经网络架构,使模型能够根据一长串上下文抽象出单词的含义。通过自注意力机制,该模型学会权衡每个上下文词的重要性,以丰富焦点词的含义。与von Hippel等描述的词空间模型类似,词在向量空间中表示,其中向量间的距离对应词义的相似度。然而,由于对上下文和模型大小的选择性关注,Transformer在表示单词或句子的含义方面比词空间模型更具优势。在其首次发表后,许多研究人员和组织采用了Transformer方法并开发了修改后的架构,可以在许多自然语言处理任务中实现最先进的结果,包括回答问题、情感分析、摘要、命名实体识别、文本翻译、文本生成和文本分类。
2.2 投诉平台
投诉平台是通过互联网为消费者提供的投诉和反馈平台,这为消费者吐诉心声创造了良好的条件。此类平台允许用户分享他们的不满、投诉或问题,间接促进消费者权益的保护,从而推动企业及时回应消费者的需求和意见,最终改进产品和服务。投诉平台内的文本具有以下特点:(1)情感倾向明显,往往是用户对某个产品或服务不满而产生的,因而通常带有较强的负面情感色彩。(2)涉及明确的主题:文本中一般涉及某个具体的问题或事件,因此具有明确的主题。(3)包含详细的信息:为了使得投诉更有说服力,投诉人通常会提供尽可能多的相关细节和信息。(4)使用口语化语言:因为投诉往往是用户的真实反馈,所以投诉文本往往使用口语化的语言,甚至包含缩写词、俚语等,与社交媒体数据与消费者投诉有类似的特点。因此,本文认为投诉平台数据包含了投诉表达的重要特征。
2.3 方法应用
本文结合迁移学习和Transformer模型来识别社交媒体中的消费者投诉,应用了以下概述的四个步骤。表1 概述了以下四个过程步骤:(1)选择机器学习模型,(2)构建训练数据进行微调,(3)微调机器学习模型,以及(4)将训练后的模型转移到社交媒体数据中。
首先,需要找到一个合适的机器学习模型。如前所述,基于transformer的模型在许多自然语言处理任务中提供了最先进的结果。硬件、时间和数据要求限制了从头开始训练此类模型的可能性,因为它们需要大量的文本数据。因此,本文选择一个已经预训练的模型BERT,它由Google开发。该模型可以免费获得,并且易于在不同的编程语言和开发环境(如Python)中实现。由于模型的大小,本文选择了具有约1.1亿个人工神经网络参数的基本BERT版本。这也契合了本研究的初衷,以降低方法的实施与复现门槛。BERT的另一个优势是通过对广泛的互联网文本进行预训练而产生的,它不需要密集的预处理。该模型最初是在中文维基百科等大规模中文语料上进行预训练的,并且可以在后续任务(例如,文本分类)上进行微调。
| 序号 | 步骤 | 描述 | 结果 |
|---|---|---|---|
| 1 | 选择一个机器学习模型 | 确定一种适合迁移学习且先进自然语言处理模型的机器学习模型。谷歌的BERT模型广受欢迎,具有双向性,并在多个领域取得了良好成果。 | Bert-Base-Chinese |
| 2 | 构建用于微调的数据集 | 识别代表相似学习任务的数据集。投诉平台中的投诉数据可能包括消费者投诉,将投诉数据与各种常见的互联网文本区分开来。 | 两组数据集作为消费者投诉的正例和负例:
正面:44492条投诉数据文本 负面:来自各种在线资源的44492条文本 |
| 3 | 训练机器学习模型 | 针对目标进行训练,以对两种类型的数据集进行分类。将数据分为训练集和测试集,以分析性能。 | 在测试数据上区分正负文本的准确率达到99.6%。 |
| 4 | 转移到特定用例 | 将训练好的模型(第3步)应用于社交媒体环境,对文本进行标注以分类消费者投诉。 | 119988条原始社交媒体评论中有449条帖子是消费者投诉 |
其次,如上所述,本文需要不同的数据集将类似于投诉数据的文本与其他文本分开,以最大限度地减少人工标注。因此,本文收集了两个数据集,如表2 所示。对于第一个数据集,本文选择了可能不包含消费者投诉的常见在线文本的公开数据集。本文挑选了一组不同的文本,这些文本在长度或形式上各不相同,其中包括金融新闻、影视弹幕、垃圾邮件、假新闻、找工作讨论帖、读书书评、博物馆评论和微博热搜。第二个数据集由投诉数据文本组成。
第三,利用这些数据集中投诉文本和普通文本之间的区别,通过对预训练的BERT模型进行微调,对两种类型的文本进行分类。在此过程中,添加了两个人工神经元的最后一层,分别代表“投诉文本”和“非投诉文本”这两类。人工神经网络的输出是模型为每个选择分配的概率,加起来等于1。具体而言,本文使用了与Bert-Base-Chinese相同的超参数进行训练。
第四,将微调后的模型转移到社交媒体。因为先前的研究发现了该领域的消费者投诉,所以社交媒体用户评论是应用和测试微调模型的合适环境。因此,本文选择了在HeyWhale平台上公开的微博评论数据集。最后,该模型将119988条评论中的449个(0.3%)归类为消费者投诉。
| 数据 | 数量 | 文本长度 | ||||
|---|---|---|---|---|---|---|
| 平均值 | 标准差 | 最小值 | 最大值 | |||
| 正例训练数据 | ||||||
| 投诉数据 | 44492 | 90.373 | 50.723 | 10 | 262 | |
| 总计(正例) | 44492 | 90.373 | 50.723 | 10 | 262 | |
| 负例训练数据 | ||||||
| 金融新闻 | 8110 | 305.224 | 158.524 | 13 | 600 | |
| 电视剧弹幕 | 5217 | 14.251 | 5.300 | 9 | 50 | |
| 垃圾邮件 | 1056 | 109.409 | 65.580 | 9 | 405 | |
| 假新闻 | 10403 | 114.836 | 59.038 | 9 | 595 | |
| 找工作讨论帖 | 842 | 16.840 | 5.212 | 9 | 33 | |
| 读书书评 | 2202 | 326.065 | 152.372 | 32 | 600 | |
| 博物馆评论 | 9841 | 162.741 | 85.394 | 50 | 598 | |
| 微博热搜 | 6821 | 12.830 | 2.678 | 9 | 25 | |
| 总计(负例) | 44492 | 141.174 | 71.816 | 9 | 600 | |
3结果
3.1迁移学习结果
本文提出的四个过程步骤的结果包括训练模型对进行分类后的微调结果(第3步)以及将模型转移到社交媒体评论的结果(第4步)。在微调步骤中,将数据集拆分为训练(80%)和测试(20%)数据集,消费者投诉文本和非消费者投诉文本按1:1拆分。因此,测试数据集对模型来说是未知的,并用作对训练数据集上执行的训练的评估。选择0.5作为分类阈值,模型在区分文本是否为投诉数据的任务上,准确率为99.6%。随后将微调模型应用于社交媒体平台,将449个社交媒体评论(0.3%)归类为消费者投诉。在表3 中,列出了被归类为消费者投诉或非消费者投诉的示例帖子。值得注意的是,该模型关注不同的单词,这些单词的语义会随上下文不同而变化。此外,与投诉相关的词语并不一定意味着消费者投诉。这些分类结果支持了本文的目标,通过使用迁移学习成功识别消费者投诉。
| 文本 | 分类结果(1为投诉,0为非投诉) |
|---|---|
| 安排休息的屋子一股怪味,说送饭到屋子,等饿得不行了,问服务员才说忘记送了,于是拿到了不值五元的白菜套餐。电话没信号,发现居然电话线都没接。[怒]@东方航空 @东航官网 | 1 |
| 5月8日到底是什么日子[怒],先是交通队输入出现错误把我的车搞成违章。今天又发现,在淘宝上定的东西,快递显示我已签收。圆通啊,我的货在哪里呢?同一天居然发生两件如此奇怪的事情,我。。。无语。。。无奈。。。 | 1 |
| 康桥创业园的宽带竟然被联通垄断,可恨的是企业宽带竟然要600大洋/月(不含座机)!苦苦问了一大圈子联通的销售员肯打了7折,还要420/月啊(前提一次性交一年)。。。我实在忍不下心交这个网费,可是没网又不行!这对我们这种中小型创业企业情何以堪 [泪] | 1 |
| 郁闷!升级升级,把我的应用软件都升没了,还要重装,密码都不记得了?????不升就不行吗?[晕] | 1 |
| 邻居妈妈有两个孩子,男宝宝好像是四岁了,经常喜欢在他妈妈开门的时候学着样子来敲我家的门,好几次都被吓一跳,隔着门会听到他妈妈不厌其烦地说"宝宝这不是我们家的门你再敲就会有大灰狼出来吃你!",结果今天回家早在楼道碰到了男宝宝盯着我跟他妹小声说了句"大灰狼变的.."我瞬间石化[泪][泪] | 0 |
| 第一次见到有花瓣的面膜,一片抵普通面膜好几片 [哈哈]!补水神器啊,一帖见效! 睡前一片,15分钟超神奇膜法,第二天起来你会发现你脸又白又嫩还有光泽,持续几天皮肤好像剥了壳的鸡蛋一样白白嫩嫩的[太开心]!明星推荐,美妆老师私藏的神奇"膜"法!8片礼盒装抢购地址>>>(去评论中找链接哦) | 0 |
| 谁欺负双鱼座,俺就和他玩儿命!!![抓狂] //@某网友:双鱼座顶起... | 0 |
| 还在老挝么?这个国家会让你感到一种难得的心灵安定,这种安定感是弥漫在空气中的,上次在吴哥,和一位僧侣用英文聊佛法,很长见识,当时就想不走了[嘻嘻] | 0 |
3.2 验证
尽管投诉示例分类结果支持本文方法的目标,但这些示例并未显示本文的迁移学习方法是否以及在多大程度上改善了对消费者投诉的识别。因此,通过人工对在线文本进行标注来验证分类结果。在此过程中,本文首先遵循在其他领域如用户创新识别的方法,从119988个未过滤的帖子中随机选择400个帖子,同时从449个已过滤帖子中随机选择400个帖子。本文进一步对文本是否包含消费者投诉进行分标注。两名标注员独立标注了总共800个帖子,通过Cohen's Kappa计算,得出了较强的评分者一致性(k=0.85)。人工标注发现400个未过滤文本中有30个(7.5%)包含消费者投诉,而400个过滤文本中有312个(78%)标注为消费者投诉。因此,本文的模型可以识别消费者投诉的可能性是随机选择在线帖子10倍以上。这表明,使用迁移学习和Transformer模型不仅适用于识别消费者投诉,同时最大限度地减少人工操作,而且还在自动识别消费者投诉方面取得了新的结果。
通过将模型的分类与400个未过滤帖子的人工标注进行比较来分析机器学习模型的准确性。表4 显示了比较的结果。机器学习模型正确分类了92.5%(真阳性和真阴性)。除了定量分析外,人工验证还揭示了有关用户在社交媒体中消费者投诉的详细见解。社交媒体用户讨论广泛的主题,包括航空服务、通信服务、软件服务等。本文的模型能够在这项研究的背景下识别出不同社交媒体用户投诉类型的多样性。
| 模型分类 | ||
|---|---|---|
| 投诉 | 非投诉 | |
| 人工标注:投诉 | 2 | 30 |
| 人工标注:非投诉 | 0 | 368 |
4结论与启示
本文旨在开发一种先进的方法,以最少的人工操作从社交媒体文本中识别消费者投诉。最近的许多研究都强调了社交媒体产生的传播能力,社交媒体用户经常在他们的文本交流中表达这些投诉。鉴于这种负面的评论消息对企业的危害,学者们开发了识别社交媒体消费者投诉的方法。但是,上述方法不适用于高效处理社交媒体中庞大的数据量。因此,在这些进步的基础上,本文提出的方法进一步提高了社交媒体消费者投诉的自动识别质量,同时最大限度地减少了人工操作。本文提出的方法结合了两种机器学习技术。首先,为了分析文本,使用了一种称为Transformer的先进的机器学习架构。其次,利用迁移学习来训练机器学习模型,并最大限度地减少人工操作。在应用模型之前,它会根据与感兴趣任务类似的已经进行了标记的数据进行训练。对模型结果的人工验证表明,这种迁移学习过程可以应用于识别社交媒体中的消费者投诉的上下文。然而,这种自动筛选大型数据集识别社交媒体消费者投诉的能力,并不意味着可以取代传统的消费者投诉整合方法。相反,本文将这些方法论的进步和传统方法视为一种补充。虽然自动过滤消费者投诉有助于快速发现产品与服务痛点、及时响应消费者诉求并推出针对性改进措施,但是比如情感分析一类的传统方法,对于扩充完善消费者投诉的范围是有价值和必要的。
参考文献:
- [1] Kim J S, Wang J R, Maslowska E, et al. “Understanding a fury in your words”: The effects of posting and viewing electronic negative word-of-mouth on purchase behaviors[J]. Computers in Human Behavior,2016,54:511-521.
- [2] Ribeiro C D G, Butori R, Nagard L E. The determinants of approval of online consumer revenge[J]. Journal of Business Research,2018,88:212-221.
- [3] Apoorva S, Sriparna S, Mohammed H, et al. Identifying complaints based on semi-supervised mincuts[J]. Expert Systems With Applications,2021,186.
- [4] Gunarathne P, Rui H, Seidmann A A. When Social Media Delivers Customer Service: Differential Customer Treatment in the Airline Industry[J]. MIS Quarterly,2018,42(01):489-520.
- [5] Kim J, Lim C. Customer complaints monitoring with customer review data analytics: An integrated method of sentiment and statistical process control analyses[J]. Advanced Engineering Informatics,2021,49:101304.
- [6] Singh A, Saha S, Hasanuzzaman M, et al. Multitask Learning for Complaint Identification and Sentiment Analysis[J]. Cognitive Computation,2021,14(01):1-16.
- [7] Vermeer A S, Araujo T, Bernritter F S, et al. Seeing the wood for the trees: How machine learning can help firms in identifying relevant electronic word-of-mouth in social media[J]. International Journal of Research in Marketing,2019,36(03):492-508.
