客户之声:如何进行客户情感分析,获取潜在机会

灵验喵CEM
+ 关注
2024-07-11 17:09
795次阅读

你是否曾经想过,你的产品或服务是否真正满足了客户的需求?你是否想知道客户对你的公司、品牌和员工的态度?如果你想要了解这些信息,就需要进行客户情感分析。

 

01 什么是情感分析

情感分析(或观点挖掘)是一种自然语言处理 (NLP) 技术,用于确定数据是正面、负面还是中立。情感分析通常对文本数据进行分析,以帮助企业监控客户反馈中的品牌和产品情绪,并了解客户需求。

  • 情感分析的类型
情感分析侧重于文本的极性(积极的、消极的、中立的),但它也超越了极性来检测特定的感受和情绪(愤怒、快乐、悲伤等)、紧迫性(紧急、不紧急)甚至意图(感兴趣与不感兴趣)。

根据您希望如何解释客户反馈和咨询,您可以定义和定制类别以满足您情感分析需求。以下是一些最常用的情感分析类型:

1)分级情感分析

如果极性精度对您的业务很重要,您可以考虑扩展极性类别以包括不同级别的正负向:

客户之声:如何进行客户情感分析,获取潜在机会

2)情绪检测

情绪检测情感分析允许您超越极性来检测情绪,如快乐、沮丧、愤怒和悲伤。许多情绪检测系统使用词典(即单词列表及其传达的情感)或复杂的机器学习算法。

使用词典的缺点之一是人们表达情感的方式各不相同。一些通常表达愤怒的词,如 "坏"(bad)或 "杀"(kill)(例如,你的产品太糟糕了,或者你的客户支持简直要了我的命!)也可能表达快乐(如 "这真是个大坏蛋 "或 "你们真是太棒了")。

 

3)基础情感分析

通常,在对文本进行情感分析时,您会想知道人们以积极、中立或消极的方式提及哪些特定方面或特征。

这就是基础情感分析可以提供帮助的地方,例如在产品评论中:“这款相机的电池寿命太短”,基础分类将能够确定该句子表达了对相关产品的电池寿命的负面意见。

 

4)多语言情感分析

多语言情感分析可能很困难,它涉及大量的预处理和资源。这些资源中的大部分都可以在网上找到(例如情感词典),而其他资源则需要创建(例如翻译的语料库或噪声检测算法),但您需要知道如何编写代码才能使用它们。

或者,您可以使用语言分类器自动检测文本中的语言,然后训练自定义情感分析模型,用您选择的语言对文本进行分类。

 

02 为什么情感分析很重要

由于人们越来越倾向于在公开渠道表达自己的想法和感受,情感分析正迅速成为监控和理解各类数据情感的重要工具。
自动分析客户反馈,例如调查回复社交媒体对话中的意见,使品牌能够了解什么让客户满意或沮丧,以便他们可以定制产品和服务以满足客户的需求。
例如,使用情感分析自动分析客户满意度调查中的 4000+ 个开放式回复,可以帮助您发现客户在客户旅程的每个阶段满意或不满意的原因。

也许您想跟踪品牌情感,以便您可以立即发现不满的客户并尽快做出回应。也许您想比较这个季度和下一个季度的情绪,看看是否需要采取行动。然后,您可以更深入地挖掘定性数据,以了解情感下降或上升的原因。

  • 情感分析的总体趋势
1)大规模数据整理

您能想象手动整理成千上万条的推文、客服对话或调查报告吗?情感分析可帮助企业以高效、经济的方式处理大量非结构化数据。

 

2)实时分析

情感分析可以实时识别关键问题,例如社交媒体上的公关危机是否正在升级?愤怒的客户是否即将流失?情感分析模型可以帮助您立即识别这类情况,以便您可以快速采取行动。

 

3)一致的标准

据估计,在判断特定文本情感时,只有大约 60-65% 的时间会达成一致。情感标记文本具有很强的主观性,会受到个人经历、思想和信念的影响。

通过使用集中式情感分析系统,企业可以对其所有的数据应用相同的标准,从而帮助他们提高准确性并获得更好的洞察力。

 

03 情感分析如何工作

情感分析,也称为意见挖掘,得益于自然语言处理 (NLP) 和机器学习算法,可以自动确定在线对话背后的情感基调。
情感分析模型可以采用不同的算法,具体取决于需要分析的数据量以及模型准确性的要求。下面我们将详细介绍其中的一些算法。
客户之声:如何进行客户情感分析,获取潜在机会

1)基于规则的方法

通常情况下,基于规则的系统使用一套人为制定的规则来帮助识别主观性、极性或观点的主体。
这些规则可能包括在计算语言学中开发的各种NLP技术,例如:词干提取、标记化、词性标记和解析、词典(即单词和表达式列表)。

下面是基于规则的系统如何工作的基本示例:

1.定义两个极化词表(负面词表,如坏、最差、丑等和正面词表,如好、最好、美丽等)。

2.计算给定文本中出现的正面和负面词语的数量。

3.如果正面词语出现的次数大于负面词语出现次数,系统就会返回正面情感,反之亦然。如果两者相等,系统将返回中性情感。

基于规则的系统非常基础,因为它们没有考虑单词在序列是如何中组合的。当然,可以使用更先进的处理技术,并添加新规则以支持新的表达和词汇。但是,添加新规则可能会影响以前的结果,整个系统可能会变得非常复杂。由于基于规则的系统通常需要微调和维护,因此也需要定期投资。

 

2)自动方法

与基于规则的系统相反,自动方法不依赖于人工制定的规则,而是依赖于机器学习技术。情感分析任务通常被建模为一个分类问题,分类器收到文本后会返回一个类别,例如正面、负面或中性。
下面介绍机器学习分类器的实现方式:

客户之声:如何进行客户情感分析,获取潜在机会

  • 训练和预测过程

在训练过程(a)中,我们的模型会根据用于训练的测试样本,学习将特定输入(即文本)与相应的输出(标签)相关联。特征提取器将文本输入转化为特征向量。特征向量和标签对(例如正面、负面或中性)被输入到机器学习算法中以生成模型。

在预测过程(b)中,特征提取器用于将看不见的文本输入转换为特征向量。然后将这些特征向量输入模型,由模型生成预测标签(同样是正面、负面或中性)。

 

  • 从文本中提取特征

机器学习文本分类器的第一步是转换文本提取或文本矢量化,经典方法是带有词频的词袋(bag-of-words)或词组袋(bag-of-ngrams)。

如今,基于词嵌入(也称为词向量)应用了新的特征提取技术。这种表示使具有相似含义的词可以具有相似的表示,从而提高分类器的性能。

 

  • 分类算法

分类步骤通常涉及如朴素贝叶斯、线性回归、支持向量机或神经网络等统计模型:
  朴素贝叶斯: 一系列概率算法,使用贝叶斯定理来预测文本的类别。
  线性回归: 统计学中一种非常著名的算法,用于在给定一组特征 (X) 的情况下预测某个值 (Y)。
  支持向量机:一种非概率模型,它将文本示例表示为多维空间中的点。不同类别(情感)的示例被映射到该空间内的不同区域。然后,根据与现有文本的相似性及其映射到的区域为新文本分配一个类别。

  深度学习: 一组多样化的算法,试图通过采用人工神经网络来处理数据的方法来模仿人脑。

 

3)混合方法

混合系统将基于规则和自动技术的理想元素组合到一个系统中。这些系统的一个巨大优势是结果往往更加准确。

 

04 情感分析的挑战

情感分析是自然语言处理中最难的任务之一,因为即使是人类也很难准确分析情感。

数据科学家在创建更准确的情感分类器方面正在取得进步,但还有很长的路要走。

  • 主观性和语气
文本分为两类:主观文本和客观文本。客观文本不包含明确的情感,而主观文本则包含。

客户之声:如何进行客户情感分析,获取潜在机会

大多数人会说,第一个情绪是积极的,第二个是中性的,对吗?所有谓语(形容词、动词和一些名词)在如何创造情感方面都不应该一视同仁。在上面的例子中,好看比红色更主观。

 

  • 语境和极性
所有的话语都是在某个时间、某个地方、对某些人说出来的。所有话语都在语境中说出的,在没有上下文的情况下分析情感相当困难。如果没有明确提及上下文,机器就无法了解语境,语境引起的问题之一是极性的变化。查看以下回复:
关于它的一切。
绝对没有!
想象一下,上面的回答来自问题“你喜欢这个活动的哪些方面?”第一个反应是积极的,第二个反应是消极的,对吗?现在,设想这些回答来自对问题“你不喜欢这次活动的哪些方面?”问题中的否定会让情感分析完全改变。

如果我们要至少考虑到产生文本的部分背景,就需要进行大量的预处理或后处理。然而,如何对数据预处理或后处理,以捕获有助于情感分析的上下文信息,并不是一件简单的事。

 

  • 讽刺和挖苦
说到讽刺和挖苦,人们会用正面的词语来表达自己的负面情绪,如果不全面了解表达情绪的情境,机器就很难察觉。
例如,查看以下问题的一些可能答案:

客户之声:如何进行客户情感分析,获取潜在机会

你会为上述回答赋予什么情感?第一个带感叹号的回答可能是负面的,对吗?问题是没有文本线索可以帮助机器学习,或者至少可以质疑这种情感,因为 "是的 "和 "当然 "通常属于正面或中性文本。

那么第二个回答呢?在这种情况下,情绪是积极的,但我们相信你可以想出很多不同的情况,在这些情况下,同样的回答可以表达负面情绪。

 

  • 比较
如何在情感分析中处理比较是另一个值得解决的难题。

客户之声:如何进行客户情感分析,获取潜在机会

第一次比较不需要任何上下文线索即可正确分类。很明显,这是正面的。

不过,第二和第三文本有点难以分类。你会将它们归类为中性、正面甚至负面吗?同样,语境也会产生影响。例如,如果第二个文本中的“旧工具”被认为是无用的,那么第二个文本与第三个文本非常相似。

 

  • 表情符号
据研究,有两种类型的表情符号。西方表情符号(例如:D)只用一两个字符编码,而东方表情符号(例如 ̄ \ (ツ) / ̄)则是一个较长的竖排字符组合。表情符号在文本的情感表达中起着重要作用,尤其是在推文中。

在对推文进行情感分析时,需要特别注意字符级以及单词级,可能还需要大量的预处理。例如,您可能希望预处理社交媒体内容,将西方和东方表情符号转化为标记并将其列入白名单(即始终将它们作为分类目的的特征),以帮助提高情感分析性能。

 

  • 定义中性
为了进行准确的情感分析,定义中性的含义是另一个需要解决的难题。与所有分类问题一样,定义类别-在本例中定义中性标签,是问题最重要的部分之一。在训练情感分析模型时,中性、正面或负面的含义确实很重要。由于标记数据要求标记标准保持一致,因此必须对问题进行良好的定义。
以下是一些可帮助您识别和定义中性文本的想法:

1)客观文本

所谓的客观文本不包含明确的情绪,因此您应该将这些文本归入中性类别。

 

2)无关信息

如果您尚未对数据预处理以过滤掉无关信息,则可以将其标记为中性。但要注意的是,只有当您知道这样做会如何影响整体性能时,才能执行此操作。有时,您会给分类器添加噪音,导致性能变差。

 

3)包含愿望的文本

比如,“我希望产品有更多的集成”这种愿望通常是中性的。但是,像 "我希望产品更好 "这样包含比较的愿望就很难归类了。

 

  • 人工注释器准确性
平均而言,在情感分析方面,标注者之间的一致性(衡量两个或更多人工标记者做出相同注释决策的能力)非常低。由于机器是从标记的数据中学习的,情感分析分类器可能不如其他类型的分类器精确。
尽管情感分析预测并不那么准确,但情感分析依然值得我们付出努力。灵验喵CEM的情感分析模型,可以让您在提交文本进行分类时,大大提升情感分析预测的准确性。对于典型的使用案例,例如工单流转、品牌监控和VoC分析,您将在繁琐的人工上节省大量时间和资金。
内容参考:MonkeyLearn,Sentiment Analysis: A Definitive Guide

[免责声明]

原文标题: 客户之声:如何进行客户情感分析,获取潜在机会

本文由作者原创发布于36氪企服点评;未经许可,禁止转载。

资深作者灵验喵CEM
灵验喵CEM
0
南京灵越信息技术有限公司
实力厂商
实力厂商
优质服务
优质服务
及时响应
及时响应
立即询价
相关文章
最新文章
查看更多
关注 36氪企服点评 公众号
打开微信扫一扫
为您推送企服点评最新内容
消息通知
咨询入驻
商务合作