情绪分析
情感分析(或舆情挖掘)是一种自然语言处理技术,用于确定数据是正面的、负面的还是中性的。通常对文本数据进行情感分析,以帮助企业监控客户反馈中的品牌和产品情感,并了解客户需求。
什么是情感分析
情感分析是检测文本中正面或负面情感的过程。企业通常用它来检测社交数据中的情感、衡量品牌声誉和了解客户。
由于客户比以往任何时候都更公开地表达他们的想法和感受,情感分析正成为监测和了解这种情感的重要工具。通过自动分析客户反馈(如调查回复和社交媒体对话中的意见),品牌可以了解是什么让客户感到高兴或沮丧,从而可以定制产品和服务以满足客户的需求。
例如,使用情感分析自动分析 4,000 多条有关产品的评论,可以帮助您发现客户是否对您的定价计划和客户服务感到满意。
也许您想实时并随时间推移评估社交媒体上的品牌情绪,这样您就能立即发现不满的客户,并尽快做出回应。
情感分析的类型
情感分析模型重点关注极性 (正、负、中性),但也有关于感觉和情绪的(愤怒、快乐、悲伤等)、紧迫性(急不急),甚至意图(感兴趣 v. 不感兴趣).
您可以根据自己想要解释客户反馈和查询的方式,定义和定制自己的类别,以满足情感分析的需求。同时,以下是一些最常用的情感分析类型:
细粒度情感分析
如果极性精确度对您的业务很重要,您可以考虑将极性类别扩展到其他类别:
- 非常积极
- 积极的
- 中性
- 阴性
- 非常消极
这通常被称为细粒度情感分析,可用于解释评论中的五星评级等:
- 非常积极 = 5 星
- 非常负面 = 1 星
情绪检测
这类情感分析旨在检测情绪,如快乐、沮丧、愤怒、悲伤等。许多情感检测系统使用词典(即单词及其所表达情感的列表)或复杂的机器学习算法。
使用词典的一个弊端是,人们表达情绪的方式各不相同。一些通常表达愤怒的词,如 坏的 或 杀死 例如 你们的产品太差了 或 你们的客户支持简直要了我的命)也可以表达快乐(例如 太酷了 或 你真厉害).
基于方面的情感分析
通常,在分析文本(例如产品评论)的情感时,您会想知道人们以积极、中立或消极的方式提到了哪些特定方面或功能。这就是 基于方面的情感分析 可以提供帮助,例如在本文中: "这款相机的电池寿命太短"因此,基于方面的分类器就能确定该句子表达了对电池寿命这一特征的负面看法。
多语言情感分析
多语言情感分析可能很困难。它涉及大量的预处理和资源。这些资源中的大多数都可以在网上找到(如情感词典),而另一些则需要创建(如翻译语料库或噪声检测算法),但您需要知道如何编写代码才能使用它们。
机器学习如何用于情感分析?
机器学习在情感分析中的主要作用是改进情感分析所依赖的底层文本分析功能并使之自动化,包括语音部分标记。例如,数据科学家可以通过向机器学习模型输入大量包含预标记示例的文本文档来训练其识别名词的能力。利用监督和非监督机器学习技术,如神经网络和深度学习,该模型将学习到哪些名词 看起来
.
一旦模型准备就绪,同一位数据科学家就可以将这些训练方法用于建立新的模型,以识别其他语篇。这样就能快速、可靠地进行语篇标记,帮助大型文本分析系统更有效地识别包含情感的短语。
机器学习还能帮助数据分析师解决语言演变带来的棘手问题。例如,"病态烧伤 "这个短语可以包含许多完全不同的含义。创建一个情感分析规则集来解释每一种潜在含义是不可能的。但是,如果给机器学习模型输入几千个预先标记的示例,它就能学会理解 "病态烧伤 "在视频游戏和医疗保健中的含义。你还可以运用类似的训练方法来理解其他双重含义。
情感分析的总体优势包括
规模数据排序
你能想象手动整理成千上万的推文、客户支持对话或调查吗?人工处理的业务数据实在是太多了。情感分析可以帮助企业以高效、经济的方式处理海量数据。
实时分析
情感分析可以实时识别关键问题,例如,社交媒体上的公关危机是否正在升级?愤怒的客户是否即将流失?情感分析模型可以帮助您立即识别这类情况,以便立即采取行动。
一致的标准
据估计,人们在判断特定文本的情感时,只有 60-65% 左右的时间会达成一致。根据情感标记文本具有很强的主观性,会受到个人经历、思想和信念的影响。通过使用集中式情感分析系统,企业可以对所有数据应用相同的标准,帮助他们提高准确性并获得更好的洞察力。