可口可乐即将推出的“

Latest collection of data for analysis and insights.
Post Reply
Bappy11
Posts: 351
Joined: Sun Dec 22, 2024 6:03 am

可口可乐即将推出的“

Post by Bappy11 »

步骤 3. 利用大数据和统计的力量
由于科学家知道上述问题并不容易解决,因此他们转向统计科学。要对一个大群体或“人口”做出陈述,您需要取样。您可能不再能达到 100% 的准确率,但是因为您想要达到 90% 的准确率,所以您可以使用所有表达方式中的一小部分。

这正是情绪分析或观点挖掘领域现在正在发生的事情。在某个时候,你分析了来自某个地方、由某一群人说出的大量文档,结果发现你只能从其中 8% 的文档中提取“情绪状态”。但这足以表明整个团体的情况。

红牛品牌的情绪状态
“红牛”品牌被疲惫和沮丧的情绪所包围

乔纳森·哈里斯 (Jonathan Harris) 和塞普·坎瓦尔 (Sep Kanvar) 创建的网站“We Feel Fine”就是一个很好的例子。

步骤 4. 解释找到的信息
如果你只知道某一群人在某一时刻的感受,那么你就还没有到达那个目标。您还想知道他们为什么会有这种感觉,您还想知道他们在谈论什么,如果他们在谈论某事,那么他们对那件“事”有何看法。他们对那“某事”持积极还是消极态度?

12 月份可口可乐的情绪状态

如果你真的想要建立一个实用的系统,你不仅需要确定作者的情绪状态(如果他或她透露了任何有关的信息),而且还要知道他或她在写什么,以及他或她对某事是持积极还是消极的态度。找出答案的方法是一样的,首先创建 保加利亚电报数据 类别,然后在这些类别下挂上单词列表,然后创建带有“指标”的列表来确定消极或积极程度的严重程度。

我们现在在哪里?
文本分析科学近年来发展迅速。任何人都可以想象,如果让计算机代替我们每天读取数千份文件,然后(最好是在一张 A4 纸上)告诉我们,例如,在本周想要买鞋的荷兰人中,有 65% 的人对 NIKE 品牌有好感,80% 的人认为 NIKE 鞋穿起来很舒服,90% 的人认为看起来很酷,35% 的人认为性价比很好,那该有多好。

不幸的是,目前还没有系统可以做到这一点。然而,人们正在进行尝试。我们知道像汤森路透这样的公司,它使用一种名为OpenCalais的服务从文件中提取“事实”。诸如:“在此文档中,我们发现公司名称:NIKE、人名:Michael Jordan、行业术语:Cool”等等。

哪些模式具有预测价值?
通过将事实与文档的其他解释(例如情绪和心情状态)联系起来,可以使模式变得清晰可见。需要进行更多研究来发现哪些模式具有预测价值。无论如何,很明显它不是一个单一的因素,而是不同变量的相互作用,这些变量共同可以说明人们在某一特定时刻对“某事”的想法和感受以及其含义。

许多组织和科学机构,例如SentimentMetrics、SocialMood、 IBM 以及我的公司都在寻找神奇的公式。一旦获得这种洞察力,它就可以被资本化。仍有许多障碍需要克服。知识就是力量,在现代世界也适用。能够将分析技能与市场洞察力相结合,将信息转化为商业建议的数据科学家拥有未来。

照片介绍由 Fotolia 提供
Post Reply