在第6届社会计算、行为文化建模与预测国际会议上,MIT媒体实验室的研究小组发表了一篇论文。论文称,通过分析用户的手机通话记录可以预测其性格。
这个研究小组的成员包括Yves-Alexandre de Montjoye、Jordi Quoidbach、Florent Robic及Sandy Pentland等人。研究者首先找到了100位学生,通过填写调查问卷的方式来确定其大五人格(OCEAN)类型。所谓的大五人格是指人格心理学中的一场革命,研究者通过词汇学的方法,发现以下五种特质大约可以涵盖人格描述的所有方面:
开放性(O):想象、审美、情感丰富、求异、智能
谨慎性(C):胜任、条理、尽职、成就、自律、谨慎
外向性(E):热情、社交、果断、活跃、冒险、乐观
随和性(A):信任、直率、利他、依从、谦虚、移情
神经质(N):焦虑、敌对、压抑、自我意识、冲动、脆弱
在确定了学生的人格以后,研究人员开始检查这批人2010年3月至2011年6月间18个月的通话记录,从中找出下列的元数据:
含通话数在内的电话使用情况
活跃的用户行为,包括呼叫次数,回短信的时间等
位置,或者用户移动的距离有多远,在多少地方拨号过等信息,即所谓的活动半径指标。
日常通话的规律性
多元性,即用户的通信录个数以及用户与里面的人通话相对频率之比
确定好这些指标之后,研究者通过机器学习算法来确定每个人的人格类型。最后的结果表明预测的准确率要比随机猜测高得多(见下图)。各种人格类型的随机预测准确率大概在36-39%左右,而利用该模型进行预测的成功率分别达到了63%(N型)、61%(E型)、51%(C型、A型)、49%(O型)。相比之下,预测成功率提高了42%。
上图还说明了预测每一种性格最有用的指标。如活动半径对预测神经质人格最有用,通信录的熵对预测外向型人格最有用等。不过研究者De Montjoye指出,在观测到特定的行为与人格之间并不存在一一的对应关系。比方说,如果活动半径特别大的话也并不能明确表示此人就是神经质人格。但是行为和数据的强度结合起来可以帮助进行人格预测。
考虑到移动手机用户的数量庞大,用户的使用活跃,在海量的大数据支持下,这种预测方法无疑为运营商及各种app打开了新的机遇之门,因为他们可以更加接近于了解用户是什么样的人了。但是对于用户来说又该开始担心自己的隐私问题了。