编者按:本文来自微信公众号“青亭网”(ID:qingtinwang),作者:Esther,36氪经授权发布。
眼睛是心灵的窗户,可除非是最先进的机器学习算法,能够解释眼球运动与人格之间关系,不然你乍一看其实什么也看不出来。
注:人格包括五大类:开放性、责任心、外倾性、宜人性和神经质或情绪稳定性,而近日出现了一项人工智能能够准确识别后四种。
近日,澳大利亚南澳大学与德国斯图加特大学联合开发了一个项目,即使用人工智能技术,通过苹果旗下计算机视觉公司SensorMotoric Instruments(SMI)的基于录像的头戴式眼球追踪技术追踪并监控42名有效测试对象的眼球运动。据了解,SMI的这个眼球追踪技术的刷新率为60Hz,视线预测准确度为0.5°,精准度为0.1°。
在测试中,追踪器能够记录视线数据,而测试对象身上背着的智能手机能够录制高分辨率的现场视频。随后,科研人员将搜集到的数据交叉对比测试对象在后期完成的专业人格调查问卷结果。
这个科学实验的测试对象包括50名澳大利亚弗林德斯大学的学生,包括42名女性和8名男性,平均年龄为21.9岁。
科研人员给测试对象戴上眼球追踪器后,追踪器会启动3点追踪矫正程序。之后,科研人员会发给测试对象5澳元,要求他们在校园走动10分钟左右,并从校内商店买一样喜欢的东西,然后回到实验室交还测试数据与设备,并填写性格与好奇心调查问卷。
青亭网了解到,测试对象将回答三份自测问卷:第一份是NEO-FFI-3大五人格测试,包含60道问题,评估之前提到的五大人格。第二份是感知性好奇测试,包含16个问题,评估人类面对特殊感官刺激与视觉感官审视的兴趣。第三份是CEI-II好奇心和探索精神测试,包含10个问题,评估好奇心强度。
实验中除了一名参者因为技术问题丢失数据,其他结果若因检测不到瞳孔或者视线方向超越150%范围的结果,都会被标记为错误。因此,50名测试者中有6人因为测试样本中超过50%错误率被排除在研究结果外,还有一名参与者因为样本中38%的视线方位都一样也被排除在外。
科研人员在处理数据时,使用了滑动窗口算法,这样既能分离每个时间段的测试结果,也不会忽略平均化效应对眼球活动特征的影响。不过,这些科研人员预先并不知道滑动窗口算法选用哪种窗口大小最有效,也不知道哪种特征比较有用,因此他们选择了名为嵌套交叉验证的自动匹配法,优化人工智能训练师使用的开放参数,即窗口大小和特征的选择。
在研究中,科研人员使用了三种分数范围中的F1分数来评估分类器。R范围的F1分数的定义是精准度(对随机对象的真实个性分数范围R预测刚好与实际的R匹配的概率)和召回(对随机对象的真实个性分数范围R预测刚好包含在世纪R范围内的概率)的调和平均数。因为随机森林分类器的训练过程本身就有不确定性,因此科研人员使用不同初始随机状态,重复进行了了一百次嵌套交叉验证。
图中显示了科研人员利用分类器测试出的平均F1分数,对比每个人格基础。可以看出,高于机会水平的人格F1分数为:神经质40.3%、外倾性48.6%、宜人性45.9%、责任心43.1%、直觉好奇心37.1%。而开放性(30.8%)和好奇心与探索精神(27.2%)的结果低于机会水平。
此外,每个I型标志代表在平均值周围的95%可靠区间,而虚线代表分类器为每个参与者随机挑选一个人格分数范围计算出的理论机会水平,不受眼球行为影响。
研究报告中表明,这是人类第一次使用眼球运动来识别人格,这项有趣实验的最终目的是改善未来人与机器之间的互动。
为了评估分类器的可靠性,科研人员将每段录像、每次参与者进入和离开商店的情况都进行手动备注。然后他们将测试结果与不同的数据自己对比:
不受参与者活动支配的数据(录像分为两部分:折半);
同一活动中的数据(去商店路上与回到实验室路上:way I和way II);
两个活动之间的数据(找商店路上和进入商店:shop和way)。
科研人员将每一个分类器都训练并评估了一百次,因而计算出100对预测结果,然后他们在调整了相关系数抽样分布的偏差值后,利用没对预测结果之间的平均关系,和费雪转换法评估了分类器的可靠性。
下方图表为计算出的皮尔森积差相关系数,范围从0.39到0.83,显示出了不同真实环境之间中度到高度紧密的相互关系。
此外,科研人员还按照随机森林模型计算出随机森林分类器中所有人格的相对重要性,而每个随机森林分类器中都包含几个决策树。在单一的决策树种,一个人格的重要性由所有基于该人格做出的决策来定义:参与者做出的决策越多,平均分类误差就越小,在树形结构中决策使用的数据就越多,决策基于的人格就越重要。
上图展示了以人格为中心指定的分类器中最重要的特性,上半部分显示了每个人格中十大特征的重要性,并且都按照中位数来排列。下半部分显示了之前研究数据中,与性格或者好奇心相关的更多特征。
表格代表从训练后的100个模型中提取的特征重要性的分布,每一个方框的范围涵盖了四分位数间距(IQR),而I型标志代表了嘴笑道最大的范围,蓝色的条形代表了中位数。另外,每个分类其中,没有使用的特征,其重要性为零。
南澳大学的Tobias Loetscher表示:“人们不断需求更完善、更人性化的服务,不过现如今的机器人与电脑并不善于社交,因此不理解非语言线索(如眼神和肢体语言)。有了这项研究,科研人员便可以开发行为更自然、更善于理解人类社交讯号的机器人和电脑。”
通过结果表明,本次实验具备两大意义:
1,这是首次证明个人的神经质、内向与外向、环境是应用、责任心、好奇心水平可以通过追踪眼球运动来预测分析,这个发现对于实验室的相关研究起到了非常重要的作用。
2,进一步阐明人格特质与眼球运动之间的密切关系,本研究的目的并不是要阐明某些眼部运动特征在特定性格类型中更为常见的潜在原因。相反,它被专门设计用来探究机器学习是否可以用来区分日常工作中眼睛运动的个性。