编者按:本文来自“S-Tech”(ID:S-Tech1014),作者 汤甜。36氪经授权转载。
美国队长中的洞察计划通过分析每个人数据:高考考分,学校表现,工作情况,预测他未来会不会对稳定秩序造成威胁。投射到现实世界,一个人听过的音乐、看过的电影,点赞过的微博,教育经历,血型星座…众多的数据都能成为网络人格的组成部分。构成一个由众多网民组成的大数据名片,利用这一点,很多人接受了大数据的‘包办’交友。
《黒镜》第4季《Hang the DJ》,约会成为一个规范化程序,它承诺每一个用户最终会找到完美的伴侣。用户通过名叫Coach的语音助理进行交互。每对夫妇都有一个系统算法预先确定这段关系的失效日期,它可能是几小时到几年的时间。使用者和系统必须通过多段关系的试错,不断提高信息精确度,最后找到匹配率高达99.8%的对象。
Hang the DJ虽然看似遥远,但与现实的差距只在于约会应用与大数据的影响程度,大数据已经开始逐步量化世界。
Viola.ai
Viola.AI作为第一个人工智能驱动的相亲平台,结合人工智能、区块链技术和智能合约技术颠覆了相亲行业,提供了一条龙的婚恋方案,包括约会、求婚乃至结婚。通过13年的数据(3500个数据集,11亿数据点)以及用户提供的社交和婚恋数据来训练AI以达到更好的效果。
(Viola.ai的定位是:Your Lifelong AI Love Advisor)
这个‘恋爱专家’通过分析每个用户的信息以及行为,给用户最贴合的建议,在双方建立恋爱关系甚至结婚后,系统也会通过状态更新,互动模式为情侣提供生活建议,有效告知其如何实现最佳沟通、采取哪些措施、避免哪些做法,所有这些忠告都可在 Viola.AI 中成功地积累起来,有效地用于维护一个人终生的婚恋关系。
很多的在线网站和app宣称可以提升找到真爱的概率:soul,探探,世纪佳缘,matc等平台基于几十个元素,例如基本数据,你完成的心理测试,回答的问题等进行匹配,一些网站甚至问你100个问题,随后关联账号进行细化分析:
通过各大电商的购物记录判断一个人的消费能力和习惯,通过微博、微信等社交媒体的关注圈子以及固定频次浏览的网页大体判断兴趣爱好和价值取向。通过大众点评等生活信息及签到网站,在线频率,大体判断饮食口味、作息、生活习惯等。以此方式建立人物画像依照匹配机制进行推荐。
例如世纪佳缘的 “懂你”系统,根据用户的浏览历史轨迹积累和填写恋爱问卷的数据让用户对恋爱观和价值观有全面的认识,还让用户描绘出一幅心目中女神(或男神)的画像,从而极其个性化、高效率的实现精准速配。
数据显示男性对于大数据婚恋交友平台的使用比女性更积极一些,男士通过线上平台迅速筛选出符合自己期待的女士后会第一时间去联系。而女士相对更谨慎,她们的自我保护意识比较强。
相亲节目也突破性地引入了大数据,大数据专家根据女嘉宾的特点做出专属定制:初入职场有点傲娇小公主匹配情商高,能读懂她内心世界小作的精英男性。
通过分析男女嘉宾个人微博、浏览的网页、喜欢的电影等网络足迹分析其恋爱观、婚姻观、性格习惯等对男女嘉宾进行匹配。基于电视节目的限制,一些栏目组开设了线下婚恋馆,利用节目的海量粉丝和嘉宾资料,提高婚恋匹配效率,通过输入“年龄范围”、“是否生育”、“籍贯”等关键词,系统可为客户自动匹配出契合度较高的相亲对象。
五花八门的软件形成了多样的兴趣爱好的用户群体,知乎小程序中的大数据匹配,网易云中的用户社交,都给了交友一种新的可能。游戏作为高度社交化的平台,也利用大数据进行用户匹配,如2012年成立的捞月狗,玩家可查询自己在热门游戏中的角色数据,捞月狗借此获取了大量用户资料,再经由大数据分析,便可以找到相同服务器,游戏职业水平相当的玩家进行匹配。
通过大数据的推送更能在这些非社交软件中找到与自己兴趣相投的人,不过相比于交友平台,这种推荐更为简单,需要用户的主动性与自主筛选。
大数据交友平台通过对基本信息的细分项进行筛选,结合双方的测试数据,网络行为客观地分析筛选出适合人选,快速提供符合用户期待的对象,节省了盲选聊天的过程。基于大数据算法中很多容易量化的因素,选出的两人合拍的概率确实会更大。
某婚恋网站的用户说:“不管怎么样,大数据还是靠谱的,家里人介绍的话,我也不好意思说得太细太多,也比父母去什么相亲公园要好。”
在大数据时代,你的网络足迹隐瞒不了过往,而过往便可以一定程度上勾勒你的人格(至少是网络世界的人格)。
对于社交日益网络化的年轻人来说,大数据便是从前的‘红娘’,匹配便是一次小型相亲,只不过更加快捷,用户更加庞大。双方用户在认可大数据匹配的前提下无疑创造了很多成功的案例。
大数据在交友选择阶段通过数据分析匹配合适的人选,但在这些数据和计算之后的结果会导致更好的匹配吗?
首先在匹配机制上,一些软件和平台利用相似度作为标准。但婚恋匹配涉及身体特征、社会人口统计学特征、个性心理等方面,有相似性匹配和互补性匹配两种假说,因此个性习惯的一致并不是积极恋爱关系的决定性因素,有时甚至会起到相反的作用。
以soul为例,用户带上平台提供的虚拟形象,进行一系列心理测试,首页的用户星球会显示昵称与匹配度,通过机器人找到相似度高的用户。但体验者表示:“心理测试没有强制性要求你完成到什么程度,而且相似度的匹配并不适合我,我比较内向慢热,匹配到的异性也是这样,聊天很尴尬,我希望找到一个与我差异较大性格互补对象。”
其次,多数平台会通过贴标签的方式来进行交友互选,标签本身是很好的过滤器,两个“中医粉”或者两个“反中医”在一起都能免去不少无谓的口水之争,某种意义上价值观相近其实就是由一个个具体“标签”——或者说侵入大脑的一个个具体“模因”的“兼容”程度所体现。
一方面感性的东西很难量化和利用标签来归纳。很多人在网络上的自我定位并不准确,这便质疑了一些标签的信度。拿幽默来说,单一的自我评价很难达成双方的一致。
体验者表示:“我喜欢幽默的人,但选择了这个标签的对象后发现,完全不是我想象中的那样,他们自以为很幽默,但实际上都是在说一些无聊的段子罢了。”
气质情感价值观等感性的东西也无法量化测量。而在长期择偶策略中,人格特质等感性因素的比重加大。这些特质很难精准体现在数据中。
另一方面,95后,白羊座,本科学历,爱电影,这些限制标签的匹配让爱情错过了很多的尝试与惊喜。爱情本身是一个充满未知的变数,当利用标签定位到某个群体,也许便错过了一些更加适合自己的体验。感情的线上线下的处理存在着差异,有些人号称需要一些硬性指标和条件,对方一定要具备怎样的经济实力,身高一定要超过180,但真正相处时也许并不是必要条件。
一些婚恋公司甚至将着眼基因数据。有研究表明两人成为夫妻,不仅因为投缘,基因也更加匹配,因此基因信息将成为婚恋网站匹配度算法的重要依据。但当一切的匹配向着结婚,家庭,后代倾斜,却可能与soulmate的标准渐行渐远。‘金童玉女’‘门当户对’或许适合婚姻,但从来都不是爱情的标准。
当每个人以几种标签的方式展现在社交平台上,相恋的过程便被颠倒了。恋爱是一个从认识到逐渐了解相知相守的过程。而标签匹配交友是反过来,先设定双方合适,这不利于逐渐培养感情。在这个翻转的过程中,恋爱成为了一个充满鄙视连的生意场。高学历,95后,收入过万,颜值高……这些标签作为系统里的重要组成部分也逐渐将匹配用户划出了等级。
婚恋交友平台采集用户数据的真实性和安全性是一个重大的隐患。采错数据嫁对郎的可能性虽微弱但也存在。如果基本的数据都是虚假的,后续的发展便可能是空欢喜甚至是被欺骗。
心理测试与问卷的不足也会导致信息的偏差:OkCupid的用户要回答非常多的问题如“若你知道某人曾吸过毒,你还和他交往么”“看到陌生人随地乱扔垃圾你第一感觉是?”OkCupid试图通过用户的“自我暴露”来勾勒三观,但这些倾向性明显的问答,用户可以轻易作出不符合自己实践处理方式的答案。
也许这是基于对人性的悲观和不确定性,但一个人的生活的确比他的自我描述更加值得信赖。
你的QQ登录及在线时间,作息时间规律,票务网站信息,甚至是上色情网站的频率都有可能在未来成为匹配中的一个因素。
为了更准确的匹配,就需要更多的摘取个人数据,这很容易引发个人信息的泄露,信息安全形势依然严峻的情形下,信息安全问题在大数据相亲中表现得愈发明显。
黑镜最后,所有的simulations在完成模拟后便消失了,汇集成手机屏上的一个数字。男女主角看着手机上显示的“成功率99.8%”的配对结果走向对方——他们终于在现实世界中第一次相见了。
当人们不用再纠结的选择,乐天知命地利用大数据红娘进行匹配交友,便可以按照最可预测的脚本和最优的编码进行,当大数据足够精准与强大,不需要猎头直接定位求职者,不需要中介直接定位‘国民好室友’,或许也可以定位到想要恋爱的人,但soulmate无法用数据衡量,权且将大数据当作一种增加可能性的途径,不排除也不依赖,或许是最好的态度。
回头看Hang the DJ的歌词“他们放的音乐并没有告知我半点和我生活有关的事情”似乎又是一种最大的讽刺。
参考文献
[1]荀雅童.浅析大数据在现代婚恋中的运用[J]. 《法制博览》 , 2017 (18)
[2]陈诣.浅谈婚恋交友网站的心理测试[J].《科教文汇》, 2008 (35) :281-281
[3]李北辰.大数据下的未来婚恋会是怎样? [J].《李北辰》
[4]张秋丽,孙青青,郑涌.婚恋关系中的相似性匹配及争议[J].《心理科学》, 2015 (3) :748-756
[5]钱如梦.爱情也玩大数据 你hold住吗? [J].《幸福(婚典)》, 2015 (2) :7-10
[6]牛文静.甜蜜的对抗:婚恋网站的模式之争[J]. 新世纪周刊. 2008(24)
[7]刘佩,罗利娜,肖素吟.美国婚恋交友网站发展及服务模式研究[J]. 中国青年研究.
2008(04)
[8]蔡佩爽.苍穹之下被大数据改变的生活图景[J].《数字商业时代》, 2013 (12) :28-31
[9]肖成俊,许玉镇.大数据时代个人信息泄露及其多中心治理[J].《内蒙古社会科学(汉文版)》, 2017 , 38 (2) :185-192