原创翻译 | 大数据如何更改在线约会

算法

模型

大数据

Hadoop

机器人

大部分年轻人会认为在度过快乐时刻的Chainsaw Sisters Saloon是目标丰富的环境。这个地方人满为患,饮料也很便宜。主要是,“走运”的几率很低。根据经验,千禧一代知道,酒吧爬行是为了娱乐,但不是低比例的交配仪式,浪费时间又古旧。如果你想认识一个人,有许多约会应用程序和网站可用。

拥挤的空间

浪漫在线约会的主要提供者包括eHarmony, Chemstry.com和Match.com,他们都承诺建立长久的关系。像JDate.com这样的小众网站(专为犹太单身人士服务)、BlackPeopleMeet.com(为非洲裔美国人提供联系)、ChristianMingle.com (为基督徒寻找具有相似价值观的单身人士)和OurTime.com(面向50岁以上的约会者)提供了同名的消费者价值主张。

Tinder是第一移动竞技场上无可争议的领导者。还有很多其他的产品,但连一个应用程序都比不上Tinder的市场份额。Zoosk,OkCupid和Hinge都是小众的玩家的应用,如The League(“策划”成员必须被选择加入),Bumble(必须由女性开始交谈),Happn(基于地域的约会)和JSwike(犹太Tinder)都拥有自己的使用者。

迷人的数据

根据伯克利信息学院(Berkeley School of Information)的一项调查,十分之一的美国人利用手机应用或约会网站,23%的美国人曾遇到过长期伴侣或配偶。事实上,只有11%的美国夫妇在网上认识并生活了10年或更少的时间。

匹配度的增强。在2009年,47%的人承认在线约会能让你找到更好的伴侣;而2013年这个数字上升到了53%。网上约会是一种与人见面的正确方式吗?在2009年,44%的人说“是”,而在2017年,59%的人说“是”。

大数据和数据科学的结合真的是爱情吗?
据克里斯汀·布朗(Kristen v . Brown)在一篇文章中引用的专家的说法,答案是“不”。她在那篇文章中说,没有人肯定约会网站做了更多的事情,而不是加强潜在的合作伙伴。在约会网站,匹配的算法主要是mirrors 和smoke 认为事情是不可预测的

不同的数据科学家解释了他们对约会的计算方法。eHarmony的首席技术官Thod Nguyen解释了它作为一个兼容性匹配系统的主张,其中包含“高度复杂的三层流程”。兼容性匹配模型能够识别出两个人之间通信的前景,最后,匹配分布模型保证了eHarmony“在正确的时间向正确的用户提供正确的匹配,并在整个活动网络中提供尽可能多的匹配”。

虽然这实际上可以作为匹配策略,但双向性是固有的问题。当亚马逊为你推荐一台相机时,它在这件事上没有发言权。对人类来说,这不是真的。有些人可能是你的理想伴侣,但有很多原因让你感觉不可能是相互的。所有的约会算法都有一个公理:女孩和男孩天生就会被彼此吸引,并试图繁殖(否则,我们就不会在这里了)。

多重否定等于肯定

在链锯姐妹沙龙,问题不在于很低的赔率,而是需要长时间的投入才能取得成功。要想完成任务,平均来说,你需要去100次酒吧里,才能完成把某人带回家的几率为1/100的任务。这给大数据在Match.com约会中的作用带来了一个小小的转折,并渴望得到与你的浪漫伴侣的匹配,否则,你可以简单地玩数字游戏。

大数据与数据科学的结合导致交易流量呈指数增长

Tinder在节省时间。通过在酒吧游荡,它提供了一个指数上升的机会。尽管如此,为了提高他们的效率,有动力的程序员设计了Tinder机器人。少许 Tinder机器人利用博弈论,其他机器人利用蛮力,而特征面利用数据科学来实现其目标。

Utilizing Data Science to Date the Ideal Model

Justin long, a contributor and a consulting deep learning engineer, has provided on his own blog, the code for “Tinderbox,” a Tinderbot that exploits the APIs of Tinder and utilizes Eigenfaces to construct an invariant model of the face you are intuitive. You can be under the impression that it is your “ideal model”, a model consisting of all the characteristics that you love most. Justin Lang also utilizes Stanford NLP to help the bot examine the sentiment of chat responses. The program has learned enough to begin making choices for you after about sixty manual swipes at a speed you couldn’t replicate possibly.

利用数据科学确定理想的模型
Justin long是一个贡献者,也是一位深度学习工程师,他在自己的博客上提供了“Tinderbox”的代码,这个Tinderbot利用Tinder的api,利用特征脸构建一个你直观的面部不变模型。你可能会觉得这是你的“理想模式”,一个包含你最喜欢的特征的模型。Justin Lang还利用Stanford NLP帮助机器人研究聊天反应的情绪。这个程序已经学到了足够多的东西,可以达到六十手动刷的速度,以你无法达到的速度来做选择。

大数据试图在网上寻找爱情

为了找到你理想配对,网上约会声称融合了科学数据。难怪除了OkCupid、eHarony和Match.com这样的通用网站之外,网上约会的世界里也有很多专门的约会网站,他们都在根据许多因素(例如宗教、年龄、生物特征、收入)寻找匹配的人。

说到信任,这个行业还有很长的路要走。皮尤研究中心的一项研究显示,54%的网上约会者认为有人在他们的个人资料中错误地描述了自己,而且他们自己是正确的。约有81%的网上约会者描述了他们的年龄、身高或体重的错误信息。他们也可能在性和收入方面撒谎,而利用过时的照片是一种非常普遍的做法。

大数据和数据科学探索未来,现在和过去的在线约会。在判断预期日期时,用户依赖什么数据?交友网站的匹配算法是如何发挥作用的?要找到理想的匹配,你如何优化你的配件?所有这些问题都可以用大数据和数据科学来回答。

在线交友在今天蓬勃发展,但这些算法真的能用来预测爱情吗?网络爱情现象背后有许多积极的事实。

事实

在访问一个在线交友网站后,在线约会的用户平均花费22分钟。每周,他们都会参与以电脑为基础的在线约会活动12个小时。有66%的人通过约会应用或网站和他们认识的人约会,23%的人通过这些网站结识了长期伴侣或配偶。今天大多数人都坚信网上约会这是一个更好的满足人们需求的方法,它使他们能够找到理想的匹配。美国年收入为75K美元或者更多的人群中有57%都认识一个在线约会的人。40%认识一个通过网上认识伴侣或配偶的人。11%在网上相识的美国夫妇已经在一起十年或更短的时间。54%的在线约会参与者认为有人在他们的个人资料中歪曲了自己。28%的在线约会者都被他们通过这些在线交友网站或应用程序遇到的人骚扰。

算法

OkCupid将其算法公之于众,而其他交友网站则不然。

OkCupid的专利算法

当成员回答问题时,OkCupid将了解到:

成员的答案

该成员希望对方回答的方式

这个问题对成员有多重要

一个百分比的分数分配给成员。它计算出他们是一个很好的匹配的概率。

对于匹配算法的使用,一直有很多批评:

限制预测池并不能提高成功率。

这些网站呈现给会员的几率不详,这与在酒吧遇到陌生人没有什么不同。

对于网站,我们不知道人们在线下是如何交互的。

算法不能解释强烈的心理问题。

一些研究人员指出,人们被他们意识到与他们相同的其他人所吸引,但这一发现与使用匹配算法的交友网站无关。两人在填写相应的问卷时,并不知道对方的存在,因此无法报告感知到的相似性。因此,这总结了大数据在交友网站中所扮演的角色。

英文原文:https://datafloq.com/read/How-Big-Data-Changed-Online-Dating/3117

欢迎加入本站公开兴趣群

软件开发技术群

兴趣范围包括:Java,C/C++,Python,PHP,Ruby,shell等各种语言开发经验交流,各种框架使用,外包项目机会,学习、培训、跳槽等交流

QQ群:26931708

Hadoop源代码研究群

兴趣范围包括:Hadoop源代码解读,改进,优化,分布式系统场景定制,与Hadoop有关的各种开源项目,总之就是玩转Hadoop

QQ群:288410967

;