轉(zhuǎn)帖|行業(yè)資訊|編輯:陳俊吉|2016-02-19 13:46:08.000|閱讀 214 次
概述:我們很多人抱怨現(xiàn)實(shí)中約會(huì)很難一下子找到宿命中的人,在線網(wǎng)站也讓找到真愛的幾率變大,操作又容易上手。據(jù)我所知,目前微信,陌陌,探探,世紀(jì)佳緣,match,tinder很多這樣的“嚴(yán)肅”交友(約會(huì))的工具,他們號(hào)稱采用大數(shù)據(jù)建立人物畫像,采用KNN聚合,DNN神經(jīng)網(wǎng)絡(luò),幫你提升匹配率,找到人生幸福另一半,事實(shí)上是這樣的嗎?
# 界面/圖表報(bào)表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
去年看過一篇文章,講如何通過大數(shù)據(jù)找到你的另一半(見參考資料)!里面通過理性建模和精準(zhǔn)定位找到合適伴侶,不過大數(shù)據(jù)真有這么神奇么?我就隨便聊聊約會(huì)APP算法和現(xiàn)實(shí)中策略。
我們很多人抱怨現(xiàn)實(shí)中約會(huì)很難一下子找到宿命中的人,在線網(wǎng)站也讓找到真愛的幾率變大,操作又容易上手。據(jù)我所知,目前微信,陌陌,探探,世紀(jì)佳緣,match,tinder很多這樣的“嚴(yán)肅”交友(約會(huì))的工具,他們號(hào)稱采用大數(shù)據(jù)建立人物畫像,采用KNN聚合,DNN神經(jīng)網(wǎng)絡(luò),幫你提升匹配率,找到人生幸福另一半,事實(shí)上是這樣的嗎?
工作原理
當(dāng)你把你的簡歷在這種網(wǎng)站或者APP更新,一些算法就開始準(zhǔn)備潛在合拍的。然后給你打分,或者隨機(jī)給你幾個(gè)選。而這些結(jié)果基于也許就幾十個(gè),一般你回答幾個(gè)問題,或者你產(chǎn)生的一些行為。基本數(shù)據(jù):年齡、身高…戶口所在地、畢業(yè)學(xué)校、工作單位、家庭狀況。一些網(wǎng)站最厲害的問你100個(gè)問題,什么喜歡的顏色,食物,運(yùn)動(dòng),偶像,喜歡看的書類型,然后開始關(guān)聯(lián)賬號(hào),微信,微博,比如微博、微信等社交媒體的內(nèi)容及更新頻率,QQ登錄及在線時(shí)間,更新發(fā)型頻率,作息時(shí)間規(guī)律,經(jīng)常出現(xiàn)的場所。
這些背后就是對(duì)用戶行為做預(yù)測(cè)和匹配,跟亞馬遜,Netflix去預(yù)測(cè)產(chǎn)品差不多,不同的話Netflix推薦電影給你,電影卻不需要反向去關(guān)注你。下面就介紹一個(gè)有趣的匹配算法。
穩(wěn)定婚姻匹配算法
1962年,美國數(shù)學(xué)家David Gale和Lloyd Shapley發(fā)明了一種尋找穩(wěn)定婚姻的策略,人們稱之為延遲認(rèn)可算法(Gale-Shapley算法)。
為了讓大家相信數(shù)學(xué)家不是真得如此無聊,我要指出它確確實(shí)實(shí)是一個(gè)地道的組合數(shù)學(xué)問題,有其特定的數(shù)學(xué)價(jià)值。當(dāng)然啦,它也有很多別的背景和應(yīng)用,比如用來在若干個(gè)公司和應(yīng)聘者之間進(jìn)行招聘中介……但是數(shù)學(xué)家們?cè)趺磿?huì)放過如此八卦的一個(gè)名字呢?于是它就這樣流傳下來了。
規(guī)則如下:
先對(duì)所有男士進(jìn)行落選標(biāo)記,稱其為自由男。當(dāng)存在自由男時(shí),進(jìn)行以下操作:
①每一位自由男在所有尚未拒絕她的女士中選擇一位被他排名最優(yōu)先的女士;
②每一位女士將正在追求她的自由男與其當(dāng)前男友進(jìn)行比較,選擇其中排名優(yōu)先的男士作為其男友,即若自由男優(yōu)于當(dāng)前男友,則拋棄前男友;否則保留其男友,拒絕自由男。
③若某男士被其女友拋棄,重新變成自由男。
在算法執(zhí)行期間,自由男們主動(dòng)出擊,依次對(duì)最喜歡和次喜歡的女人求愛,一旦被接受,即失去自由身,進(jìn)入訂婚狀態(tài);而女人們則采取“守株待兔”和“喜新厭舊”策略,對(duì)前來求愛的男士進(jìn)行選擇:若該男子比未婚夫強(qiáng),則悔婚,選擇新的未婚夫;否則拒絕該男子的求婚。被女友拋棄的男人重獲自由身,重新?lián)碛辛俗非笈说臋?quán)利——當(dāng)然,新的追求對(duì)象比不過前女友。
這樣,在算法執(zhí)行期間,每個(gè)人都有可能訂婚多次——也有可能一開始就找到了自己的最愛,從一而終——每訂一次婚,女人們的選擇就會(huì)更有利,而男人們的品味則越來越差。只要男女生的數(shù)量相等,則經(jīng)過多輪求婚,訂婚,悔婚和再訂婚之后,每位男女最終都會(huì)找到合適的伴侶——雖然不一定是自己的最愛(男人沒能追到自己的最愛,或女人沒有等到自己的最愛來追求),但絕對(duì)不會(huì)出現(xiàn)“雖然彼此相愛,卻不能在一起”的悲劇,所有人都會(huì)組成穩(wěn)定的婚姻。
這個(gè)是數(shù)學(xué)界切切實(shí)實(shí)研究過的問題。對(duì)于以前沒有接觸過這個(gè)問題的人,這個(gè)理論最出人意外的結(jié)論是:傳統(tǒng)的求愛,結(jié)婚過程是male-optimal的,也就是說,男性能夠得到盡可能好的心上人,女性卻不然。這就是所謂的穩(wěn)定匹配問題(StableMarriageProblem,也叫穩(wěn)定婚姻問題)。
真的行得通嗎?
那么問題來了,這些數(shù)據(jù)和計(jì)算之后的結(jié)果會(huì)導(dǎo)致更好的匹配嗎?我想還是不行。這些約會(huì)工具越來越多,成功的反而越少。伯克利大學(xué)還做過調(diào)查,比如說美國人只有5%是從網(wǎng)上認(rèn)識(shí)建立長期關(guān)系(only 5 percent of Americans in long-term partnerships met online. )
那個(gè)報(bào)告說了幾點(diǎn)有意思的,個(gè)性習(xí)慣的相同對(duì)健康的兩性關(guān)系也沒啥幫助。就算算法再復(fù)雜,也對(duì)找到合適對(duì)象沒多少幫助,除非你把可能遇見的人數(shù)增加。
但最麻煩的還是用戶會(huì)說謊,對(duì)他們多高,多重,收入,年齡都可能是瞎扯,如果給你選擇年薪3萬,30萬,在沒有任何信用的情況下,你選哪個(gè)?或者你隨便填個(gè)數(shù),你怎么不上天呢?這樣建立起來的模型有什么意義?
還有一點(diǎn),有些人號(hào)稱需要一些硬性指標(biāo)和條件,一定對(duì)方多高,多有錢,多牛逼,但真正相處,也許就不會(huì)這么要求了。然后就發(fā)現(xiàn)那些把錢放在考慮第一位的人,照樣dating藝術(shù)家或者彈吉他的。
有些交友網(wǎng)站,讓你去填個(gè)問卷調(diào)查,什么心理分析,性格色彩,MBIT,喜歡的電影,(還有要填政治理想的!)如果拿這些作為匹配可能是誤區(qū),但換一個(gè)思路,通過用戶的活躍度和發(fā)布的朋友圈來做。那么這就得去監(jiān)控用戶行為,后臺(tái)將這些動(dòng)作作為依據(jù)去迭代模型。
到底約幾次才能找到真愛?
這是個(gè)有趣問題,老派的約會(huì)方式是去本地的PUB,比如你有1%的可能性對(duì)方同意要約,你得去100次才能搞定一個(gè)。而作為另外一方,應(yīng)該用什么策略來接受約會(huì)邀請(qǐng)?其實(shí)根據(jù)博弈論,拒絕掉前37%的你想要約會(huì)的人,然后挑選下一個(gè)出現(xiàn)的比前37%都要好的人。令人驚訝的是,你最終將找到真愛的幾率為37%,具體計(jì)算過程不展開了,參考文檔在最后。
約會(huì)APP和其他方式
其實(shí)通過這些網(wǎng)上APP,你極大增加曝光率,因?yàn)槌刈哟螅€可以加過濾,來個(gè)快速排序:)總體上這種方式未必浪漫,但高效啊。還有哪些方式去約呢,比如公司同事(讀到一個(gè)調(diào)查1/3的公司員工,包括上下屬約會(huì)也占很大比例),書店(聽說高曉松老師剛開的書店還促成了眷侶),微博(我一個(gè)程序員朋友就這樣認(rèn)識(shí)他愛人后來結(jié)婚了),甚至微信公眾號(hào)留言都有可能。。。
最后啊,大數(shù)據(jù)能不能幫你找到對(duì)象,我還是持懷疑態(tài)度的,大數(shù)據(jù)是理性推理的工具,但人心是很善變的,女人心更是海底針,只能感慨一下:就算知道了所有的道理,還是過不好這一生。
via:微信公眾號(hào) 董老師在硅谷
2016企業(yè)革新方案大放送,慧都聯(lián)合IBM為你量身打造大數(shù)據(jù)專屬解決方案!詳情請(qǐng)咨詢在線客服>>>
本站文章除注明轉(zhuǎn)載外,均為本站原創(chuàng)或翻譯。歡迎任何形式的轉(zhuǎn)載,但請(qǐng)務(wù)必注明出處、不得修改原文相關(guān)鏈接,如果存在內(nèi)容上的異議請(qǐng)郵件反饋至chenjj@fc6vip.cn