目前網(wǎng)易花田對數(shù)據(jù)的挖掘體現(xiàn)在三個方面:

1、基于用戶公開顯示的基本資料,在后臺為用戶貼標簽。

年齡、身高、職業(yè)、收入、擇偶要求等這些用戶公開顯示的資料,最直接反映用戶的個人現(xiàn)狀和擇偶期望,但讓用戶自己去發(fā)掘的時間成本很高。網(wǎng)易花田通過對這些數(shù)據(jù)進行挖掘分析,為全平臺的用戶主動推薦匹配度較高的人選。另一方面,由于用戶規(guī)模足夠大,數(shù)據(jù)分析結(jié)果還能夠基本反映出大眾的擇偶要求,比如:年齡22歲的男性用戶尋找的異性年齡段一般在18-22歲之間——這些普遍性數(shù)據(jù)也在用戶匹配中占有部分比重。

2、挖掘用戶的行為數(shù)據(jù),建立用戶的。

網(wǎng)易花田每日活躍用戶中超過30%會產(chǎn)生互動行為:例如點擊感興趣異性的頁面,對異性動態(tài)發(fā)表“贊”或評論等。用戶互動作為一種隱式反饋,相比用戶填寫的資料更加細致,能夠更精準的反映出用戶對什么類型的異性更感興趣。一般情況下,雖然用戶的擇偶要求較明確,但基于比較泛的篩選條件,一些隱含要求比如購房、購車、名企、名校等沒有表達出來,而網(wǎng)易花田通過對用戶行為數(shù)據(jù)的分析能夠得到更精準的用戶興趣模型。

3、分析用戶Q&A數(shù)據(jù),為你推薦真正情投意合的人。

Q&A是網(wǎng)易花田推出的一個問答題庫系統(tǒng),通過設(shè)置價值觀、興趣愛好、生活習(xí)慣、愛情觀等分類問題,讓用戶參與答題。目前花田平臺預(yù)設(shè)300道QA題,已經(jīng)有20%左右的用戶擁有Q&A數(shù)據(jù),平臺用戶答題量數(shù)據(jù)達到千萬級。網(wǎng)易花田對Q&A數(shù)據(jù)的分析,能夠發(fā)現(xiàn)兩個異性之間在生活習(xí)慣、價值觀、興趣愛好等方面的契合度,建立數(shù)據(jù)模型,促使用戶快速找到溝通的話題。

此外,花田技術(shù)團隊正試圖通過自然語言處理技術(shù)和語義分析方法來解碼用戶性格,實現(xiàn)“軟硬兼施”的精準推薦。首先,他們運用切分詞方法,從用戶的“內(nèi)心獨白”中提取出現(xiàn)頻率較高的關(guān)鍵詞;再將這些關(guān)鍵詞分類,如感性詞匯或理性詞匯;最后,通過文本分析、語義分析,從中挖掘出用戶的性格是內(nèi)向、外向、理想化還是現(xiàn)實派等等。這一技術(shù)目前還在測試中,2013年下半年會逐步投入使用。屆時,宅男“定制”女友將擁有除3D打印機之外的另外一條可行之路。

分享到

wangxueyang

相關(guān)推薦