推薦不是預測,推薦是有依據的,預測是扯淡的。今天本文來談兩種“推薦”和一種類似“預測”的推薦。其實不管推薦也好還是預測也好,都是有依據的。
一、最早我是這樣喜歡上“推薦”的
豆瓣。
不得不再次解說一下豆瓣:大約05年接觸到這個網站,來自于好友推薦。吐槽:也許這就是早期“朋友圈”這個概念了,北漂時很孤獨、很空虛、很無助,從小城市來到大城市什麼都感到很新鮮,新鮮到都不知道什麼是好什麼是壞的,於是“朋友圈”對你的無節操推薦你都會迫不及待的嘗試一下。
那時為何我們想不到做這麼一個應用呢?,所以說有句負能量的話很對:”你只需看著別人精彩,上帝對你另有安排”。(我認為愚鈍的我,就算上帝對我有所安排,也體會不到)
回到正題:當我在豆瓣上看了一大堆書評和影評後發現以後想看什麼“似乎豆瓣已經知道了”。因為在它的首頁上已經顯示出“猜你喜歡”,而且非常精准。
接下來的日子是我用c#實現“猜你喜歡”演算法,於是各種余弦相似性、修正的余弦相似性、協同過濾演算法被我瘋狗般的實現了一遍,並用在了公司某電商項目中。
花絮:
1、最近有個專案也需要用到推薦演算法。我又開始複習舊功課了
2、我還是打算做一個“猜你喜歡”,來給使用者推薦資訊或購物
3、我一個朋友建議我做一個“猜你媽喜歡”的功能,比“猜你喜歡“更簡單更暴力,更能符合電商“創新”法則。我很認同的昏倒了
關於余弦相似性:
如果不明白這個演算法的人,我們可以理解為向量夾角。每一個向量就是每一個人對某個事物的喜好程度和打分,向量之間的夾角越小說明你和某人相似度越高。通過這個基本原理,只要你對某個商品進行了打分,那麼我立馬可以找出和你興趣愛好很類似的用戶,於是我會把他們的興趣愛好商品推薦給你。理論上講,能夠中你的興趣度很高。
點評:
這種推薦來自於大資料的挖掘。樣本資料越大結果越精准。不光是電商,資訊類門戶如微博都會使用類似這種演算法思路實現推薦。譬如你經常會在微博上看到“可能你感興趣的人“,我大致看了看,確實命中率在60%以上。
二、微信朋友圈推薦
微信的到來讓我們欣喜若狂,其朋友圈很是讓人耳目一新。大約有那麼幾周時間,我天天能看到微信朋友圈裡分享技術、互聯網新聞、涉yellow段子、各種節操商品購物推薦、各種養生知識。
其實,這叫“被動推薦“,不需要任何演算法。凡是”朋友“推薦的東西總能讓你感覺”可能會很美好“。
事實上時間久了我發現:
1、技術知識由於格式問題,在微信裡看根本不適合
2、互聯網新聞還不如看微博
3、涉yellow段子都是看了無數遍的重複段子
4、商品購物推薦基本要麼是爛貨要麼是吭貨,還有誘導點贊
5、養生知識很多都是假的。
於是,我在微信中把一些“無節操、無腦”推薦的好友給遮罩了。因為,有些東西我不需要他們的推薦。逐漸開悟的民眾也許已經能自己“判斷是非”了。
點評:
這種推薦無節操、很暴力。不可否認的是興趣愛好類似的小眾群體中進行的“推薦”,轉化率很高。只不過持久性不足,其效果太容易大起大落。
三、統計學推薦
大家知道為神馬星座這麼准?
網上說,其實它是一門統計學,把各個出生年月日的人物性格統計出來(我不知道是何方神聖統計的),然後大部分人都會與其有所對應,畢竟用統計學的話不符合的都是少數。
這裡我舉個小案例,讓大家知道利用統計學做推薦的“魔力“:
假如我是一個詐騙團隊頭目,最近缺錢花,今年又是2014世界盃,於是我想到了一個辦法來騙錢。方法如下:
首先假設世界盃已經開始了,第一場是巴西對中國
1、買一萬個信封,分成兩份,前五千份寫上巴西贏,後五千份寫上中國贏。落款是:宇宙級世界盃超精准預測推薦小組。然後在開場前把1萬份信都寄出去。
2、規則很簡單。如果用戶收到的預測信是正確的,請關注信封上印的“二維碼公眾號”,並回復1,這樣他們下一場比賽還會收到我們的預測資訊(不過,用的不是再是紙質信封,而是微信公眾號直接發預測推薦結果,節約成本),不關注、不回復則不再發資訊。
2、於是巴西和中國正式比賽有一萬個人會收到我的信。接下來就是他們興致勃勃的看球賽。我們假設結果是中國贏,於是收到“巴西贏”的5000人會把信當場撕掉。一邊罵我是2B一邊還可能打電話報警。不過這些我都沒問題,我已經準備了多部手機號碼了。不過可喜的是,另外5000人會關注我的微信公眾號,並回復“1”,然後殷切的等待下一場預測結果。
3、假設第二場是:美國VS朝鮮。於是,我針對這5000人再次分成兩組,一組2500個人發“美國贏”,一組2500人發“朝鮮贏”。
4、後面的結果大家也能猜到了。繼續會有2500人“取消對我的關注”,另外2500的人對我開始“有點崇拜”。
5、以上步驟反復類推,經我估算,大約關注人群減少到150人左右時(大概進行了5次預測推薦),這150人絕對會是我的忠實粉絲(瘋狗般的崇拜我),很忠實,因為他們連續5次獲得的推薦結果都是和真實比賽是一樣的。
6、下面一次的預測結果我就不會和以前一樣了。而是發送一條文字資訊“本團隊為全人類主宰級、宇宙級、恐龍級推薦團隊,我們的推薦必然會得到god一樣的驗證,如果您需要再次獲得下一場比賽的結果,請向XXX帳號支付XXX元,你將會一如既往的得到我們的服務”。最後,別忘了提示一下:我們推薦的結果可以用來“賭球“
7、好吧。我可以很負責任的告訴大家,這150個人必然會有90%的人匯款給我。並期待下一場結果
8、大家要問後來呢?我想說還需要後來嗎?捲舖蓋逃跑了。換個微信號、換個城市繼續吧
極其嚴肅的申明:以上辦法請勿模仿,僅僅為讓大家學習統計學的推薦原理,模仿後造成的後果本人一律不負責。
點評:
不要小看統計學推薦。他經常被用於一些“自媒體電商”,“特定行業人群電商”。做法更簡單、更暴力,只不過他就像“數學謎題”一樣,大部人會繞進去。
譬如我再舉個例子:
早期國外有個電商網站,特點是每天賣一種商品。於是每天有幾萬人上來看到底是啥商品,其中一半人喜歡一半人不喜歡。根據上面的案例反復類推。最終網站積累了幾千種子用戶,因為他們發現這個網站每天推的商品都是他們喜歡的,很有愛、很開心。於是,多年後該網站搖身一變變成了針對一些特定行業、特定領域使用者群服務的真正的電商網站。
結論:
這裡不下結論,防止對大家的思維產生固化。思考一下、想一下。換種思維海闊天空。