就完整的建立起來了。”
“模型建立完畢後,我們還需要對其進行訓練,模型的訓練上,我們建議採用實時訓練,實時訓練省資源並且反饋快,這對資訊流產品非常重要,使用者需要行為資訊可以被模型快速捕捉並反饋至下一刷的推薦效果。”
“我們目前計劃採用基於storm叢集實時處理樣本資料,包括點選、展現、收藏、分享等動作型別。”
“整體的訓練過程是線上伺服器記錄實時特徵,匯入到kaka檔案佇列中,然後進一步匯入資料,客戶端回傳推薦的label構造訓練樣本,隨後根據最新樣本進行線上訓練更新模型引數,最終線上模型得到更新。這個過程中主要的延遲在使用者的動作反饋延時,因為模型推薦後使用者不一定馬上看,不考慮這部分時間,整個系統是幾乎實時的。”
“當然,這會產生非常龐大的資訊資料,我們需要對目前的系統底層做一定的最佳化,完善運維工具。”
趙睿對著自己做的一份介面很是簡陋的演示檔案,對著袁旭和宋瑞一眾人一頓輸出。
袁旭的感覺,嗯,聽不懂,但是看上去,好像挺像那麼一回事的,邏輯能夠自洽。
“那麼,現在的主要問題有什麼呢?”
雖然具體原理聽不懂,沒關係,作為一名合格的老闆,善於提出問題並給予解決才是最重要的不是嗎?
“模型需要找一個場景進行訓練,執行一段時間我們才能發現是否有問題,是否能夠完整的實現我們理論上的理想結果。”趙睿說道。
“我明白了,你們是需要找一個機會來對這個模型進行測試對吧?”
“是的,也不完全是測試,它也需要學習,所以,需要找一個使用者數量比較大的場景進行試驗。”
“使用者數量比較大?”袁旭略一沉吟,“倒也不用多費心,眼前不就有一個麼,愛家網麼!”
作為目前華夏第一大購物網站,愛家網連同愛家商城目前光賣家就有600餘萬,年成交金額高達1.1萬億,合1775億美金。
這不正是推薦模型的最好的試驗場麼?
再者說了,愛家也需要這種推薦模型麼!
“就是在收集使用者資訊方面會有一定的風險。”
趙睿末了提醒了一句。
“模型開始測試前一天,想辦法讓所有的愛家使用者強制下線,重新登入,登入介面增加修改後的使用者協議,協議中註明將會自動收集顧客瀏覽商品資訊,便於更好的對客戶進行
更有針對性的推薦。”
對於個人隱私,袁旭倒不是很在意,收集使用者的資訊並加以分析,這幾乎是所有的網站都在搞的動作,也沒見鬧出來過什麼事情。
為了以防萬一,打個補丁也能說得過去。
然而,接下來發生的事情就讓袁旭有些尷尬了。
這邊剛決定打一個不起眼的小補丁,便於收集使用者資訊被告了之後作為自己已經告知的憑證。
那邊,就有一位“老朋友”控訴天工科技“恃強凌弱”,隨意下架其公司產品。
這位“老朋友”,就是36圈的老闆,周紅衣。
2013年9月10日,教師節。
周紅衣在自己的說說上發了一篇小短文。
“又一次,蠻橫的天工科技又一次將36圈的全部產品全部從其軟體商店中下架,所有使用天工手機的朋友都無法下載和使用36圈公司的產品了。”
從周紅衣的“又”字裡,可以看出,這樣的被下架,並不是第一次了。
2012年的12月,36圈公司的全部7款產品,全部被天工科技方面從軟體商店中下架,原因是運營主管發現那幾天36圈公司的那幾部產品的投