欧美日韩午夜_五月天激情综合_国产精品久久久久一区二区三区_色女人av_国产福利av_欧美日韩中

下一代推薦系統:多目標學習如何讓知乎用戶互動率提升100%

2024-8-7 10:56| 發布者: 木材制造者| 查看: 445| 評論: 5

如今,推薦系統已經在各行各業中有所應用,在知乎,推薦系統更是一項核心功能。
據了解,目前知乎的推薦系統主要分為兩部分:一部分是首頁信息流的個性化推薦;另一部分是在各種用戶場景,比如問題路由、相關推薦等等功能上的推薦。
在這些場景下面,知乎用到的技術并不是完全一樣的,所采用的技術架構也并不相同,張瑞告訴記者:主要還是根據用戶場景來決定使用什么樣的架構和技術。
在首頁的個性化推薦里,主要采用的技術包括:對圖文內容、視頻內容的基本的識別和畫像,對用戶的畫像,以及圖文內容和視頻內容里面的實體識別以及關聯,張瑞表示這些都是基礎的組件;而上層在召回排序環節則大量的采用了 DNN,也就是深度神經網絡技術。
由于平臺的發展,早先單純以圖文為主的交流方式已經不足以讓用戶滿足,于是知乎平臺上也出現了不少視頻、音頻的內容,但是文字依舊占據了大量的比重,這對于知乎的推薦系統來說是個好事兒。
為什么這么說呢?張瑞解釋道,圖文推薦系統和其他推薦系統的區別在于:目前的 AI 算法技術對圖文內容的理解會比視頻和音頻多媒體更加深入。而且對于絕大部分公司來說,在圖文推薦系統中對圖文內容本身做深入理解,從成本上也是可接受的。這種理解不只是從用戶的交互入手,或者把一個圖文內容看成單個、原子的 item,而是更深入的去了解某篇圖文到底講的是什么、它的質量是什么樣子等等一系列的信息。所以其實相對于商品推薦、視頻推薦等等領域,圖文推薦會有更多的信息可以使用。
“當然現在業界在做圖文推薦系統的時候,也會使用到這些信息。”張瑞說:“大家在這一領域的競爭還是很激烈的。這個激烈就在于:每家公司對圖文內容的刻畫、選擇的維度都是不一樣的,能做到的深度也是不一樣的,而這個維度和深度本身就決定了圖文推薦能做到用戶的體驗的上限有多少?!?br /> 為了提升用戶體驗的上限,知乎推薦系統也經歷了升級改造。
知乎最初的推薦系統版本非常簡單,僅僅是根據用戶的關注行為進行推薦,比如有新的話題出現,用戶一旦關注了就推薦給 TA 相關的內容,不關注就不推薦。此外,推薦的排序也是非常簡單的,就是依靠時間流,即使后來引入了 EdgeRank 之類的簡單的算法,做到的也僅僅是時間、文本內容質量等相關的權重的一個簡單的信息加權。
隨著新用戶的進入,研發團隊發現:在 Feed 流推薦場景下,用戶都是越來越“懶”的,大部分用戶希望不進行繁瑣的操作,就能得到非常好的推薦結果。于是,推薦系統團隊針對性的進行了一些優化,比如:在召回環節,引入更多根據用戶的行為來召回內容的方式;在排序環節,把用戶的各種行為,以及內容的各種細致刻畫都引入進來,通過 DNN 神經網絡進行排序,無論是老用戶也好,新用戶也好,整體上去優化他們的體驗。



知乎多召回源融合的推薦結果生成框架
從效果來看,新的系統上線了之后,對比最初的版本,分發量等等指標基本上都增長了至少三倍。

多目標學習的推薦系統
知乎 CTO 李大海曾經在去年的一次演講中提到了“多目標學習”的推薦系統,據了解這也是知乎優化推薦系統的一個方向。那么這個“多目標學習”該如何解釋呢?
張瑞告訴我們,一般來說在搜索和推薦等信息檢索場景下,最基礎的一個目標就是用戶的 CTR,即用戶看見了一篇內容之后會不會去點擊閱讀。但其實用戶在產品上的行為是多種多樣的。尤其在知乎,用戶可以對某個內容進行點贊,可以收藏這個內容,可以把它分享出去,甚至某個問題如果他覺得比較符合他的興趣,想去回答,也可以進行一些創作。
雖然可以對用戶的 CTR 進行單個目標的優化,但是這樣的做法也會帶來的負面影響:靠用戶點擊這個行為推薦出來的內容并不一定是用戶非常滿意的內容,比如有人可能看到一些熱門的內容就會去點擊,或者看到一些閱讀門檻低的內容,像一些引發討論的熱點事件、社會新聞,或者是一些輕松娛樂的內容,用戶也會點擊。這樣造成的后果就是:CTR 的指標非常高,但是用戶接收到的推薦結果并不是他們最滿意的。
后來,知乎的產品研發團隊發現:用戶的每種行為代表在一定程度上都代表了某個內容是否能滿足他不同層面的需求。比如說點擊,代表著用戶在這個場景下,想要看這個內容;贊同,代表用戶認為這個內容其實寫的很不錯的;收藏,代表這個內容對用戶特別有用,要把它收藏起來,要仔細的再去看一看;分享,代表用戶希望其他的人也能看到這個內容。
而單目標 CTR 優化到了一個比較高的點之后,用戶的閱讀量雖然上去了,但是其他的各種行為(收藏、點贊、分享等等)是下降的。這個下降代表著:用戶接收到太多的東西是他認為不實用的。
于是,推薦系統團隊陷入了思考:能不能預估用戶在其他行為上的概率?這些概率實際上就是模型要學習的目標,多種目標綜合起來,包括閱讀、點贊、收藏、分享等等一系列的行為,就能綜合到一個模型里面進行學習,這就是推薦系統的多目標學習。



"多目標"預估模型


與所有的系統類似,知乎的多目標推薦系統最初也是一個比較簡單的版本,僅僅是給各個目標學習一個模型。這種情況下,模型本身的訓練和在線預測的負擔就會非常嚴重,每一個模型的訓練和預測都要耗費同樣的資源,這樣對于工程資源壓力是非常大的。這些模型之間還有互相的交叉、驗證;每個模型還需要評估,離線評估一遍,在線評估一遍,之后再合并... 林林總總的行為加起來,對研發資源造成的負擔是非常大的。
所以,在多目標推薦系統的第一版做出來之后,團隊就在考慮:能不能使用模型之間共享一些參數的方式,或者共享模型本身以及訓練流程的方式,來減少在訓練上的負擔,以及它在工程成本、研發成本上的負擔?
以此想法為基礎,團隊做出了一個能夠在底層共享相關參數,在頂層根據各種模型、目標本身特點而學習的特有的神經網絡架構,張瑞說,這套架構中參考了很多現有的多目標學習的研究進展。
雖然解決了一部分問題,但是把多個模型融合在一起,通過一個模型去學習一個目標的方式依舊存在問題。
首先,目標之間的相關性決定了這個模型學習的上限能有多少。比如:如果一個模型中點贊和點擊是完全耦合的,那么這個模型在學習點贊的過程中,也就學習了點擊。但是對用戶來講,它的意義是不一樣的,這并不是一個完全耦合的系統。
在這個學習任務下,如果去共享底層網絡參數的話,可能會造成底層的每個目標都能學習一點,但是每個目標學習的都不夠充分,這是多目標學習系統實現的一個難點。為了解決這個問題,研發團隊參考了 Google 發表的一篇論文,叫做 Multi-gate Mixture-of-Experts,簡稱 MMOE。
MMOE 的核心思想是:把底層的網絡劃分成一些專用的模塊,雖然底層參數是共享的,但是通過目標和網絡參數之間的一個 gate(門)來學習,讓每部分網絡充分學習到對每個目標的貢獻最大的一組參數結構,通過這種方式來保證,底層網絡參數共享的時候,不會出現目標之間相互抵消的作用。
張瑞告訴我們,經過嘗試之后,交互層面的預估子任務的 AUC 值得到了至少千分之二的提升,在模型的主任務也就是預測閱讀的任務中,AUC 也沒有下降。上線之后,取得的效果也是非常正向的。
張瑞還跟我們同步了一些數據。從數據來看,在引入多目標學習之前,知乎的預測模型已經做到了非常高的準確率,在引入多目標學習之后,或多或少都會對閱讀行為有一定的負向作用:多目標學習在上線以來,閱讀行為下降了 2% 左右,但是用戶的其他行為(比如點贊、收藏、評論、分享等),分別提高了 50%~100%。
如果看最直接關系到用戶體驗的數據,也就是用戶的留存率,上線多目標學習之后,知乎的整體用戶留存率大概提升了 5% 左右。“對于任何一個推薦系統來說,整體的用戶留存率能提升 5% 都是非常高的收益。”張瑞補充道。
至于用戶反饋,張瑞告訴我們,現在知乎有一些固定的渠道方便用戶提供反饋。他告訴我們:“在引入多目標學習之前,我們接到的最多的反饋就是用戶覺得在 Feed 流里,內容越來越淺顯。這些反饋主要來自于知乎的重度用戶和一些比較老的用戶,他們對知乎的期望都是非常高的,希望知乎能夠把一些特別有用的知識帶給他們。之前,機器的優化閱讀會帶來一些反向作用,有用戶覺得知乎推薦的內容雖然都特別抓人眼球,但實際的用處并沒有那么大。在新的推薦系統上線之后,很多人表示 Feed 流里面的內容質量變高了,用戶沉浸式的體驗感變得更深了?!?br /> 引入多目標學習的推薦系統在知乎已經收獲了不少的正面效果,但是張瑞表示,團隊目前遇到的一個令人困擾的問題是:多個目標中,到底以什么樣的方式去對目標進行權衡和融合,才能得到用戶收益和平臺收益的最大化?
打個比方,用戶其實在 Feed 流里面消費內容的時候,他期望的并不是非常單一的場景,系統提供一些供消遣而淺顯的內容,閱讀量會上漲,但是用戶會覺得體驗不好;但如果推薦的全是一些收藏率特別高的內容,對于用戶來講,雖然這類內容非常有用,但閱讀起來會很累。
張瑞說:“對于平臺來講,我們最關注的是用戶在 Feed 流的場景下面的體驗如何。這直接關系到我們用戶的留存和用戶的活躍。”
所以現在知乎在嘗試一些解決方案,包括對用戶進行分群,看某個群體的用戶最在意的是什么樣的內容。但這是一個通過產品經理,或者通過人的觀察來確定的事情,比如說某些領域的重度用戶會特別在意推薦的內容對他們有沒有用;一些輕度的用戶,他們來到知乎的主要的目的是為了輕量閱讀,一些易于消化的內容對他們更友好。
對用戶分群之后,就可以動態調整每個目標的權重,給出一個最終的排序。這對于推薦系統當然是有收益的,但是張瑞認為在現在還沒有一個非常完善的方法來判斷,什么樣的群體、什么樣的目標,他們之間以什么樣的比例去進行融合,從而給最終全局一個最好的收益。
現在業界的各種推薦系統的方法,大家都會去預測 CTR(點擊率)、預測 CVR(轉化率),預測各種各樣行為的概率,但是很少有公司去做預測用戶的留存。這也是整個推薦行業,或者說推薦技術圈面臨的一個挑戰:所有的這些行為概率,都是用戶體驗的一個方面,不能代表用戶體驗的整體最優,那么,用什么樣的方式能夠給用戶的體驗帶來最大化的收益,依舊是業界目前面臨的一項挑戰。張瑞認為,通過多目標學習來間接的達到這個目標,間接的達到全局最優化,對于提升用戶體驗也許是一種解決方式。

原文轉自:https://mp.weixin.qq.com/s/J0j9NwSNhxab6bXqBBzaUw
分享到:
您需要登錄后才可以回帖 登錄 | 立即注冊

本版積分規則

交流熱線
17501437970 周一至周日:09:00 - 21:00

創贏網-致力于幫助普通人在創業之路上披荊斬棘、走向成功的專業網站,匯聚創新智慧與成功機遇的網絡天地,是創業者開啟贏之征程的首選之地。

Powered by Discuz! X3.5 © 2023-2050 CHUANYING Team.

QQ|Archiver|手機版|小黑屋|創贏網 ( 湘ICP備17022177號-3 )

GMT+8, 2025-5-21 07:13 , Processed in 0.300276 second(s), 26 queries .

快速回復 返回頂部 返回列表
主站蜘蛛池模板: 精品一区电影国产| 91久久精品一区二区别| 97精品久久| 在线看一区二区| 久久福利精品| 欧美在线高清| 亚洲欧美国产一区二区三区| www.麻豆| 日韩最新av| 欧美日韩在线视频一区| www.色网| fc2性色av久久精品| 午夜av导航| 亚洲五月| 国产精品色在线网站| 亚洲欧洲激情| 国产精品店| 不卡视频免费在线观看| 欧美二区在线播放| 成人免费在线网站| 在线欧美日韩| 国产亚洲精品美女久久久| 91久久精品一区二区二区| 伊人在线| 日韩在线www| 99只有精品| 欧美性猛交一区二区三区精品| 91精品综合久久久久久久久久久| 男人天堂网在线| 日韩色网站| 久久女| 国产精品第| 亚洲成人在线网| 国产性一级片| 毛片aaaa| 国产传媒久久| 在线日韩| 亚洲免费毛片| 超碰在线免费看| 91在线免费播放| 国产精品久久久久久久免费大片|