用紅杉資本思維:NMN茶葉數據探索與優化利用之間的權衡。

用紅杉資本思維:NMN茶葉數據探索與優化利用之間的權衡

在『讓人欲罷不能的產品』系列上一期我們介紹了參與度的基本概念,以及News Feeds和Content Production背後的魔力。本文將繼續圍繞參與度討論用戶連接的重要性,分析各個內容庫存級別的含義,以及介紹即時動態排序的考慮因素和關鍵指標。

本文研究成果來自紅杉美國數據科學團隊,Jamie Cuffe、Avanika Narayan、Chandra Narayanan、Hem Wadhar 和 Jenny Wang 對本文亦有貢獻。以下是部分要點摘要:

▨ 增加恰當的用戶連接有助於提高參與度。

▨ 識別『需要關注』的用戶、確保他們的使用體驗,有助於軟件獲得長期成功。

▨ 了解不同用戶庫存內容的閱讀量和可見性,有助於為用戶提供更好的服務,進而改善產品整體質量。

▨ 庫存、信號、預測能力越強大,平臺上帖子的相關性就越強。

▨ 要模擬的不是數據,而是人們在數據中表現出來的行為。

用戶連接與庫存

發展一批內容創作者後的下一步是要確保他們能夠吸引粉絲。和粉絲的連接性越強,能提供的粉絲庫存內容就越多。這種聯系不局限於親朋好友,與名人、新聞欄目、社群等可以創造、分享內容的群體聯系,也能增加庫存內容。

因此,產品團隊應將連接性較低的用戶標記為『需要關注』,鼓勵他們與其他用戶互粉、關注名人和新聞欄目以及加入社群。辨別『臨界點』也很重要,隻有加深了解,用戶才更有可能繼續使用產品。比如,Facebook就努力確保新用戶在十天內至少能與七名用戶產生聯系。當然,隻有這七名用戶平常發佈的內容有意義、有吸引力,這一點才能實現。

剛開始使用軟件的10天裡,關注的數量很重要:如果一開始,用戶的關注數量沒有達到最低值,他們就很有可能卸載軟件。

連接性需要關注一些關鍵指標:

▨ 好友比例VS社群聯系VS發帖數量:在不同階段,各種類型的聯系對不同的人來說十分寶貴。要了解這一點,就要結合他們使用軟件的時長和登錄頻率。

▨ 參與聯系的數量:不是所有聯系的意義都相同。和親密朋友間的交流,與很少使用的社群聯系相比,可能更珍貴。

▨ 活躍聯系用戶組數《比例》:了解特別的活躍聯系數量和其發展形勢也很重要。

每位用戶和發佈動態的朋友、名人、新聞相關聯時,他們的庫存內容也會相應增加。庫存的重要性可見一斑,因為它直接影響了用戶可消費的內容數量,從而影響了軟件使用時長。在即時動態的環境裡,所有用戶的內容庫存就是這些用戶發佈的內容,以及這些內容所產生的與其他用戶的聯系,這對閱讀體驗《見下圖》和廣告收益產生了影響。

如果用戶的動態僅他們可見,大多數情況下,他們就是自己的讀者。所以,庫存內容少的用戶閱讀比例就大,但絕對閱讀量維系在較低狀態。另一方面,如果用戶能看到的內容過多,他們就沒有時間閱讀所有內容。接下來我們討論四種主頁類型——庫存內容非常少、庫存內容少、庫存內容多、庫存內容非常多。

▨ 庫存內容非常少

如果用戶庫存內容非常少《每日更新內容少於10條》,他們上線之後很可能會閱讀所有可見內容。這也是大多數用戶首次使用產品、連接性較低時會遇到的場景。如上所述,產品團隊會將這樣的用戶標記為『需要關注』,向他們推送相關聯系人和有趣的內容。在這種情況下,內容評級顯得沒有意義。隨著時間的推移,如果他們主頁更新的內容仍舊很少,這些用戶基本上就不會再使用這款軟件。

▨ 庫存內容少

用戶庫存內容少《每日更新內容少於50條》的原因有很多:同樣使用這款軟件的好友不多、系統推送了錯誤的關聯用戶。如果吸引用戶的內容少,參與度可能也會受到影響。如果這樣的用戶能夠閱讀大部分可見內容,系統就可以把握這個機會,向他們推送更多的類似內容。相反,如果庫存內容少的用戶沒有閱讀所有可見內容,反映的則可能就是他們對軟件本身的參與態度。

▨ 庫存內容多

通常情況下,庫存內容多《即每日更新內容超過50條》的用戶與朋友、新聞、群組的關聯程度更高。他們往往閱讀更多的庫存內容、登錄軟件更頻繁、使用軟件的時間更長。這些用戶的日活躍參數或月活躍參數值也相對較高,能夠定期使用產品。等級算法能夠有效提高這組用戶的參與度,因為他們不會閱讀主頁中所有的可見內容。還有很重要的一點,是要深入了解他們喜歡的內容,推送比例準確的社交、娛樂、資訊文章。

▨ 庫存內容非常多

屬於這個類別的用戶,他們的庫存內容比其他用戶都多《每日更新超過200條》,他們通常會閱讀更多的內容,但是閱讀的主頁可見內容比例相對較少;他們能夠接觸到的內容比實際會閱讀的內容量要來得多。和主頁多內容的用戶一樣,評級對維系、提高他們的參與度來說是十分重要的。

庫存需要關注的關鍵指標:

▨ 庫存可見內容數量

▨ 連接數

▨ 對可見內容的閱讀量

▨ 閱讀的推送數量

▨ 受庫存內容限制的用戶比例

關注庫存指標時,根據國籍、性別、連接類型《朋友、名人、工作夥伴、社群》、內容類別《文本、視頻、照片等》、發佈系統《iOS、安卓、電腦桌面》來給數據進行分類,可以清晰地表現庫存的運行模式。

即時動態排序

即時動態的目的是突出顯示用戶認為相關性最高的帖子。這主要是通過調整帖子出現的順序來實現的,而這種排序又至少會在一定程度上受到公司戰略和使命的影響。想要正確運行即時動態排序系統,必須了解每個用戶可用的帖子總量《庫存》,收集與用戶及其發佈內容相關的信息《信號》,然後使用這些信號去預測用戶行為《預測》,並確定每個帖子對每個用戶的重要性《相關性》。帖子的相關性得分將決定其在具體用戶的即時動態中的顯示位置。

因此,有效的排序系統必須包括可以為每個用戶進行相關性評分的預測算法。例如,用戶是更容易對其童年時期相關的帖子產生關聯,還是更喜歡看關注的大V發佈的內容。

庫存

用戶的庫存包括了他們能夠從關注的好友和博主看到的所有帖子。對於『庫存受限』或庫存非常少的用戶,排序就不太必要,因為他們有機會消費所有可用內容《無論他們會不會真的看完》。而關注了大量好友、大V和其他博主的用戶將擁有更大的庫存,可能每天幾千個帖子,並且可能無法全部消費。對於這些用戶,相關性的評分排序至關重要。

信號

信號包含用戶的所有可用信息及其在內容方面的偏好,可幫助預測用戶是否將參與特定帖子。下面列出的問題舉例說明了什麼是信號。但請注意,這隻是一部分,每一類信號底下還有數百個信號。產品團隊應該研究可以為產品提升參與度的所有信號。

是誰發佈的內容?

其中一組信號與內容制作者的信息相關。以Facebook為例,這條動態是來自用戶的好友、主頁還是群組?用戶之前和帖子作者互動的次數越多《進行點贊、評論、標簽、點擊、訪問個人資料或主頁等操作》,就越有可能參與這篇帖子的互動。

▨ 好友

好友的親密程度如何?他們最近是如何成為好友的?好友是否屬於連接數量很少的『有需要』用戶?

▨ 粉絲主頁

用戶對粉絲主頁內容的興趣如何?用戶最近對粉絲主頁的關注和/或點贊情況如何?用戶是否將該粉絲主頁設為『優先查看』或『獲取通知』?如果主頁由新聞機構運營,是否為用戶所在地的機構?

▨ 群組

用戶對該群組的參與度如何?最後一次互動是什麼時候,采取了什麼行動?

是什麼類型的內容?

Facebook的排序算法向用戶展示更多他們經常參與的內容類型。例如,如果你更喜歡對照片進行點贊、評論,不怎麼關注狀態更新,那麼你會更經常看到照片的更新。

▨ 原創與非原創

內容是來自用戶的好友或家人的個人帖子,還是鏈接或重新分享?在Facebook的即時動態上,原始內容更有可能出現在頂部或頂部附近。

▨ 格式

帖子是視頻、文字、圖片還是組合?文字有多長?圖片有多大?視頻有多長?

▨ 分類

內容是社交類、資訊類、娛樂類、交際類,還是協作類?內容的趣味性和價值往往因人而異。

▨ 其他分類

內容是不是標題黨或者假新聞?是不是『垃圾消息』?在Facebook上,這類帖子可能會被排在後面,不太容易被用戶看見。

內容何時發佈?

發佈時間越近,用戶就越有可能看到它,特別是如果他們經常與你的產品互動。對於訪問頻率較低的用戶,即時動態可以優先考慮突出『重點內容』,例如重大生活事件和重大新聞報道,而不是最新帖子。

▨ 帖子是什麼時候發佈的?

▨ 是重復《或真實》的帖子嗎?

內容得到了什麼樣的用戶參與?

用戶參與帖子的次數越多,無論是隱性參與《比如,花費時間》還是顯性參與《比如,點贊和評論等操作》,就越有可能認為它有價值,而其他用戶也就越有可能認為它有價值。因此,即時動態排序通常會優先考慮具備『爆紅特質』或高參與度的帖子。

▨ 帖子的參與度如何?是得到某種反饋《點贊、評論、反應、認同等》,還是在帖子上花費或停留的時間?如果是評論,那麼評論需要多長時間,這種參與是否構成真正的對話?

▨ 帖子的參與增長有多快?

▨ 哪些用戶參與這個帖子,是否會刺激這些用戶去生產內容《例如,轉發分享》?

▨ 哪種類型的參與以及哪些用戶會激勵制作人再次發佈內容?

▨ 這份帖子的參與度是否高於其他帖子《考慮所有其他變量》?

我們對用戶了解多少?

每個用戶根據性別、年齡、設備類型、網路連接狀況等因素有著不同的參與度。因而用戶信息對於向特定用戶推薦合適的帖子來說極具參考價值。例如,對於一個使用舊手機接收即時動態、網路條件不好的用戶來說,提供高清視頻不太可能帶來良好的體驗。

▨ 用戶的個人統計信息是什麼?

▨ 他們的網路連接狀況如何?

▨ 用戶擁有哪些設備?這些設備有何特征《內存、存儲、速度》?

預測是藝術,也是科學

一旦獲取信號數據,就可以更好地預測用戶可能會采取的行動。用戶過去的行為可用於預測未來的行為,因此機器學習模型不僅可以確定用戶是否喜歡帖子,還可以確定他們是否會點擊、評論、分享、隱藏或甚至將其標記為垃圾。綜合這些評估數據,就可以根據帖子/用戶的匹配單獨生成一個相關性得分,表示用戶可能對帖子感興趣的程度。平臺庫存中的每個帖子都有了分數後,排序算法就可以按照得分順序排列對該用戶顯示的內容。

由於多種原因,這種預測有一定難度。像點贊和評論等參與行為隻能粗略地代表用戶的真實感受,例如,用戶可能會點贊自己並不真正『喜歡』的帖子《例如某人死亡的消息》,可能在點擊後才發現不滿意,可能隱藏帖子純粹是為了『管理收件箱』。同樣,遵循某些信號可能會讓你提高內容的病毒性而不是質量,就像在不斷給用戶投喂『裹著糖衣的毒藥』,最終可能會使他們拋棄你的產品。

因此,重要的是要注意確定哪些預測能夠告訴你相關性得分,以及在多大程度上能夠做到這點。選擇正確的數據信號組合既是藝術,也是科學。

相關性

每個帖子/用戶匹配的相關性得分不僅應該反映從信號中獲得的預測信息,還應該反映即時動態的優化功能。你可以根據公司的目標和使命,優化任意數量的指標,例如花費的時間、會話數量或點擊率。例如,Facebook根據即時動態的價值進行排序,將好友和家人的動態擺在大V和主頁動態的前面。你還可以通過優化來支持某種策略;例如,選擇突出新產品而不是舊產品,以鼓勵新產品的成長。

優化函數應為每個預測分配權重。在下面的示例中,P《贊》表示某一用戶點贊某個帖子的可能性,a、b、c、d、e則是分配給每個可能性的權重:

可以使用測試、試探、定性等方法等確定每個想要調整的指標《如,花費的時間》的權重。你還可以為某一特定類型的用戶使用不同權重。

產品考慮因素

即時動態是一種權衡。是否應該展示更多視頻而不是文字?評論是否比點贊更有價值?內容制作是否比內容消費更重要?了解和計算這些權衡的比率能提供不少幫助《例如,觀看Y個視頻的用戶生產自己內容的可能性降低X%》。

探索與利用

你應該對已經了解的用戶行為進行優化《利用》,還是去嘗試了解更多你不知道的內容《探索》?也就是說,用戶可能會重視的帖子應該占多大比重,而他們沒有嘗試過的帖子又該占多少?這是所有排序算法的基本問題,並沒有簡單的答案。在大量庫存的情況下,探索與利用之間的權衡尤其具有挑戰性,尤其是在庫存過多,但卻沒有足夠的信號來對帖子進行排序的時候。在這種情況下,利用可能會帶來長期問題。必須定下一個標準;否則可能會去優化一些不能真正最大化參與度的因素。例如,可以通過用戶體驗調查來了解用戶是否逐漸對目前展示的內容感到厭倦,以把握好用戶層面的利用和探索之間的平衡。

沒有足夠的數據

無論你如何精心構建算法,總會存在你沒有的數據。用戶對早餐的選擇是怎樣影響他們想要閱讀的內容?用戶隱藏帖子是因為不喜歡,還是隻是因為已經看完了?用戶積極評論帖子是因為喜歡還是生氣?算法的目的不是單純地去對數據進行建模,而是要用數據來模擬人們的行為,而人類又太過於復雜,以至於任何算法都難以進行全面綜合的建模。產品團隊應該嘗試獲取其他相關數據來推斷人們的興趣。

沒有完美的優化

類似地,預測算法被設計為對給定的一個或多個指標進行優化。但是,這些指標永遠無法完全捕捉到公司目標和使命的精神。因此預測和相關性得分是遠遠不夠的。預測算法可以用來預測美網,計算每位選手的獲勝概率,但在即時動態環境中,『勝利』不是一個離散的、可測量的結果。排序算法可以幫助預測用戶是否以及如何與帖子進行互動,但不能預測這種互動是否真正為你的使命服務。

病毒性傳播和標題黨

即時動態環境通常有利於任何類型的交互,特別是高速交互。因此,『標題黨』帖子通常比其他帖子獲得更多傳播。產品團隊應該尋找創造性的方法來抑制這種影響。例如,你可以去識別隻有標題黨常用的關鍵詞。也可以去尋找同一內容創作者頻繁使用的關鍵詞,然後采取適當糾偏措施。

長期與短期

理想情況下,你的產品應該作長期優化,但大多數算法的優化隻有短期效果。例如,通知提醒可能在一開始會讓用戶更頻繁地回到即時動態,但最終它會讓用戶厭煩並使他們不太願意回到你的產品。雖然長期指標通常更難以衡量和優化,但它們對於理解產品決策的最終影響非常有用。應當了解這類信息,找出參與度可帶來長期利益的帖子並擴大其影響《例如,用戶好友的婚禮照片》。

用戶體驗指標

滿意度調查、凈推薦值和定性反饋對於制定策略很有幫助,但難以優化。主要原因是這些數據通常很零散,無法實時獲取用於產品優化,也無法代表整個用戶群《並需要進一步的偏差校正等》。因此,你需要尋找與產品中的調查類型指標相關的可測量的替代指標。

排序內容類型

對某些指標進行優化將有利於某些類型的內容,例如,對花費的時間進行優化會有利於視頻內容的顯示,因為觀看視頻往往比瀏覽文本內容消耗更長時間。相反,優化所查看的帖子數量將會突出文本內容。要解決這個問題,你需要尋找有效的方法來規范數據以糾正偏差。此外,還要從戰略角度看待你的產品——你希望產品未來發展方向是視頻還是文本?