我們將隨機選擇
可以使用不同的分割,但在這裡,80% 的使用者作為訓練集,其餘的使用者作為測試集。完成此過程後,我們發現我們已將 45211 個總用戶隨機分為訓練集中的 36168 個用戶和測試集中的 9043 個用戶。
模型訓練和評估然後,我們將使用xgboost
演算法 訓練模型。之後,我們將評估生成的模型。雖然 xgboost 的可配置性很高,但為了簡單起見,在今天的範例中我們將主要使用預設值。
首先,我們來看看 AUC(曲線下面積)。這是分類模型(例如本分類模型)的常用指標,它會產生 0.5 到 1 之間的數字。在這種情況下,我們的 AUC 約為 0.73,表明我們的模型性能處於中等水平。在此類用例中這是可以預料的,因為客戶行為永遠無法完全預測。
2×2 的網格在 y 軸上顯示實際標籤,在 x 軸上顯示預測標籤。在 x 和 y 上都有「未轉換」和「已轉換」標籤。
混淆矩陣。
接下來我們來看看
上面的混淆矩陣。縱軸表示測試集中使用者的實際轉換結果,橫軸表示預測的轉換結果。例如,正確預測 7638 位使用者不會轉化,而正確預測 565 位使用者會轉化。預計 314 名用戶會轉化,但最終沒有轉化,而 526 名用戶預計不會轉化,但最終卻轉化了。
雖然這個模型並不完美,但值得注意的是,它可能非常有用,因為我們可以用它來分割。讓我們更仔細地檢查這個用例。
細分 介紹性 ML 教學中 瑞典 電話號碼 通常不會介紹細分
,但它對於充分利用預測模型進行行銷至關重要。讓我們試著將使用者分成 10 個十分位,看看每個細分的轉換可能性有多高。我們如何做到這一點的技術細節可以在筆記本中找到,但我們將繼續討論我們如何處理這裡的結果。我們將使用者分為 10 個十分位,依照模型預測的轉換可能性進行排名。
以十分位數顯示轉換率
的長條圖。 x 軸是 0 到 9 的十分位數,9 有最大的長條圖(最高轉換),0 沒有。
以十分位數描述轉換率的長條圖。
正如我們在這裡看到的,最上面的 SA 編號 十分位(標記為“9”)有大約 60% 的機會進行轉換,而 0-5 的十分位數幾乎沒有轉換的機會。由於我們在發送活動之前就知道這些訊息,因此這些訊息非常具有可操作性。例如,我們可以選擇不向 0 到 5 的十分位數發送行銷活動,而是向 6 到 9 的細分市場發送促銷訊息。
葡萄牙某銀行機構透過行銷資料進行的實際演示,生動地展示了預測模型在行銷中的實際應用,展現了其精準細分和優化資源配置的能力。