預測業績、銷量不一定是資料科學家才能做的事情。
資料科學家更多的是做更精細的預測,比如說個人化的推薦預測等等。
商業情境上的預測有時候未必用到資料科學所謂的「建模、模型」,甚至是資料科學的模型沒有辦法滿足我們數據不夠、但又還是必須預測的狀況。
商業分析也會「建模」,但我們更多的是拆解對於預測目標有意義的項目,針對未來項目的調整跟變化 (質化),來量化預估未來的銷量 (量化)。
我會把商業分析式的預測模型,簡稱為將質化目標,轉變成量化的結果,讓所有人可以有一個清楚、簡單、奉為圭臬的數字目標!
資料科學的預測模型是什麼?跟商業分析模型有什麼差?
資料科學的預測方式 (或稱為機器學習 Machine Learning) 在進行預測時:
- 通常會先透過資料前處理:特徵工程 (挑選有意義的指標)、資料清理、資料轉換
- 再挑選適合的模型進行訓練:常見的有監督式學習(Supervised Learning) 或是非監度式學習(Unsupervised Learning)
- 訓練完成後,進行回測 (看模型準不準):模型可以利用現有的數據進行預測,並且統計預測結果
機器學習的預測,在業界,通常被用在哪裡?
這種預測方式通常被應用在個人化推薦、自然語言處理、影像辨識等等的領域!我會簡單的解釋一下為什麼這些領域一定需要機器學習的參與?
- 在個人化推薦、自然語言處理和影像辨識等領域中,機器學習的模型可以幫助我們自動地識別、分類和預測
- 在個人化推薦中,機器學習的模型可以分析使用者 (每一個個體) 的歷史購買行為、瀏覽記錄和個人偏好,從而推薦最符合他們口味的商品。這是一般的商業分析模型不能做到的!
商業分析預測模型是什麼?
底層邏輯公式 = 過去的趨勢 + 未來的潛能
- 用過去的數據、對於未來策略的預估,來預測未來的銷量或業績
- 過去的數據,我們可以知道季節性 (seasonality)、原生成長率 (organic growth, baseline)
- 未來的策略有可能在過去有做過類似的行動方案,可以用過去的數據來幫助推測未來即將做的策略所帶來的增長 (incremantal)
- 如果用一個簡單的公式來形容預測模型:過去的趨勢 (baseline) + 未來的潛能 (incremental) = 對於未來的預測
商業分析模型的應用?
- 在商業情境上的預測,並不一定用到資料科學所謂的「建模、模型」!
- 商業分析者更多的是拆解對於預測目標有意義的項目,針對未來項目的調整跟變化 (質化),來量化預估未來的銷量 (量化),以建立商業分析預測模型
- 例如,商業分析者可以透過拆解目標,找出過去的趨勢,並拆解未來潛能的預估,以此進行預測
商業分析預測方式適合的情境?2 種商業分析場景舉例
我根據我商業分析師在公司中的經驗,分享 2 個最常見也最好理解的案例!如果你希望成為商業分析師,你的作品集、你的工作經驗,都可以試著用這個方法來累積相關的經驗!
簡單來說,商業分析預測模型適合的情境通常是目標與實際之間的距離。
例如,商業分析者可以透過預測目標是否合理,以及行動方案是否能夠達到最終目標,來預測目標的達成。又或者,商業分析者可以透過預測實際的銷量與預計的花費之間的差距,來預測財務狀況
商業分析預測模型的建置通常需要以下三個步驟:拆解目標、建置模型與模型回測,以確保預測的準確性與可靠性!
商業分析預測的 2 種商業分析場景舉例
- 目標 (topline, target) 與實際 (projection, landing) 之間的距離:
- 大部分的工作都會碰到這個問題,如何估算老闆給我的目標是否合理?除了基本的銷量以外,我們準備做的行動方案 (action item) 是否能夠達到最終目標?
- 公司的財務狀況 (profit and loss, P&L)
- 財務狀況 = 實際的銷量 (projection, landing) – 預計的花費 (price-related cost)
- 假設預測的銷量不如預期,而預計的花費太高,就可能讓公司的收益減少
這些狀況不能用機器學習模型嗎?2 個關鍵因素分析
- 商業情境中的預測,通常是在目標與實際之間的距離。商業分析者更多的是拆解對於預測目標有意義的項目,針對未來項目的調整跟變化,來量化預估未來的銷量
- 因素一:商業情境的因素無法完全量化:資料科學家則是透過大量數據及其模型進行預測。但商業分析預測模型有其局限性,因為商業情境中的因素複雜,有些未來的決策,無法做到完全量化丟進模型中!
- 因素二:商業分析的預測可能需要快速並且時間長:之前我曾經跟資料科學家合作過預測平台一年的業績,而資料科學的模型因為無法獲取未來一年內的實際數據,因此預測結果也很差。只有短期的預測結果是合乎預期的!
商業分析預測模型:3 步驟分享
- 步驟一:拆解目標:把目標拆到大方向,然後再一路到細節,讓我們概覽大局 (whole picture)
- 步驟二:建置模型:有了細節的實際情況 (actual),就可以建置模型,讓實際情況可以被計算成未來
- 步驟三:模型回測:檢視預測的未來是否與實際情況吻合,如果不吻合的話,就從步驟一開始重新開始
具體步驟:我如何預測下個月的業績狀況
我以之前在工作中的案例來解釋,我們應該如何預測平台下個月的業績狀況?
步驟一:拆解目標
- 影響業績的要素,我以季節性跟日期類型來舉例:
- 季節性 (seasonality):根據產品類型,會有淡季、旺季的區分
- 星期幾、日期類型 (day type):平日、假日,或是像某些產業類型,會需要細分到周一到周日,甚至是連假、國定加班日都會影響
步驟二:建置模型
- 依照影響業績的要素,準備實際值 (actual),先以實際值來了解現況
- 以模型算出下一個月的影響 (衰退或是彈跳)
- 結合實際值、下一個月的影響,用來預測業績
步驟三:模型回測
- 模型算出來的業績目標,需要經過幾次實際狀況後,才有辦法回測準度
- 有時候我們會誤判要素的重要程度,因此會需要不斷調整模型的參數
- 例如:季節性在相同季節以下的月份,不足以參考;換季時才需要考慮。因此模型在「沒有換季的狀況下」,可以不考慮季節因素
結論:不同的預測情境,可能需要不同的預測方式,沒有一勞永逸 (一體適用) 的方法
自從 ChatGPT 出來之後,AI 又變得更紅了;連帶著資料科學 (Machine Learning) 也跟著更受重視!資料科學可以透過訓練 (需要大量資料跟時間),不斷的自我學習,做出更好的預測,但是,並不是所有的預測都有勞或是能夠使用資料科學的模型!
大家務必在預測之前,思考目標、思考這個模型的運算方式,選擇對的方法來預測,否則在不懂模型的背景下,胡亂套模型,只會做出準度不高的預測,這對公司也不會帶來幫助!
如果你的領域也需要做類似的預測,或是你希望未來的工作能夠做到這樣的預測,我推出的【STEP 數據分析師轉職培訓班】中,會一步一步帶你從了解部門領域知識、到工具應用、學中做,做出對業界有意義的預測專案,最後透過領域面試的撇步,挑到理想工作,有興趣的話,一定要預約我的諮詢會議,確認我的課程是否能幫到現在的你!
Pingback: [數據分析#0] 數據分析文章導覽 - Lisa Wu 理紗豆苗工作室