在諮詢的時候,滿常有同學提到,「老師~我不是統計系的,可以做數據分析的工作嗎?」
其實,對,數據分析當中,會用統計學來幫忙驗證數據的可用性,但是我個人認為,統計只是幫助我們驗證這些指標、數據堪不堪用,不是說,只要學了統計模型之後,碰到 A 套 A,碰到 B 套 B,就可以做好數據分析,沒有那麼簡單 XD
因此今天特別來幫大家整理一下,既然沒有那麼簡單,那數據分析師最常用到的統計觀念有哪些?為什麼會用到這些觀念?
我會用「行銷數據」跟「統計」之間的案例,來幫助大家更好理解!
數據分析跟統計有關係嗎?
數據分析和統計是有關係的!數據分析的核心就在於用數據來幫助我們做出「合理的判斷」。你不用是統計專家,但了解統計學的基本概念絕對可以幫助你更好的「解讀和使用」數據,避免誤判!
1. 各種指標通常都來自於統計學
在數據分析中,我們常用的各種指標,其實很多都來自於統計學的基本原理。例如,以「行銷數據為舉例」,當我們分析網站流量數據的時候,會使用平均數來判斷每日流量的變化趨勢;中位數則可以幫助我們在有極端值的情況下,了解常態的流量水位。
- 敘述統計:包括了平均數、最大值、最小值、標準差等等指標,這些都是非常簡單的「指標」,可以幫助我們簡單、直觀的描述數據的特性。在行銷數據中,這些指標常被用來檢視廣告活動的效果,比如說:每月的點擊平均數。
- 變數與關係:當我們在做行銷數據分析的時候,也常常需要了解「不同變數之間的關聯性」,例如:曝光次數跟轉換率之間的關係?點擊次數跟轉換率之間的關係?這就涉及到統計學中的相關性還有回歸分析,用簡單的統計模型就可以評估相關性的高低!
2. 驗證指標的可靠性,也是來自於統計學
除了描述性統計、計算各種數據指標外,統計學還幫助我們驗證數據的可靠性。這就是為什麼數據分析師經常使用統計方法來檢驗一個指標是否真的是有意義的,還是只是「不小心波動,所以表現變好?」
- 假設檢定:當我們進行行銷活動的 A/B Test 時,可能會需要比較兩種廣告的效果,假設檢定可以幫助我們檢驗兩組數據之間的差異 (比如說:一個 5%,一個 6%,是否真的 6% 這個比較好?是否有「統計顯著性」) → 這讓我們可以利用統計概念,確定這個廣告效果,是不是確實對轉換率有正面影響?還是只是運氣好?
數據分析 & 統計總整理!把最常用到的都整理給你!
一、基本統計指標:敘述統計是什麼?
敘述統計是數據分析的起點,幫助我們了解資料的整體狀況。這些基本的統計指標可以讓我們快速掌握數據的「核心特徵」。
比如說:在分析網站的流量數據時,我們會使用敘述統計來整理每天的來客人數、每位訪客的平均停留時間、最高流量的時間點等等數據!
常見的敘述統計指標包括:
- 平均數:一段時間內的訪問網站平均值,幫助我們了解網站的大概流量為何
- 中位數:當數據有極端值的時候,中位數可以反映非極端狀況的大概流量為何
- 最大值與最小值:用來找出流量最高峰與最低峰,比如:用來找每日最高流量的時間點
二、變數之間的關係:變數是什麼?關係是什麼?
在數據分析中,變數可以是不同的數據點,比如網站流量、轉換率或點擊次數都是所謂的「變數」,所以這個說法的時候,不用太緊張~
舉例來說:我們可能會想知道廣告的曝光次數和點擊率之間是否有關聯?這樣我們才可以知道,我提升什麼變數?有助於我另外一個變數的提升?
常用來分析變數之間關係的方法有:
- 相關性:衡量兩個變數之間的關係,例如,廣告曝光次數與轉換率是否有正相關?如果兩者相關係數接近 1,代表曝光次數越高,轉換率會越高,就是這樣用 XD 非常簡單吧!
- 回歸分析:用來建立變數之間的數學模型,幫助預測未來的結果。以上面的案子延伸,舉例來說,我們可以透過回歸模型預測,多少廣告曝光次數,可以帶來多少轉換?就是這麼簡單 XD!非常好理解吧!
這次故意把統計講得非常簡單,希望大家用最簡易的方式理解學術概念,不要死記公式,透過案例去理解背後的故事,才可以真正內化~
三、機率是什麼?跟數據分析什麼關係?
機率算是「生活數據分析」中滿重要的概念,它幫助我們量化某些事件發生的可能性。
舉例來說,在行銷活動中,我們可能會使用機率來評估某個廣告帶來點擊或轉換的機率。透過分析不同用戶群體的行為數據,我們可以計算出某一特定行為的發生機率,例如訪客點擊 「CTA (Call-to-action) 按鈕」的機率,進而針對高機率的用戶群體進行精準行銷!
如果需要計算機率去做精準行銷,通常也會仰賴數據分析團隊去評估怎麼計算!
四、數據分析師愛用:假設檢定 – 這實驗可以信嗎?
回到剛剛開頭舉過的例子:
- 當我們進行行銷活動的 A/B Test 時,可能會需要比較兩種廣告的效果,假設檢定可以幫助我們檢驗兩組數據之間的差異 (比如說:一個 5%,一個 6%,是否真的 6% 這個比較好?是否有「統計顯著性」)
- → 這讓我們可以利用統計概念,確定這個廣告效果,是不是確實對轉換率有正面影響?還是只是運氣好?
- 統計顯著性用來確定一個結果是否具有統計意義。比如,在行銷活動中,我們可能會測試某種新的 CTA 按鈕是否能提高轉換率?如果測試結果顯示該按鈕的轉換率顯著高於舊按鈕,那麼我們就有理由相信這個變更可能可以提升整體的銷售
透過假設檢定的統計概念跟顯著性的計算,數據分析師可以確保所做出的決定是基於統計學的證據!
A/B Test 的設計非常重要,A/B Test 是什麼?怎麼做?大家務必看過!!
五、期望值是什麼?很好用的生活統計!
最後一個,舉例會跟行銷數據分析無關!跟要不要轉職數據分析有關!我們直接用算的,用期望值算出未來的薪水
選項一:維持現在的工作,假設薪水是 3 萬元
選項二:跳槽到新工作,薪水 5 萬元,但成功的機率是 50%。如果失敗了,還是可以回到原本的工作,薪水 3 萬元
那這兩個選項的期望值,也就是未來可能賺到的平均薪水是多少呢?
- 選項一:維持現在的工作,薪水是固定的 3 萬元,這是一個確定的結果,所以期望值就是 3 萬元
- 選項二:跳槽到新工作,薪水是 5 萬元,機率是 50%,因此期望值是: 5 萬元 × 50% = 2 萬 5 千元 如果跳槽不成功,回到原本的工作,薪水是 3 萬元,機率同樣是 50%,因此: 3 萬元 × 50% = 1 萬 5 千元。
因此,選項二的期望值是 2 萬 5 千元 + 1 萬 5 千元 = 4 萬元。
現在來比較一下這兩個選項的期望值:
- 選項一:維持原本工作的期望值是 3 萬元
- 選項二:轉職後的的期望值是 4 萬元
如果只從統計學算期望薪資的角度看,選項二的期望薪水較高,也就是跳槽的潛在收益更大~是不是很有趣呢~~用統計學還可以幫助我們更理性 (!?)、用更數據分析的方式,來衡量哪個選擇對未來發展更有利!
總結:不怕統計,怕的是不會活用!
統計學其實並沒有那麼可怕,最重要的是,在數據分析的工作當中,統計不是要大家死記硬背公式、死套模型,而是要學會如何把這些概念應用在實際專案當中,扮演加分角色。
而且無論是行銷數據的分析、還是任何數據分析的角度,統計都可能幫到我們~
如果你很怕統計,但還是想轉職,Lisa 的【STEP 數據分析師轉職培訓班】中,就是希望幫大家把重要的統計學概念、程式語言、商業思維,整合成工作中有用的專案,讓大家可以應徵「相關職缺」!