ChatGPT 是什麼?跟 ChatGPT Plus 有什麼不一樣?
自從 2023 年 7 月開始,OpenAI 團隊進一步推出了 ChatGPT Plus 的延伸功能,這個功能發表之後,我就立刻加入了 Plus 的行列,因為我自己認為,這個功能是完全為了資料分析師而設計的!
他無法「取代」我們的工作,因為我實測之後,需要非常會「唸咒語」才可以得到有意義的 insights,但是,會使用這個功能的資料分析師,可以「加速」我們探索資料的時間,讓我們有更多時間,去把數據落地到公司或是組織裡!!
延伸閱讀:真的可以用 ChatGPT 做數據分析?業界數據分析師實測結果分享!這篇文章是免費版 ChatGPT 可以做到的程度!
ChatGPT:無法讀取你的資料集,並且提供你 insights
ChatGPT 是一種可以進行深度對話的 AI,它的訓練資料來源於網路上的資料。但是,ChatGPT 只能從 2021 年之前的資料給出回答,因為這是他訓練資料被切斷的時間點。
換句話說,ChatGPT 對於 2021 年之後的事件或資訊,例如新的科技趨勢或近期的新聞事件,無法提供回答!
所以,這一段的重點就是:一般的 ChatGPT 是不可能去「讀取你的資料集」,然後「幫你分析資料」!
ChatGPT Plus:ChatGPT 4 自己訓練資料、Code Interpreter 還能匯入檔案
而 ChatGPT Plus 則是 OpenAI 進一步強化的版本,尤其是更新到 ChatGPT 4 之後,他增加了 Code Interpreter 的功能,讓用戶可以直接匯入檔案並進行分析 (當然也可以數據分析)。
這個強大的功能讓我們可以在 ChatGPT Plus 中進行更深入的數據分析、提高數據分析師的工作效率!
ChatGPT Plus 如何訂閱?如何開啟 Code Interpreter?
步驟一:先付費訂閱 ChatGPT Plus
要使用 ChatGPT Plus,你首先需要先付費訂閱。這可以在 OpenAI 的網站上完成!
- 請先來到你 ChatGPT 中的帳號,帳號上方有一個「Upgrade to Plus」
- 接著點「Upgrade plan」,然後完成信用卡資料輸入,就完成訂閱 ChatGPT Plus 了!
步驟二:從設定開啟 Code Interpreter
開啟 Code Interpreter 的方法需要先開啟一些設定!
- 首先,來到你的 ChatGPT 帳號,點選設定 (Settings)
- 設定 (Settings) 中,有一個 Beta Features,請把 Code interpreter 的燈開啟!
開啟之後,就可以回到 ChatGPT 主頁中,開始你的資料分析了~
如何利用 ChatGPT Plus 將檔案匯入、開始啟動數據分析?
步驟一:匯入檔案
- 只有 ChatGPT-4 可以匯入檔案,所以請先選擇 ChatGPT-4,並且選擇「Code Interpreter (Beta)」
- 接著,輸入指令的地方,就會出現可以匯入檔案的地方
- 接著,按「+」之後,從你的電腦上選擇想要分析的數據檔案即可。支援的檔案格式多樣:例如 .csv, Excel (.xlsx)、pdf、word 等等都可以!!
小提醒:ChatGPT 有權將你匯入的資料拿進去他的模型中訓練,因此,切記不要把公司的機密資料外洩到這裡 (非常重要,打三顆星!)!如果你需要 ChatGPT 的分析脈絡 (例如幫你寫 code),你可以給他假資料 (資料欄位是真的,裡面的資料是假的),這樣就可以「請他幫你寫腳本」但是「又不會外流公司或你的私人資料」!!!
ChatGPT 現在也面臨一些官司問題,因為他把別人付費的出版著作拿來當作訓練模型的依據,並且再生出很像的文章,所以正在被告中!所以大家一定要非常小心機密資料,這是資料分析師的基本倫理道德~~!(也是公司很在意的倫理道德)
步驟二:並且輸入你希望他給出的答案
- 匯入檔案之後,你就可以開始對 ChatGPT-4 下指令了
- 你可以簡單的告訴他:你希望他進行什麼樣的分析,以下我舉幾個例子:
- 請幫我分析這份數據中,銷售量最高的商品是什麼?請幫我分析每個月份最常購買的商品、商品價格的分布?
- 將這份數據按照不同的類別進行統計,提供我多個統計指標,讓我清楚知道不同類別的表現
這些都是簡單的統計分析!還不能完全稱得上數據分析~不過可以幫助初學的大家,你在使用工具練習處理資料的時候,有一個助教幫你在旁邊對答案!
步驟三:研究他的分析過程,並且持續給他指令,探索更多資料面向
- 步驟三有一件事可以幫助我們學習工具,像是 ChatGPT 常用的 Python,你可以打開他的分析過程,看一下他寫了什麼
- 步驟二結束之後,你對於資料的問題,都可以獲得解答!但接下來才是問題的開始,因為資料統計不代表資料分析,沒有 insights 的資料結果只是資料探索而已
- 接著我們可以依照他給出的結論,延伸分析,以下我舉個例:
- ChatGPT 告訴我 xxx 類別有最高的營業額
- 那我想知道都是誰去買這個類別的商品,我就可以延伸問:請幫我將用戶分群,告訴我這些用戶的消費傾向
- 不斷的依照 ChatGPT 給你的結論,繼續去反思,這個數據可以為公司帶來什麼價值,就能夠讓你這份分析專案,變得更完整!
Kaggle 題目實戰,5 分鐘解題示範:見識一下一條龍數據分析的威力!
步驟一:到 Kaggle 下載資料、觀看題目
- 先註冊 Kaggle 之後,到這裡下載資料集,今天會示範的是非常常見的資料表:Sales Product Data
- 簡單看一下資料維度之後,有幾道題目:
- What was the best Year for sales? How much was earned that Year? → 了解一下業績最好的時間
- What was the best month for sales? How much was earned that month? → 了解一下業績最好的時間
- What City had the highest number of sales? → 了解一下業績最好的地區
- What time should we display advertisement to maximize likelihood of customer’s buying product? → 了解一下銷售最好的時間點,以利投放廣告
- What products are most often sold together? → 跨品、包套組合分析
- What product sold the most? Why do you think it sold the most? → 爆品分析、原因深入研究
- 這邊有一個小彩蛋,順便跟大家說為什麼「沒有數據思維」,ChatGPT 也無法回答你問題!
步驟二:開啟 ChatGPT Plus 開始一條龍數據分析,魔法開始!
接下來直接公開我們的聊天記錄!
- 先匯入載下來的數據
- 資料清洗
- 下咒語:直接把所有題目一次貼給 ChatGPT
步驟三:深入研究,才能得到有意義的答案或是行動方案
最後一個問題是一個很好的範例,因為他問說「你覺得為什麼?」這也是老闆很喜歡問的問題:「所以你覺得為什麼?」
這裡「定義商業問題、問問題、數據思維」就很重要了!還有包括,是否了解資料的維度、架構等等!
透過金字塔法則或是腦袋風暴,有助於我們知道下一步還可以怎麼看?看什麼?而不是停留在沒有行動方案的「虛無結論」!
像這一題,我沒有得到我想要的答案,所以我還會想細看很多面向,以得到一個有建設性的行動方案:
- 廣告:
- 廣告數據中,這檔商品的競價
- 來自廣告的購買量
- 廣告預算分佈
- 原生流量:
- Organic Traffic 這檔商品的流量
- 替代品的銷售是否影響?
- 到 Google Trend 看商品趨勢
結論:真正的 AI 數據分析時代來臨,不會利用數據得到行動方案的資料分析師可能會很難混下來
不得不說,這一次的 ChatGPT 更新,已經算是對資料分析領域產生「革命性的影響」!但其實我是樂見其成的!因為我又可以更偷懶了 XD
因為資料處理對 ChatGPT 而言,太簡單、太快了!很制式化的:資料清洗、資料統計、資料視覺化,ChatGPT 只要十秒鐘就可以完成,所以資料分析領域會迎來革命性的變化!我會分析一下幾個變化方向:
- 資料分析師不能再依賴自己會多少工具:因為 ChatGPT 可以在幾秒之後換一種工具、給你完整的使用操作說明,就算不太熟練工具的,也可以馬上獲得專人解答
- 資料分析師會更注重在找到這個領域的核心問題:當統計、做圖表、找商業問題的統計答案變得非常容易,資料分析師就可以全心全意的找這個領域的核心問題,並且把數據落地到各個不同的部門,讓更多部門可以因為資料而受惠
- 資料分析師會成為接軌數據與現實的核心角色:接下來,數據的應用會發展得更快,因為學習門檻降低了,那數據分析師就變成很核心的角色,讓更多人知道怎麼透過數據、透過自動化,幫助歸納、整合現有的工作
- 資料分析師正式走向「分析為王」或是「資料基礎建設為王」:
- 資料必須先有基礎建設才能夠自動運轉,數位轉型會更普及,所以基礎建設變成資料分析師必修的領域!
- 分析代表的意義是:把資料變成有價值的行動方案,而不只是簡單統計!當統計變得簡單,那分析的工作比重就會變得更為重要!
ChatGPT 革命:數據分析師需要數據思維,而非工具導向~
如果你想要學習的不只是數據工具,而是數據分析師怎麼思考問題,將問題落地、用工具解決、並且把分析結果變成完整的行動方案、變成提案的簡報跟內容,可以參考我的:數據分析師培訓班,這是一個教練式的培訓系統,依照你的背景,設計你的專案,並且給你客製化的回饋~我期望你是懂思維、擁有專業競爭壁壘的數據分析師,而不要淪為「數據工具人」!
Pingback: [數據分析#0] 數據分析文章導覽 (69 篇,持續更新中) - Lisa Wu 理紗豆苗工作室