[數據分析#69] ChatGPT Plus 大進化:一條龍數據分析實戰!5 分鐘解 Kaggle 題目示範

ChatGPT 是什麼?跟 ChatGPT Plus 有什麼不一樣?

自從 2023 年 7 月開始,OpenAI 團隊進一步推出了 ChatGPT Plus 的延伸功能,這個功能發表之後,我就立刻加入了 Plus 的行列,因為我自己認為,這個功能是完全為了資料分析師而設計的!

他無法「取代」我們的工作,因為我實測之後,需要非常會「唸咒語」才可以得到有意義的 insights,但是,會使用這個功能的資料分析師,可以「加速」我們探索資料的時間,讓我們有更多時間,去把數據落地到公司或是組織裡!!

延伸閱讀:真的可以用 ChatGPT 做數據分析?業界數據分析師實測結果分享!這篇文章是免費版 ChatGPT 可以做到的程度!

ChatGPT:無法讀取你的資料集,並且提供你 insights

ChatGPT 是一種可以進行深度對話的 AI,它的訓練資料來源於網路上的資料。但是,ChatGPT 只能從 2021 年之前的資料給出回答,因為這是他訓練資料被切斷的時間點。

換句話說,ChatGPT 對於 2021 年之後的事件或資訊,例如新的科技趨勢或近期的新聞事件,無法提供回答!

所以,這一段的重點就是:一般的 ChatGPT 是不可能去「讀取你的資料集」,然後「幫你分析資料」!

ChatGPT Plus:ChatGPT 4 自己訓練資料、Code Interpreter 還能匯入檔案

而 ChatGPT Plus 則是 OpenAI 進一步強化的版本,尤其是更新到 ChatGPT 4 之後,他增加了 Code Interpreter 的功能,讓用戶可以直接匯入檔案並進行分析 (當然也可以數據分析)。

這個強大的功能讓我們可以在 ChatGPT Plus 中進行更深入的數據分析、提高數據分析師的工作效率!

ChatGPT Plus 如何訂閱?如何開啟 Code Interpreter?

步驟一:先付費訂閱 ChatGPT Plus

要使用 ChatGPT Plus,你首先需要先付費訂閱。這可以在 OpenAI 的網站上完成!

  • 請先來到你 ChatGPT 中的帳號,帳號上方有一個「Upgrade to Plus」
  • 接著點「Upgrade plan」,然後完成信用卡資料輸入,就完成訂閱 ChatGPT Plus 了!

步驟二:從設定開啟 Code Interpreter

開啟 Code Interpreter 的方法需要先開啟一些設定!

  • 首先,來到你的 ChatGPT 帳號,點選設定 (Settings)
  • 設定 (Settings) 中,有一個 Beta Features,請把 Code interpreter 的燈開啟!

開啟之後,就可以回到 ChatGPT 主頁中,開始你的資料分析了~

如何利用 ChatGPT Plus 將檔案匯入、開始啟動數據分析?

步驟一:匯入檔案

  • 只有 ChatGPT-4 可以匯入檔案,所以請先選擇 ChatGPT-4,並且選擇「Code Interpreter (Beta)」
  • 接著,輸入指令的地方,就會出現可以匯入檔案的地方
  • 接著,按「+」之後,從你的電腦上選擇想要分析的數據檔案即可。支援的檔案格式多樣:例如 .csv, Excel (.xlsx)、pdf、word 等等都可以!!

小提醒:ChatGPT 有權將你匯入的資料拿進去他的模型中訓練,因此,切記不要把公司的機密資料外洩到這裡 (非常重要,打三顆星!)!如果你需要 ChatGPT 的分析脈絡 (例如幫你寫 code),你可以給他假資料 (資料欄位是真的,裡面的資料是假的),這樣就可以「請他幫你寫腳本」但是「又不會外流公司或你的私人資料」!!!

ChatGPT 現在也面臨一些官司問題,因為他把別人付費的出版著作拿來當作訓練模型的依據,並且再生出很像的文章,所以正在被告中!所以大家一定要非常小心機密資料,這是資料分析師的基本倫理道德~~!(也是公司很在意的倫理道德)

步驟二:並且輸入你希望他給出的答案

  • 匯入檔案之後,你就可以開始對 ChatGPT-4 下指令了
  • 你可以簡單的告訴他:你希望他進行什麼樣的分析,以下我舉幾個例子:
    • 請幫我分析這份數據中,銷售量最高的商品是什麼?請幫我分析每個月份最常購買的商品、商品價格的分布?
    • 將這份數據按照不同的類別進行統計,提供我多個統計指標,讓我清楚知道不同類別的表現

這些都是簡單的統計分析!還不能完全稱得上數據分析~不過可以幫助初學的大家,你在使用工具練習處理資料的時候,有一個助教幫你在旁邊對答案!

步驟三:研究他的分析過程,並且持續給他指令,探索更多資料面向

  • 步驟三有一件事可以幫助我們學習工具,像是 ChatGPT 常用的 Python,你可以打開他的分析過程,看一下他寫了什麼
  • 步驟二結束之後,你對於資料的問題,都可以獲得解答!但接下來才是問題的開始,因為資料統計不代表資料分析,沒有 insights 的資料結果只是資料探索而已
  • 接著我們可以依照他給出的結論,延伸分析,以下我舉個例:
    • ChatGPT 告訴我 xxx 類別有最高的營業額
    • 那我想知道都是誰去買這個類別的商品,我就可以延伸問:請幫我將用戶分群,告訴我這些用戶的消費傾向
  • 不斷的依照 ChatGPT 給你的結論,繼續去反思,這個數據可以為公司帶來什麼價值,就能夠讓你這份分析專案,變得更完整!

Kaggle 題目實戰,5 分鐘解題示範:見識一下一條龍數據分析的威力!

步驟一:到 Kaggle 下載資料、觀看題目

  • 先註冊 Kaggle 之後,到這裡下載資料集,今天會示範的是非常常見的資料表:Sales Product Data
  • 簡單看一下資料維度之後,有幾道題目:
    • What was the best Year for sales? How much was earned that Year? → 了解一下業績最好的時間
    • What was the best month for sales? How much was earned that month? → 了解一下業績最好的時間
    • What City had the highest number of sales? → 了解一下業績最好的地區
    • What time should we display advertisement to maximize likelihood of customer’s buying product? → 了解一下銷售最好的時間點,以利投放廣告
    • What products are most often sold together? → 跨品、包套組合分析
    • What product sold the most? Why do you think it sold the most? → 爆品分析、原因深入研究
      • 這邊有一個小彩蛋,順便跟大家說為什麼「沒有數據思維」,ChatGPT 也無法回答你問題!

步驟二:開啟 ChatGPT Plus 開始一條龍數據分析,魔法開始!

接下來直接公開我們的聊天記錄!

  1. 先匯入載下來的數據
  2. 資料清洗
  3. 下咒語:直接把所有題目一次貼給 ChatGPT
ChatGPT Plus 數據分析完整攻略與步驟:透過 Kaggle 題目示範 5 分鐘完成數據分析!
請問這份資料有哪些欄位?
ChatGPT Plus 數據分析完整攻略與步驟:透過 Kaggle 題目示範 5 分鐘完成數據分析!
接著請幫我資料清洗一下 order_date 的欄位,看起來有點 dirty
ChatGPT Plus 數據分析完整攻略與步驟:如何下指令 (code interpreter)
直接輸入問題
ChatGPT Plus 數據分析完整攻略與步驟:如何下指令 (code interpreter)
ChatGPT 回:銷售額最高的年份是 2019 年,該年的銷售總額為 $1,120,586.88
ChatGPT Plus 數據分析完整攻略與步驟:如何下指令 (code interpreter)
ChatGPT 回:銷售額最高的月份是 1 月,該月的銷售總額為 $1,188,017.50
ChatGPT Plus 數據分析完整攻略與步驟:如何下指令 (code interpreter)
ChatGPT 回:銷售額最高的城市是 San Francisco,該城市的銷售總額為 $433,103.45
ChatGPT Plus 數據分析完整攻略與步驟:如何下指令 (code interpreter)
ChatGPT 回:根據我們的數據,銷售量最高的時間是中午 12 點。因此,我們應該在這個時間顯示廣告,以最大化客戶購買產品的可能性 XD 他還懂顯示廣告時間要看時間
ChatGPT Plus 數據分析完整攻略與步驟:如何下指令 (code interpreter)
ChatGPT 回:根據我們的數據,最常一起出售的產品組合是 “Google Phone” 和 “USB-C Charging Cable”,這個組合出現了62次。接下來是 “iPhone” 和 “Lightning Charging Cable”,這個組合出現了60次。
ChatGPT Plus 數據分析完整攻略與步驟:如何下指令 (code interpreter)
ChatGPT 回:銷售量最多的產品是 “AAA Batteries (4-pack)”,總銷售量為 1596。銷售量最多可能有多種原因。一個可能的原因是該產品的價格相對較低,因此消費者可能更願意購買。此外,電池是一種常用的消耗品,需要定期更換,這也可能增加了其銷售量。然而,為了得到更確定的結論,我們可能需要進一步分析產品的價格、銷售時間、與其他產品的關聯等因素。

步驟三:深入研究,才能得到有意義的答案或是行動方案

最後一個問題是一個很好的範例,因為他問說「你覺得為什麼?」這也是老闆很喜歡問的問題:「所以你覺得為什麼?」

這裡「定義商業問題、問問題、數據思維」就很重要了!還有包括,是否了解資料的維度、架構等等!

ChatGPT Plus 數據分析完整攻略與步驟:精準定義商業問題給 ChatGPT
我延伸問下去,希望給這個專案一個收尾:AAA Batteries (4-pack) 的價格在過去有浮動嗎?或者是銷量最多的時間是什麼時候?
ChatGPT Plus 數據分析完整攻略與步驟:精準定義商業問題給 ChatGPT
我延伸問下去,希望給這個專案一個收尾:銷量最多的月份或是日期?或者是他都跟什麼東西一起被購買?

透過金字塔法則或是腦袋風暴,有助於我們知道下一步還可以怎麼看?看什麼?而不是停留在沒有行動方案的「虛無結論」!

像這一題,我沒有得到我想要的答案,所以我還會想細看很多面向,以得到一個有建設性的行動方案:

  • 廣告:
    • 廣告數據中,這檔商品的競價
    • 來自廣告的購買量
    • 廣告預算分佈
  • 原生流量:
    • Organic Traffic 這檔商品的流量
    • 替代品的銷售是否影響?
    • 到 Google Trend 看商品趨勢

結論:真正的 AI 數據分析時代來臨,不會利用數據得到行動方案的資料分析師可能會很難混下來

不得不說,這一次的 ChatGPT 更新,已經算是對資料分析領域產生「革命性的影響」!但其實我是樂見其成的!因為我又可以更偷懶了 XD

因為資料處理對 ChatGPT 而言,太簡單、太快了!很制式化的:資料清洗、資料統計、資料視覺化,ChatGPT 只要十秒鐘就可以完成,所以資料分析領域會迎來革命性的變化!我會分析一下幾個變化方向:

  1. 資料分析師不能再依賴自己會多少工具:因為 ChatGPT 可以在幾秒之後換一種工具、給你完整的使用操作說明,就算不太熟練工具的,也可以馬上獲得專人解答
  2. 資料分析師會更注重在找到這個領域的核心問題:當統計、做圖表、找商業問題的統計答案變得非常容易,資料分析師就可以全心全意的找這個領域的核心問題,並且把數據落地到各個不同的部門,讓更多部門可以因為資料而受惠
  3. 資料分析師會成為接軌數據與現實的核心角色:接下來,數據的應用會發展得更快,因為學習門檻降低了,那數據分析師就變成很核心的角色,讓更多人知道怎麼透過數據、透過自動化,幫助歸納、整合現有的工作
  4. 資料分析師正式走向「分析為王」或是「資料基礎建設為王」:
    1. 資料必須先有基礎建設才能夠自動運轉,數位轉型會更普及,所以基礎建設變成資料分析師必修的領域!
    2. 分析代表的意義是:把資料變成有價值的行動方案,而不只是簡單統計!當統計變得簡單,那分析的工作比重就會變得更為重要!

ChatGPT 革命:數據分析師需要數據思維,而非工具導向~

如果你想要學習的不只是數據工具,而是數據分析師怎麼思考問題,將問題落地、用工具解決、並且把分析結果變成完整的行動方案、變成提案的簡報跟內容,可以參考我的:數據分析師培訓班,這是一個教練式的培訓系統,依照你的背景,設計你的專案,並且給你客製化的回饋~我期望你是懂思維、擁有專業競爭壁壘的數據分析師,而不要淪為「數據工具人」!

【1 對 1 免費諮詢】數據分析師 0~1 培訓班陪你一路到轉職成功!

hi 我是 Lisa

你也是 0 經驗、沒有相關背景,但也想要轉職數據分析師,或運用數據分析,提升在領域的專業度嗎?

-

你是否也覺得,數據分析的網路學習資源很多,但是多到不知道從哪裡開始?

學了很多工具,但學完了,問題才真正開始,不知道業界怎麼使用?又該如何面臨工作跟面試?

-

我在 2019 年從營運專員的職位轉職到數據分析師

在這之後,因為數據分析,也讓我快速建構不同領域的知識:行銷、營運、商業策略、產品、網頁

轉職過程中,花了很多時間成本摸索

我發現,學數據分析最快的方式是:

  1. 確認自己跟市場需求之間的差距:訂定轉職策略及了解數據分析師的工作方式
  2. 以業界應用的角度學習工具:包括數據工具及分析用思維架構,並且如何高效運用
  3. 建立一個商業上的真實專案,並且得到回饋:打造屬於你及貼合職缺需求的作品集和專案
  4. 打造一個高效履歷跟面談:透過高價值包裝術拿下面試、成功獲得數據行業的門票

當初如果我有這套系統思維,應該可以在短時間內轉職,馬上拿到進入業界的門票

-

現在,我想把這套完整課程分享給你

這是專門為了 0 經驗、沒有相關背景的轉職者所設計

不需要去考研究所、不需要花大錢準備出國讀書

可以用最快的時間準備轉職、拿到門票!

-

如果你正在準備轉職數據分析師,且試圖找過解決辦法卻始終治標不治本!歡迎跟我預約免費 1 對 1 諮詢,我會在諮詢時,了解你的需求並且評估我是否可以協助到你!

電子書 職場人必學的數據分析術

Lisa Wu

Hi 大家好!我是喜歡探索身心靈健康及平衡的數據分析師 Lisa Wu!這個網站會幫助你:利用數據分析 (理性) 及 身心靈平衡 (感性) 的系統,去達成人生目標!如果你對我的人生系統工具有興趣,歡迎聯繫我:couplehonest@gmail.com

This Post Has One Comment

Comments are closed.