常見分析問題:拿到原始數據,卻不知道處理?
在您日常的工作中,您是否曾面臨這樣的情況:在拿到一批數據時,卻不知道從何開始進行分析?或是資料分析完後,不知道該如何有效地解讀分析結果,透過本篇文章的介紹,你將瞭解如何巧妙地結合JMP+ ChatGPT,輕鬆地將 ChatGPT嵌入 JMP 的各類應用場景之中,從而使我們的日常數據分析流做到自動化探索、預測以及報表解讀。
在這篇文章中,我們將以sample data中的big class 數據集做示範。
我們假設對這個數據集中的內容一無所知,不知道數據在描述什麼,也不知道該使用哪種分析方法來處理這個數據集。我們該如何透過ChatGPT的協助,幫助我們解讀這份數據集呢?
我們要做的第一件事就是將這個數據集導出成 ChatGPT能夠理解的形式。
點擊左上方紅三角複製腳本,這裡我們具體複製的是什麼。會在稍後為大家來進行解釋。
我們之後來到 ChatGPT 網頁版。在錄入數據之前,我們首先需要透過prompt也就是提示語句的形式來為 ChatGPT 定義它所扮演的角色。
在本例中我們用到提示語句為“你是一位數據分析助手,我會向你提供一張以JSL形式記錄的數據表,請對表格的內容進行總結,對其中的數據做出盡可能詳細的解讀,並在最後給出分析建議。”
ChatGPT 表示收到了我們的資訊,並將為我們完成我們所定義的任務。
在這之後,我們就可以將剛才所複製的腳本複製進 ChatGPT 對話框中。
現在可以看到,我們剛才從數據表中複製的其實是以 JSL 形式所記錄的數據表其中包含了 Big Class 的所有資訊。我們點擊送出ChatGPT 開始解讀此數據表。
基於對 JSL 的理解,ChatGBT 詳細解釋了每一列的數據並識別出這是一張包含了40位學生基本資訊的數據表。在解讀完成之後,ChatGPT 給出了他的分析建議,包括了基本統計分析、視覺化分析,異常檢測等。
這裡我們按照 ChatGPT 所給出的建議,我們可以使用散點圖來繪製身高和體重之間的關係。所用到的命令語句為“請使用 JSL 代碼來繪製身高與體重之間的散點圖。”
點擊ChatGPT 便會自動生成相應的代碼,我們複製繪圖相關的代碼,並在 JMP 中新建腳本,粘貼我們剛才得到的代碼,並運行,那體重與身高之間的散點圖,便會繪製完成。透過這張圖表我們可以觀察體重以及身高之間的相關性。
探索變量相關性指標後,如何進行模型擬合?
如果我們想要一些關於變量相關性的定量指標,我們可以回到 ChatGPT 網頁版,並讓 ChatGPT 嘗試幫我們擬合模型,指令為“請幫我生成 JSL 代碼來擬合身高以及體重間的線性關係。“
與剛才相同的操作,我們複製與擬合模型相關代碼回到 JMP並運行腳本,一張關於身高以及體重之間線性模型的報表便會生成,其中包含了失擬報表、擬合匯總、方差分析、參數估計值等等內容。
看不懂報表?試試看讓生成式AI自動報表解讀
假設我們作為一個統計新手對這些統計學的基本概念沒有任何認知,那麼同樣可以透過ChatGPT的協助,來為我們做自動報表解讀。
在本次範例中,出於簡化報表的考量,我們只篩選出我們所感興趣的內容並對他們進行複製。在文件-新建-新建記錄,把我們剛才所複製的表格內容進行黏貼,並對這張報表進行重新命名。方法為文件-另存為,取名為demo,點擊儲存,那這裡我們獲得的就是一張簡化後的報表。
為了使 ChatGPT 能夠讀懂這張報表,我們同樣需要把它輸出成 JSL 的形式。
具體操作步驟為文件-新建-新建腳本。
然後輸入以上代碼,代碼的主要目的為將Demo window下的所有內容以JSL的形式進行讀取,並把這些JSL以純文本的形式進行輸出。我們點擊運行腳本,那報表所對應的純文本就在下方,我們可以將它們全部選中並且複製。
我們回到 ChatGPT 網頁版,將複製內容進行黏貼。並在最上方讓 ChatGPT 幫我們解讀這張擬合報表。
需求送出後,ChatGPT 便會開始對報表內容進行解讀,同樣是基於對 JSL 語句的理解,ChatGPT 會對 JMP 報表中的擬合指標,進行逐一解釋:比如在擬合匯總報表中,R方為模型解釋的方差比例,而我們目前模型能夠解釋大約50% 的響應變異。
匯總三張報表 ChatGPT 給出了最終結論:認為模型似乎對數據有一定解釋能力。至此我們便完成了基於 ChatGPT 的自動化數據探索預測以及報表解讀。
值得一提的是 ChaGPT 同樣支持 API 調用,也就是說我們剛才示範過程中的JMP 與 ChatGPT 網頁版之間的頻繁切換以及各種複製粘貼操作都可以透過編程語言無縫完成,相關插件您也可以在 JMP 社區找到並下載試用30天。
【關於JMP】
JMP 是一款專業的數據分析和視覺化軟體,它的主要目標是幫助用戶,從數據中提取有用的資訊,進行統計分析以及製作視覺化報表。
JMP 提供了直觀的界面,使得用戶可以透過滑鼠點按進行數據分析生成各類報表。JMP 同時也支持將數據分析操作,透過 JMP 編程語言 JSL 進行記錄從而實現自動化分析以及定制分析。但腳本編程相較於滑鼠拖曳的操作有較高的入門門檻,一直屬於JMP較進階的應用。
【關於ChatGPT】
年度熱門的生成式AI – ChatGPT
ChatGPT 是 OpenAI 公司開發的生成式AI模型,它被訓練用於理解用戶輸入的提示詞,也就是prompt以及指令,並生成相應的自然語言或編程語言文本,可以用於進行對話回答問題、生成文章以及編寫代碼等。
You must be a registered user to add a comment. If you've already registered, sign in. Otherwise, register and sign in.