[App4AI] XGBoostClassification
【簡介】
使用 XGBoost Classification 進行資料的分類。
【介面的功能及說明】
- 資料集選單
下拉式選單顯示可以分析的資料集。
- 開啟資料集的資料夾位置
可以快速編輯與新增資料集。
- 說明文件和教學影片
開啟官方網頁,查看說明文件和教學影片。
- 程式流程
設定各個流程的參數,並且依照流程的順序執行。
【操作步驟及說明】
1. 選擇資料集
從下拉式選單中,選擇想要分析的資料集。
資料集介紹:
- titanic
鐵達尼號生存預測。
資料集準備:
- 訓練資料集
檔名:train_input.csv
檔案內容:
- 第一行為資料索引(Index),或是時序性資料的時間日期(date),這行在分析時會自動忽略。
- 前 N 行為輸入,最後一行為輸出(預測)。
- 以下圖為例,1 代表資料索引或時間日期,2 代表輸入,3 代表輸出。
- 測試資料集
檔名:inference_input.csv
檔案內容:同訓練資料集。
2. 在流程區 1. Train 中,編輯訓練參數,並且按下 Run 執行訓練
參數設定:
- Estimator
gradient boosted trees 的數量 (預設為1000)。
執行結果:
- 訓練的模型針對訓練數據集 (train_input.csv) 的預測準確度
- 輸出預測值 (train_output.csv)
開啟 train_output.csv 檔案後,最後一行為訓練的模型針對訓練數據集 (train_input.csv) 的預測值。
3. 在流程區 2. Inference 中,按下 Run 執行推論
執行結果:
- 訓練的模型針對測試數據集 (inference_input.csv) 的預測準確度。
- 輸出預測值 (inference_output.csv)
開啟 inference _output.csv 檔案後,最後一行為訓練的模型針對測試數據集 (inference _input.csv) 的預測值。
標籤: