[App4AI] XGBoostRegressionTimeSeries

【簡介】

 

使用 XGBoost Regression Time Series 進行時序性資料的迴歸分析。

 

 LEADERG APP-XGBoost-Regression-Time-Series.png

 

 

 

【介面的功能及說明】

 

•    資料集選單

 

下拉式選單顯示可以分析的資料集。

 

 選擇資料集.png

 

 

 

•    開啟資料集的資料夾位置

 

可以快速編輯與新增資料集。

 

 開啟資料集檔案位置.png

 

 

 

•    說明文件和教學影片

 

開啟官方網頁,查看說明文件和教學影片。

 

 文件和教學影片.png

 

 

 

•    程式流程

 

設定各個流程的參數,並且依照流程的順序執行。

 

 程式流程區.png

 

 

 

【操作步驟及說明】

 

1.    選擇資料集

 

從下拉式選單中,選擇想要分析的資料集。

 

 選擇資料集.png

 

 

 

 

 

資料集介紹;

 

•    sales-forecast-airline

 

航空公司乘客數量預測。

 

 

 

•    stock

 

股價預測,輸入開盤、收盤、盤中最高、盤中最低、成交量,預測五天後的收盤價。

 

 

 

資料集準備:

 

•    訓練資料集

 

檔名:train_data.csv

 

檔案內容:

 

第一行為資料索引(Index),或是時序性資料的時間日期(date),這行在分析時會自動忽略。

 

前N行為輸入,最後一行為輸出(預測)。

 

以下圖為例,1代表資料索引或時間日期,2代表輸入,3代表輸出。

 

 資料準備.png

 

 

 

•    測試資料集

 

檔名:inference_data.csv

 

檔案內容:同訓練資料集。

 

 

 

 

 

2.    在流程區1. Prepare Train Data中,設定時間序列參數,並且按下Run,輸入的train_data.csv會依照設定的時間序列參數進行資料擴增,並且輸出train_data_time_series.csv。

 

參數設定:

 

•    Time Sequence

 

時間序列的長度。

 

 

 

執行結果:

 

•    在console顯示訓練資料 (train_data.csv) 經過資料擴增後的大小

 

訓練資料的資料擴增.png

 

 

 

3.    在流程區2. Train中,編輯訓練參數,並且按下Run執行訓練

 

參數設定:

 

•    Estimator

 

gradient boosted trees的數量 (預設為1000)。

 

 

 

執行結果:

 

•    在console顯示訓練的模型針對訓練數據集 (train_data_time_series.csv) 的Root Mean Squared Error和R-squared

 

 Root Mean Squared Error and R-squared_training.png

 

 

 

•    訓練的模型針對訓練數據集 (train_data_time_series.csv) 的預測值和真實值的比較圖

 

 模型對訓練資料的預測值和真實值對比圖.png

 

 

 

•    訓練的模型針對訓練數據集 (train_data_time_series.csv) 的預測值和真實值的散佈圖

 

 模型對訓練資料的預測值和真實值散佈圖.png

 

 

 

•    輸出預測值 (train_data_time_series_prediction.csv)

 

開啟train_data_time_series_prediction.csv檔案後,最後一行為訓練的模型針對訓練數據集 (train_data_time_series.csv) 的預測值

 

 模型對訓練資料的預測值.png

 

 

 

4.    在流程區3. Prepare Inference Data中,設定時間序列參數,並且按下Run,輸入的inference_data.csv會依照設定的時間序列參數進行資料擴增,並且輸出inference_data_time_series.csv。

 

參數設定:

 

•    Time Sequence

 

時間序列的長度 (此參數的設定值必須和訓練時的時間序列長度相同)。

 

 

 

執行結果:

 

•    在console顯示測試資料 (inference_data.csv) 經過資料擴增後的大小

 

 測試資料的資料擴增.png

 

 

 

5.    在流程區4. Inference中,編輯訓練參數,並且按下Run執行推論

 

參數設定:

 

•    Estimator

 

gradient boosted trees的數量 (預設為1000)。

 

 

 

執行結果:

 

•    在console顯示訓練的模型針對測試數據集 (inference_data_time_series.csv) 的Root Mean Squared Error和R-squared

 

 Root Mean Squared Error and R-squared_testing.png

 

 

 

•    訓練的模型針對測試數據集 (inference_data_time_series.csv) 的預測值和真實值的比較圖

 

 模型對測試資料的預測值和真實值對比圖.png

 

 

 

•    訓練的模型針對測試數據集 (inference_data_time_series.csv) 的預測值和真實值的散佈圖

 

 模型對測試資料的預測值和真實值散佈圖.png

 

 

 

•    輸出預測值 (inference_data_time_series_prediction.csv)

 

開啟inference_data_time_series_prediction.csv檔案後,最後一行為訓練的模型針對測試數據集 (inference_data_time_series.csv) 的預測值。

 

 模型對測試資料的預測值.png

 

 

 

 

聯絡我們及購買方式


請參閱以下網址:

https://tw.leaderg.com/article/index?sn=11056

延伸閱讀

1.
App4AI 人工智慧軟體 Windows 版

2.
App4AI 人工智慧軟體 Linux 版

3.
COMPUTER-22 中階人工智慧工作站

4.
COMPUTER-38 高階人工智慧工作站

感謝客戶們的支持

臺灣大學、清華大學、陽明交通大學、成功大學、臺北醫學大學、臺北護理健康大學、中興大學、中山大學、暨南大學、宜蘭大學、嘉義大學、聯合大學、淡江大學、逢甲大學、長庚大學、義守大學、實踐大學、大同大學、中原大學、東吳大學、銘傳大學、臺科大、北科大、臺中科大、雲林科大、勤益科大、虎尾科大、屏東科大、高雄科大、朝陽科大、明志科大、南臺科大、亞東科大、中國科大、國防大學、海軍軍官學校、陸軍專科學校、鼓山高中、臺大醫院、榮民總醫院、長庚醫院、亞東醫院、慈濟醫院、義大醫院、中山科學研究院、國防部軍備局、法務部調查局、工研院、資策會、原子能委員會核能研究所、農業委員會特有生物研究保育中心、勞動部勞動研究所、紡織研究所、金屬工業研究發展中心、台灣儀器科技研究中心、車輛測試中心、台灣自來水公司、台積電、聯電、南亞科、華邦電子、精材科技、華信光電、友達光電、群創光電、瀚宇彩晶、台塑、台塑網、南亞塑膠、台灣化學纖維、中國石油、羅技電子、義隆電子、隆達電子、達方電子、鴻海、大聯大 - 世平興業、盟立自動化、迅得機械、南茂科技、順達科技、致伸科技、英特盛、豐興鋼鐵、中宇環保工程、竹陞科技、研揚科技、敦陽科技、竑騰科技、先豐通訊、神達電腦、神通電腦、百佳泰、科音國際、峰安車業、鴻鵠國際、藍海智能等。