[App4AI] XGBoostRegressionTimeSeries

【簡介】

 

使用 XGBoost Regression Time Series 進行時序性資料的迴歸分析。

 

 LEADERG APP-XGBoost-Regression-Time-Series.png

 

 

 

【介面的功能及說明】

 

•    資料集選單

 

下拉式選單顯示可以分析的資料集。

 

 選擇資料集.png

 

 

 

•    開啟資料集的資料夾位置

 

可以快速編輯與新增資料集。

 

 開啟資料集檔案位置.png

 

 

 

•    說明文件和教學影片

 

開啟官方網頁,查看說明文件和教學影片。

 

 文件和教學影片.png

 

 

 

•    程式流程

 

設定各個流程的參數,並且依照流程的順序執行。

 

 程式流程區.png

 

 

 

【操作步驟及說明】

 

1.    選擇資料集

 

從下拉式選單中,選擇想要分析的資料集。

 

 選擇資料集.png

 

 

 

 

 

資料集介紹;

 

•    sales-forecast-airline

 

航空公司乘客數量預測。

 

 

 

•    stock

 

股價預測,輸入開盤、收盤、盤中最高、盤中最低、成交量,預測五天後的收盤價。

 

 

 

資料集準備:

 

•    訓練資料集

 

檔名:train_data.csv

 

檔案內容:

 

第一行為資料索引(Index),或是時序性資料的時間日期(date),這行在分析時會自動忽略。

 

前N行為輸入,最後一行為輸出(預測)。

 

以下圖為例,1代表資料索引或時間日期,2代表輸入,3代表輸出。

 

 資料準備.png

 

 

 

•    測試資料集

 

檔名:inference_data.csv

 

檔案內容:同訓練資料集。

 

 

 

 

 

2.    在流程區1. Prepare Train Data中,設定時間序列參數,並且按下Run,輸入的train_data.csv會依照設定的時間序列參數進行資料擴增,並且輸出train_data_time_series.csv。

 

參數設定:

 

•    Time Sequence

 

時間序列的長度。

 

 

 

執行結果:

 

•    在console顯示訓練資料 (train_data.csv) 經過資料擴增後的大小

 

訓練資料的資料擴增.png

 

 

 

3.    在流程區2. Train中,編輯訓練參數,並且按下Run執行訓練

 

參數設定:

 

•    Estimator

 

gradient boosted trees的數量 (預設為1000)。

 

 

 

執行結果:

 

•    在console顯示訓練的模型針對訓練數據集 (train_data_time_series.csv) 的Root Mean Squared Error和R-squared

 

 Root Mean Squared Error and R-squared_training.png

 

 

 

•    訓練的模型針對訓練數據集 (train_data_time_series.csv) 的預測值和真實值的比較圖

 

 模型對訓練資料的預測值和真實值對比圖.png

 

 

 

•    訓練的模型針對訓練數據集 (train_data_time_series.csv) 的預測值和真實值的散佈圖

 

 模型對訓練資料的預測值和真實值散佈圖.png

 

 

 

•    輸出預測值 (train_data_time_series_prediction.csv)

 

開啟train_data_time_series_prediction.csv檔案後,最後一行為訓練的模型針對訓練數據集 (train_data_time_series.csv) 的預測值

 

 模型對訓練資料的預測值.png

 

 

 

4.    在流程區3. Prepare Inference Data中,設定時間序列參數,並且按下Run,輸入的inference_data.csv會依照設定的時間序列參數進行資料擴增,並且輸出inference_data_time_series.csv。

 

參數設定:

 

•    Time Sequence

 

時間序列的長度 (此參數的設定值必須和訓練時的時間序列長度相同)。

 

 

 

執行結果:

 

•    在console顯示測試資料 (inference_data.csv) 經過資料擴增後的大小

 

 測試資料的資料擴增.png

 

 

 

5.    在流程區4. Inference中,編輯訓練參數,並且按下Run執行推論

 

參數設定:

 

•    Estimator

 

gradient boosted trees的數量 (預設為1000)。

 

 

 

執行結果:

 

•    在console顯示訓練的模型針對測試數據集 (inference_data_time_series.csv) 的Root Mean Squared Error和R-squared

 

 Root Mean Squared Error and R-squared_testing.png

 

 

 

•    訓練的模型針對測試數據集 (inference_data_time_series.csv) 的預測值和真實值的比較圖

 

 模型對測試資料的預測值和真實值對比圖.png

 

 

 

•    訓練的模型針對測試數據集 (inference_data_time_series.csv) 的預測值和真實值的散佈圖

 

 模型對測試資料的預測值和真實值散佈圖.png

 

 

 

•    輸出預測值 (inference_data_time_series_prediction.csv)

 

開啟inference_data_time_series_prediction.csv檔案後,最後一行為訓練的模型針對測試數據集 (inference_data_time_series.csv) 的預測值。

 

 模型對測試資料的預測值.png

 

 

 

 

[軟體下載]

 

https://d.leaderg.com/XGBoostRegressionTimeSeries/download

 

 

[ 軟體試用 ]

 

下載軟體後,請用7zip解壓縮,輸入「TRY30」試用授權碼,每台電腦可以試用30天。

 

 

聯絡我們及購買方式


請參閱以下網址:

https://tw.leaderg.com/article/index?sn=11056


延伸閱讀

1.
LEADERG App4AI 人工智能軟體 (App for AI, 不用寫程式, 視窗操作介面, 易學易用, 無經驗可, AI Model Zoo, No Code, Deep Learning, 深度學習, Machine Learning, 機器學習, 人工智慧)

2.
LEADERG AI Zoo 人工智能演算法 (整理及優化200多種範例程式碼, 節省90%的開發時間, 10倍速快速開發 AI 程式, Jupyter Lab 操作介面, Code for AI, Code4AI, Less Coding, AI Model Zoo, AIZOO, 深度學習, Big Data, 大數據)

3.
LEADERG ACE 人工智能電腦 (工作站、伺服器、筆電,GPU, computer, workstation, notebook, server, NVIDIA, RTX-3090-24G, RTX-A6000-48G, A100-40G, deep learning, 深度學習, 機器學習, 專業AI電腦供應商)

感謝客戶們的支持

臺灣大學、清華大學、陽明交通大學、成功大學、臺北醫學大學、臺北護理健康大學、中興大學、暨南大學、宜蘭大學、聯合大學、淡江大學、逢甲大學、長庚大學、義守大學、實踐大學、大同大學、中原大學、臺科大、北科大、臺中科大、雲林科大、勤益科大、虎尾科大、屏東科大、高雄科大、朝陽科大、明志科大、南臺科大、亞東科大、中國科大、國防大學、海軍軍官學校、陸軍專科學校、鼓山高中、臺大醫院、榮民總醫院、長庚醫院、慈濟醫院、義大醫院、中山科學研究院、國防部軍備局、法務部調查局、工研院、資策會、原子能委員會核能研究所、農業委員會特有生物研究保育中心、勞動部勞動研究所、紡織研究所、金屬工業研究發展中心、台灣儀器科技研究中心、車輛測試中心、台灣自來水公司、台積電、聯電、南亞科、華邦電子、精材科技、華信光電、友達光電、群創光電、瀚宇彩晶、台塑、台塑網、南亞塑膠、台灣化學纖維、中國石油、羅技電子、義隆電子、隆達電子、達方電子、鴻海、大聯大 - 世平興業、盟立自動化、迅得機械、南茂科技、順達科技、致伸科技、英特盛、豐興鋼鐵、中宇環保工程、竹陞科技、研揚科技、敦陽科技、竑騰科技、先豐通訊、神達電腦、神通電腦、百佳泰、科音國際、峰安車業、鴻鵠國際、藍海智能等。