[App4AI] Pix2Pix

 [簡介]

 

Pix2Pix 架構和 GAN 類似,但不在於產生仿真的影像,而是希望透過監督學習的方式,讓原影像輸出訓練學習的影像風格。例如 : 黑白轉換成彩色、邊緣圖轉換相片、地圖轉換成衛星地圖等各種應用。 

 

[操作步驟及說明]

 

APP 主要分成四大使用功能,資料夾準備、前處理、訓練、推論、其它。

 

APP.png

 

資料夾準備 :

 

Select Dataset選擇要進行 AI 學習的數據集。 如果要訓練自己的影像,請點選 View 檢視 data 資料夾,請複製一個預設的 map 資料夾,將其改為自己的數據名稱,此時請先不要刪除資料夾內的任何子資料夾或檔案。

 

 

前處理 :

 

 

資料準備.png  

1. 請準備想要圖像轉換的影像,轉換需同類型且同一對影像檔名需相同 (附檔名需為 .jpg)。

接著,請點擊 1. combine A and B 中的 Folder A view 與 Folder B view。

 

資料夾開啟後,A 與 B 資料夾內有 train、val、test ,A 是放置轉換後的影像、B 是放置轉換前的影像。請將影像依照轉換前後放入 A、B 資料夾中的 train、val、test,需注意一點的是 兩資料夾中的 train、val、test 皆需要能夠找到對應的影像檔名。

 

接著按下 1. combine A and B 將對應的影像合併為一張,可點擊 Folder AB view 察看。

 

例如 : 地圖轉換衛星圖。在 A 中的train 資料夾可以找到 1.jpg 的地圖,在 B 中的 train 應該也要可以找到對應的 1.png 衛星圖,在 train 中也可找到合併為一張的 1.jpg。

 

  • data/A/train : 地圖的訓練影像;data/B/train : 衛星的訓練影像。

=> data/train : 合併 A 與 B 的訓練影像。

 

  • data/A/val : 地圖的驗證影像;data/B/val : 衛星的驗證影像。

=> data/val : 合併 A 與 B 的驗證影像。

 

  • data/A/test : 地圖的測試影像;data/B/test : 衛星的測試影像。

=> data/test : 合併 A 與 B 的測試影像。

 

注意 : 

1). 影像長寬建議相同,正方形,如果不相同可以縮放或裁切等方式。

2). 圖檔與其附檔名需為 .jpg。

3). 影像需兩兩相對應。    

 

 

2. 資料準備好,開始訓練前,請依序點擊 2. visdom server 與 3. visdom server browser,如下圖,請勿按 x 關閉,用於訓練過程中,請保持開著。

開始訓練後,訓練的 loss 曲線圖等資訊會 post 到 visdom server 且顯示在 visdom server browser 上。  

 

visdom.png

 

訓練 :

 

訓練.png  

按下 4. train 即可開始訓練。在訓練過程中,可以藉由前一步驟開啟的 3. visdom server browser 觀看 loss 變化曲線與訓練效果。 

其訓練時,可以設定的參數如下 :

 

    Continue training : 如果要接續訓練,請打勾,訓練會自動載最後一個模型接著訓練 (latest_net_G.pth、latest_net_D.pth)。反之,不要打勾。

 

    Dataroot : 訓練影像檔案位置,按下 view 可以看到 train、val,資料夾內為訓練用影像。

 

    Checkpoints dir : 放置訓練產出模型的資料夾,按下 view 可以查看資料夾。

 

    GPU ID : 您的裝置如果有支援 NVIDIA GPU 加速運算,請設定 GPU ID,如使用第 0 顆 GPU 則設置為 0,使用第0、1 顆 GPU 則設置為 0, 1; 若未支援NVIDIA GPU 加速運算,則設置為 -1。

 

    Batch size : 一次訓練的樣本數。

 

    N epochs : 設定訓練的週期數。訓練的總週期數會再額外加 100 期是使用線性衰減至 0 的學習率。

 

    Save epoch freq : 儲存模型的頻率週期數。

 

 

推論:

 

推論整個資料夾。主要分兩種,一種是單張推論,結果呈現轉換前後;另一種是推論合併後的影像 (1. combine A and B 的輸出影樣),結果呈現轉換前後與轉換後的標準影像。

使用方式皆為按下 5. inference folder/6. Inference folder image pairs,選擇模型,開始推論,推論完成後跳出瀏覽器可查看推論結果。

 

推論參數如下 :

 

    Inference folder : 顯示推論圖片的資料夾位置。此資料夾為資料準備步驟裡面的 test 資料夾。

 

    GPU ID : 您的裝置如果有支援 NVIDIA GPU 加速運算,請設定 GPU ID,如使用第 0 顆 GPU 則設置為 0,使用第0、1 顆 GPU 則設置為 0, 1; 若未支援NVIDIA GPU 加速運算,則設置為 -1。

 

推論.png

 

 

聯絡我們及購買方式


請參閱以下網址:

https://tw.leaderg.com/article/index?sn=11056

延伸閱讀

1.
App4AI 人工智慧軟體 Windows 版

2.
App4AI 人工智慧軟體 Linux 版

3.
COMPUTER-22 中階人工智慧工作站

4.
COMPUTER-38 高階人工智慧工作站

感謝客戶們的支持

臺灣大學、清華大學、陽明交通大學、成功大學、臺北醫學大學、臺北護理健康大學、中興大學、中山大學、暨南大學、宜蘭大學、嘉義大學、聯合大學、淡江大學、逢甲大學、長庚大學、義守大學、實踐大學、大同大學、中原大學、東吳大學、銘傳大學、臺科大、北科大、臺中科大、雲林科大、勤益科大、虎尾科大、屏東科大、高雄科大、朝陽科大、明志科大、南臺科大、亞東科大、中國科大、國防大學、海軍軍官學校、陸軍專科學校、鼓山高中、臺大醫院、榮民總醫院、長庚醫院、亞東醫院、慈濟醫院、義大醫院、中山科學研究院、國防部軍備局、法務部調查局、工研院、資策會、原子能委員會核能研究所、農業委員會特有生物研究保育中心、勞動部勞動研究所、紡織研究所、金屬工業研究發展中心、台灣儀器科技研究中心、車輛測試中心、台灣自來水公司、台積電、聯電、南亞科、華邦電子、精材科技、華信光電、友達光電、群創光電、瀚宇彩晶、台塑、台塑網、南亞塑膠、台灣化學纖維、中國石油、羅技電子、義隆電子、隆達電子、達方電子、鴻海、大聯大 - 世平興業、盟立自動化、迅得機械、南茂科技、順達科技、致伸科技、英特盛、豐興鋼鐵、中宇環保工程、竹陞科技、研揚科技、敦陽科技、竑騰科技、先豐通訊、神達電腦、神通電腦、百佳泰、科音國際、峰安車業、鴻鵠國際、藍海智能等。