CycleGAN 是發表在 ICCV2017 image-to-image translation 的著名演算法,最大特點為不要求訓練數據要成對,只需要提供不同 domain 的影像就能成功訓練不同 domain 之間的影像轉換。 可應用於語義標籤的街道轉換成寫實影像、衛星影像轉換成地圖影像、將場景從白天轉換成夜晚。
人體姿勢偵測,偵測出人體鼻子、眼睛、耳朵、脖子、肩部、手肘、手腕、髖關節、膝關節、腳踝的位置。
模型轉換,從 yolo PyTorh 模型轉換到 ONNX 模型,或是 Tensorflow 1.X 模型轉換到 ONNX 模型。
FaceNet 主要驗證人臉是否為同一個人,端對端學習,直接比對兩個人臉經過它的網路映射之後的歐氏距離。該模型沒有使用傳統 softmax 的方式進行分類學習,而是抽取某一層當作特徵,將人臉影像映射到一個歐幾里得多維空間的編碼方法,通過空間距離來表示人臉的相似度,同一個人的距離越小,反之不同人距離則越大。最後基於此編碼再做人臉辨識、人
使用 UNet 進行影像分割,可以應用於醫療影像切割,範例為胸腔 CT 影像切割。
可解釋性、影像分類、物件偵測、語意分割、物件分割、影像處理、人臉辨識、姿態辨識、車牌辨識、字元辨識、瑕疵檢測、放射檢測、病理分析、模型轉換、一般資料分析、時間序列資料分析。我們把 AI 變簡單!
CSPNet 演算法優化深度學習網路結構,除了準確度是世界第一之外,還能在邊緣運算嵌入式系統上維持超高的推論速度,可應用在工廠瑕疵檢測、車流分析、人流分析、安全監控、醫療影像分析、生物影像分析、工安影像分析、口罩影像分析等領域,實在是非常厲害,台灣之光。
使用 XGBoost Classification 進行資料的分類。
此 APP 是一套結合多種影像標註工具的應用程式,主要包含有常見的LabelImg、Labelme 與立達軟體獨家開發的 Annotation 標註工具,支援 PASCAL VOC XML、YOLO、labelme、VIA JSON 等多種常見標註格式。
使用 MaskRCNN 進行影像物件分割
使用 XGBoost Regression 進行資料的迴歸分析。
將 YOLOv4 演算法包裝成 APP 工具,不需寫程式即可進行 AI 訓練及推論,支援最新 RTX-3090-24G GPU 及 CUDA 11.0 。可以應用在工廠瑕疵檢測、醫療影像分析、生物影像分析、工安影像分析、口罩影像分析等。
CUDA, cuDNN, Terminal, Jupyter Lab, Spyder, labelImg, lableMe 等。
RTX-3090-24G 的 CUDA core 是 Titan RTX 的兩倍,訓練速度提升40%較為顯著,推論速度提昇10%不顯著。
顯示卡驅動程式, CUDA, cuDNN, PyTorch, TensorFlow 全部都必須升級到新版或開發版才能使用。
傳統演算法優先,影像分類,可解釋性,物件偵測,語意分割,物件分割,異常檢測,學好樣本,雙網路檢測。
馬變成斑馬,斑馬變成馬。夏天變冬天,冬天變夏天。照片變油畫,油畫變照片。整張照片風格變換效果較好,例如:照片變油畫,油畫變照片。部分照片風格變換效果較差,例如:馬變成斑馬,斑馬變成馬。將風格變換對象放大佔整張照片的50%以上甚至滿版,背景單純,效果才會好。
可解釋性, 影像分類, 物件偵測, 語意分割, 物件分割, 人臉辨識, 姿態辨識, 車牌辨識
DICOM 介紹,讀取 dcm 檔案的字串內容及影像內容。
可解釋性,導入領域專家概念,例如:線的概念。一般資料分析及時間序列資料分析。
YOLOv4 的前身,透過優化 CNN 架構,降低20%運算量,但是精度維持不變。
使用初步訓練好的模型,標註新的訓練影像,節省時間。
使用 OpenCV 進行傳統類比錶頭影像辨識。
[1] 2 3