FaceNet 主要驗證人臉是否為同一個人,端對端學習,直接比對兩個人臉經過它的網路映射之後的歐氏距離。該模型沒有使用傳統 softmax 的方式進行分類學習,而是抽取某一層當作特徵,將人臉影像映射到一個歐幾里得多維空間的編碼方法,通過空間距離來表示人臉的相似度,同一個人的距離越小,反之不同人距離則越大,最後基於此編碼再做人臉辨識。
使用 UNet 進行影像分割,可以應用於醫療影像切割,範例為胸腔 CT 影像切割。
使用 XGBoost Regression Time Series 進行時序性資料的迴歸分析。
使用 LSTM (Long Short-Term Memory) 進行時序性資料的分析。    
CSPNet 演算法優化深度學習網路結構,除了準確度是世界第一之外,還能在邊緣運算嵌入式系統上維持超高的推論速度,可應用在工廠瑕疵檢測、車流分析、人流分析、安全監控、醫療影像分析、生物影像分析、工安影像分析、口罩影像分析等領域,實在是非常厲害,台灣之光。
使用 XGBoost Classification 進行資料的分類。
此 APP 是一套結合多種影像標註工具的應用程式,主要包含有常見的LabelImg、Labelme 與立達軟體獨家開發的 Annotation 標註工具,支援 PASCAL VOC XML、YOLO、labelme、VIA JSON 等多種常見標註格式。
使用 Mask R-CNN 演算法進行影像物件計數及分割,可應用於醫療影像分析、魚類影像分析、生物影像分析、先進駕駛輔助系統、自動駕駛車、工廠瑕疵檢測等。
使用 XGBoost Regression 進行資料的迴歸分析。
將 YOLOv4 演算法包裝成 APP 工具,不需寫程式即可進行 AI 訓練及推論,支援最新 RTX-3090-24G GPU 及 CUDA 11.0 。可以應用在工廠瑕疵檢測、醫療影像分析、生物影像分析、工安影像分析、口罩影像分析等。
CUDA, cuDNN, Terminal, Jupyter Lab, Spyder, labelImg, lableMe 等。
RTX-3090-24G 的 CUDA core 是 Titan RTX 的兩倍,訓練速度提升40%較為顯著,推論速度提昇10%不顯著。
顯示卡驅動程式, CUDA, cuDNN, PyTorch, TensorFlow 全部都必須升級到新版或開發版才能使用。
傳統演算法優先,影像分類,可解釋性,物件偵測,語意分割,物件分割,異常檢測,學好樣本,雙網路檢測。
馬變成斑馬,斑馬變成馬。夏天變冬天,冬天變夏天。照片變油畫,油畫變照片。整張照片風格變換效果較好,例如:照片變油畫,油畫變照片。部分照片風格變換效果較差,例如:馬變成斑馬,斑馬變成馬。將風格變換對象放大佔整張照片的50%以上甚至滿版,背景單純,效果才會好。
可解釋性, 影像分類, 物件偵測, 語意分割, 物件分割, 人臉辨識, 姿態辨識, 車牌辨識
DICOM 介紹,讀取 dcm 檔案的字串內容及影像內容。
可解釋性,導入領域專家概念,例如:線的概念。一般資料分析及時間序列資料分析。
YOLOv4 的前身,透過優化 CNN 架構,降低20%運算量,但是精度維持不變。
使用初步訓練好的模型,標註新的訓練影像,節省時間。
使用 OpenCV 進行傳統類比錶頭影像辨識。
廣泛應用於醫療影像分析、生物影像分析、自駕車影像分析、瑕疵檢測等。
x64 架構,可以跑 Windows 10 、 Ubuntu Linux 18.04 ,開發容易,驅動程式支援完整。工業規格,亦可升級軍用規格。
影像資料擴增的方法主要有旋轉、平移、翻轉、縮放、伸展、斜體、彈性皺摺等方法,但須注意合理性。
號稱比 Mask R-CNN 快3倍,但是準確度略低。
工廠生產排程建議用窮舉法(暴力法)找出全域最佳解。如果排程複雜度高,例如:64核心電腦在一小時內無法用窮舉法(暴力法)找出全域最佳解,才考慮用基因演算法在短時間內找出局部最佳解。
將新的 AI 技術應用在農業。
後疫情時代的改變、人工智慧應用由取代人工轉變為節省設備材料成本、常用資料分析演算法比較、醫療影像判讀由人工判讀轉變為 AI 輔助判讀、常用影像分析演算法比較
Transformer 是一種新的深度學習網路架構,在序列性任務的表現特別好,常用於自然語言處理(NLP)、語音辨識等領域。臉書最近發表的影像辨識模型 DETR ,特別採用 Transformer 架構應用在物件偵測上。
PyTorch, TensorFlow, Keras, ONNX, TensorRT, OpenVINO AI 模型檔案的轉換,速度 (FPS) 與精度 (FP64, FP32, FP16, INT8) 之間的取捨。
應用於 PC/NVIDIA Jetson/樹莓派 與 PLC/Arduino/感測器/GPS 的 RS-232/RS-485 通訊。
採用 RDP, VPN, client, server 架構,適用於公司研發部門及學術研究單位。
影像拼接是指將兩張有重疊部分的影像,拼接成一張圖。影像拼接有兩大步驟:影像對準和影像混合。相關的應用有:全景圖製作及影像穩定等。
可支援多國語言,應用在各個行業的網頁文字客服及電話客服。
Barcode 及 QR code是應用最廣泛的影像分析演算法,普遍應用在文件管制、商品進出貨紀錄、商店結帳、手機付款等。
比較 InceptionV3-CAM, YOLOv4, Efficient Det, Mask R-CNN, U-Net 等演算法。
可應用於股價預測、匯率預測、期貨價格預測、金融指數預測、房價預測、銷售量預測、雨量預測、氣候預測、手寫識別、語音識別等。
LSTM 是一種時間循環神經網絡(RNN)。由於獨特的設計結構,LSTM適合於處理和預測時間序列中的重要事件。可應用於股價預測、匯率預測、期貨價格預測、金融指數預測、房價預測、銷售量預測、雨量預測、氣候預測、手寫識別、語音識別等。
XGBoost 是目前最好用的數值資料分析演算法,可應用於股價預測、匯率預測、期貨價格預測、金融指數預測、授信風險預測、房價預測、生產良率預測、維修保養預測、員工錄取判斷、員工離職預測、學生成績預測、作物生長預測、生存預測等。
Jetson Xavier NX 支援多種熱門的人工智慧框架,可支援雲端原生、容器部署應用程式,並可立即應用於各種場域。例如:於門禁人臉辨識、生產線瑕疵檢測、生產線資料收集及分析、溫室資料收集及分析、畜舍資料收集及分析、影像分析、聲音分析、訊號分析、條碼辨識、 QR code 辨識、人工智慧課程教學等。
訓練組由2萬張照片中學會美感判斷。
可以應用在居家預防跌倒、入侵偵測、肢體語言識別、人機互動、人體姿態偵測、工廠工安偵測、人流計數等。
目前正確率最高的物件偵測演算法,可以應用在工廠瑕疵檢測、醫療影像分析、生物影像分析、工安影像分析、口罩影像分析等。
1 2 [3] 4