此 APP是將一張低解析度(Low Resolution)的影像,利用 SRGAN 生成一張高解析度 (High Resolution),提高影像的解析度。
CycleGAN 是發表在 ICCV2017 image-to-image translation 的著名演算法,最大特點為不要求訓練數據要成對,只需要提供不同 domain 的影像就能成功訓練不同 domain 之間的影像轉換。 可應用於語義標籤的街道轉換成寫實影像、衛星影像轉換成地圖影像、將場景從白天轉換成夜晚。
繼承 FasterRCNN 的演算法 - MaskRCNN,對原有的架構進行改 良,增加了 Semantic Segmentation 的部分,可對物體進行分割、 檢出、分類,是相當經典的 Segmentation 演算法。
YOLO Darknet 的維護者俄羅斯人 Alexey Bochkovskiy 發現中研院資科所博後王建堯及所長廖弘源研發的 CSPNet detector 又快又好,於是邀請中研院資科所以此為 backbone 發展 YOLOv4 ,對上一代 YOLOv3 做了各個部分改進,能維持一定檢測速度外,還大幅提升檢測精度,降低硬體的使用量。將 YOLOv4 整合成 APP 後,更利於大家快速使用。
傳統演算法優先,影像分類,可解釋性,物件偵測,語意分割,物件分割,異常檢測,學好樣本,雙網路檢測。
馬變成斑馬,斑馬變成馬。夏天變冬天,冬天變夏天。照片變油畫,油畫變照片。整張照片風格變換效果較好,例如:照片變油畫,油畫變照片。部分照片風格變換效果較差,例如:馬變成斑馬,斑馬變成馬。將風格變換對象放大佔整張照片的50%以上甚至滿版,背景單純,效果才會好。
可解釋性, 影像分類, 物件偵測, 語意分割, 物件分割, 人臉辨識, 姿態辨識, 車牌辨識
YOLOv4 的前身,透過優化 CNN 架構,降低20%運算量,但是精度維持不變。
使用初步訓練好的模型,標註新的訓練影像,節省時間。
使用 OpenCV 進行傳統類比錶頭影像辨識。
廣泛應用於醫療影像分析、生物影像分析、自駕車影像分析、瑕疵檢測等。
影像資料擴增的方法主要有旋轉、平移、翻轉、縮放、伸展、斜體、彈性皺摺等方法,但須注意合理性。
號稱比 Mask R-CNN 快3倍,但是準確度略低。
Transformer 是一種新的深度學習網路架構,在序列性任務的表現特別好,常用於自然語言處理(NLP)、語音辨識等領域。臉書最近發表的影像辨識模型 DETR ,特別採用 Transformer 架構應用在物件偵測上。
影像拼接是指將兩張有重疊部分的影像,拼接成一張圖。影像拼接有兩大步驟:影像對準和影像混合。相關的應用有:全景圖製作及影像穩定等。
Barcode 及 QR code是應用最廣泛的影像分析演算法,普遍應用在文件管制、商品進出貨紀錄、商店結帳、手機付款等。
目前正確率最高的物件偵測演算法,可以應用在工廠瑕疵檢測、醫療影像分析、生物影像分析、工安影像分析、口罩影像分析等。
可以應用在門禁系統、安全監控等。
可以應用在工廠瑕疵檢測、醫療影像分析、生物影像分析、工安影像分析、口罩影像分析等。
可以應用在工廠瑕疵檢測、醫療影像分析、魚類影像分析、生物影像分析、先進駕駛輔助系統、自動駕駛車等。
labelImg 是一個用於深度學習影像標記 (annotation) 的軟體,標記會以 XML (PASCAL VOC format) 格式儲存。
影像分類 AlexNet 使用方法介紹
我的影像樣本有一百萬張要如何訓練?如何避免 over fitting?案例分享,如何做到無 Underkill、無 Overkill?說到底, AI 是賺錢工具!人不會被 AI 取代 但是 不懂 AI 的人會被懂得用 AI 的人取代
使用深度學習,分析 Live 影像及預測股價。
用 Caffe 深度學習框架、 SSD 演算法分析 PCB 電路板的影像。用 labelImg 標註影像。
深度學習簡介、使用 TensorFlow 進行影像分析、使用 OpenR8 進行影像分析
1 [2]