可訓練自訂的語音資料集,推論並輸出類別,不需上網,即可達成邊緣端語音轉文字的功能。
Pix2Pix 架構和 GAN 類似,但不在於產生仿真的影像,而是希望透過監督學習的方式,讓原影像輸出訓練學習的影像風格。例如 : 黑白轉換成彩色、邊緣圖轉換相片、地圖轉換成衛星地圖等各種應用。
此 APP是將一張低解析度(Low Resolution)的影像,利用 SRGAN 生成一張高解析度 (High Resolution),提高影像的解析度。
CycleGAN 是發表在 ICCV2017 image-to-image translation 的著名演算法,最大特點為不要求訓練數據要成對,只需要提供不同 domain 的影像就能成功訓練不同 domain 之間的影像轉換。 可應用於語義標籤的街道轉換成寫實影像、衛星影像轉換成地圖影像、將場景從白天轉換成夜晚。
AI 人體骨架偵測、跌倒偵測、人流計數。其中人體骨架偵測,可偵測出鼻子、眼睛、耳朵、脖子、肩部、手肘、手腕、髖關節、膝關節、腳踝的位置。
ONNX(Open Neural Network Exchange)是一套開放神經網路交換格式,因為不同框 架有著自己的優勢,若在某框架上比較好,你可以用那個架構訓練了一個神經網路後,透 過轉成 onnx 或再轉成另一個框架來執行。APP 提供兩種模型轉換到 onnx,從 PyTorch 模型轉換到 ONNX 模型,或是從 Tenso
繼承 FasterRCNN 的演算法 - MaskRCNN,對原有的架構進行改 良,增加了 Semantic Segmentation 的部分,可對物體進行分割、 檢出、分類,是相當經典的 Segmentation 演算法。
YOLO Darknet 的維護者俄羅斯人 Alexey Bochkovskiy 發現中研院資科所博後王建堯及所長廖弘源研發的 CSPNet detector 又快又好,於是邀請中研院資科所以此為 backbone 發展 YOLOv4 ,對上一代 YOLOv3 做了各個部分改進,能維持一定檢測速度外,還大幅提升檢測精度,降低硬體的使用量。將 YOLOv4 整合成 APP 後,更利於大家快速使用。
1 2 [3] 4 5 6