2

YOLOv1 - 您只需看一次(物体检测)

 3 years ago
source link: https://panchuang.net/2021/09/20/yolov1%e2%80%8a-%e2%80%8a%e6%82%a8%e5%8f%aa%e9%9c%80%e7%9c%8b%e4%b8%80%e6%ac%a1%e7%89%a9%e4%bd%93%e6%a3%80%e6%b5%8b/
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.
neoserver,ios ssh client

YOLOv1 - 您只需看一次(物体检测)

fendouai • 2021年9月20日 am5:04 • Medium

在本章節中,回顧了FIRE(脸书AI研究)的YOLOV1.網絡只查看圖像一次以偵測多個物件.因此,它被稱為Yolo,你只看一次。

只需查看一次圖像,偵測速度是实时(45fps)。FAST YOLOv1達到155fps。這是另一種最先進的深度學習對象檢測方法,在我寫這篇文章時已於2016年年CVPR發表,引用次數超過2000次。

下面是作者提供的YOLOv1範例:

如果有興趣,他們還提供其他YOLOv1範例:

  • YOLO观看YouTube(上)
  • YOLO观看YouTube(下)
  • YOLO观看YouTube第三部分
  • YOLO守望自然(上)
  • YOLO守望自然(下)

4.1预留

  • 先用Imagnet千级數據集對捲積層做訓練
  • 訓練只使用前20層捲積層,後面接上一個Average-Pooling Layer和一個全連結層

4.2.边界框正規化

  • yolo訓練前會先依據輸入圖的長寬,正規化(规格化)的長寬,因此包围盒的長寬會介於0~1之間
  • 边界框的中心座標(x,y)是在特定网格单元的偏移(偏移),所以座標也會介於0~1之間

4.3激活功能

  • YOLO架構除了最後一層用線性輸出為,每一層都會搭配漏电整流线性激活(漏电重启)
  • 因為“Relu會使部分神經元的輸出為0,可以讓神經網路變得稀疏,緩解過度擬合的問題。但衍生出另一個問題是,某些神經元可能永遠不會被激活,導致相應的參數永遠不能被更新(失效重新连接问题)

4.4列车详细信息

  • 將預訓練好的部分再接上隨機權重的四層捲積層,和兩層F.C.
  • 因為偵測任務通常需要细粒度视觉資訊,提高解析度為448∗448
  • bw,bh:yolo訓練前會先依據輸入圖的長寬,正規化(规格化)的長寬,因此包围盒的長寬會介於0~1之間
  • Bx,By:边界框的中心座標(x,y)是在特定网格单元的偏移(偏移),所以座標也會介於0~1之間
  • 除了最後一層用线性激活,其他都是泄漏继电器

4.5微调细节

  • 纪元:≈≈135,动量:0.9
  • 衰减:0.0005,從第一個連接層之後丢失:0.5%
  • 学习率調整
  • 做圖像了20%HSV色空间中做了1.5倍曝光度和飽和度的隨機調整

5.非最大值抑制

通常做物件偵測時,有可能一個物件被很多候選框給選到(如下圖),下左圖就是一個例子假設算法抓到這麼多框都是物件,這時我們會採用非最大抑制將多餘的候選框濾除

2.將信心度很低的Bound Box先丟掉,並選出Confiability最高的Box,並假設他為“確定的物件”並加入物件集合

3.將剩餘的Bound Box和Confiability最高的Box、如果算出來的IOU大於設定好的Threshold、那些剩餘的Bound Box的Confiability會被設定為0(也就是這個Bbox重複計算要刪掉)

4.重複上述步驟直到剩下的信心都是0,這時候被存在“物件集合”的物件就是最後結果

原创文章,作者:fendouai,如若转载,请注明出处:https://panchuang.net/2021/09/20/yolov1%e2%80%8a-%e2%80%8a%e6%82%a8%e5%8f%aa%e9%9c%80%e7%9c%8b%e4%b8%80%e6%ac%a1%e7%89%a9%e4%bd%93%e6%a3%80%e6%b5%8b/


About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK