基于深度學習的細粒度圖像分類方法研究
【文章頁數(shù)】:75 頁
【學位級別】:碩士
【部分圖文】:
圖2 人臉細粒度圖像分類識別結果
為了驗證所研究方法的分類識別的效果,隨機選取上文數(shù)據(jù)庫中的三幅不同人臉、不同表情的人臉圖像。將所研究方法與文獻[3](基于深度遷移學習的微型細粒度圖像分類)和文獻[4](基于文本與視覺信息的細粒度圖像分類)進行對比仿真,測試三種方法的分類如圖2所示。由圖2可知,文獻[3]方法的分....
圖1.1總體技術方案
基于深度學習的細粒度圖像分類方法研究6使用多尺度特征采樣方法對特征區(qū)域進行采樣,在兼顧巖石樣本整體特征信息的同時,挖掘樣本多種尺度細節(jié)信息;最后,使用超圖的特征融合方法統(tǒng)籌樣本的整體和細節(jié)特征信息。該識別方法為大規(guī)模的巖石圖像標注和識別提供了一種新方法,有效提高了細粒度巖石圖像的....
圖2.1ResNet構建單元(Heetal.,2016)
判愕奶卣魈崛∧芰Γ??綺閌?蕉啾澩錟芰υ角浚?深層網(wǎng)絡提取的特征更抽象,更具有語義信息。但隨著網(wǎng)絡深度的增加,模型的精度會逐漸增加到飽和并迅速下降,這就是深層網(wǎng)絡的“退化(degradation)”問題。雖然許多深度網(wǎng)絡采取了ReLU激活函數(shù)、批量歸一化(BN)等操作緩解梯度消失....
圖2.2RetinaNet基礎結構(Linetal.,2017b)
由于受制于類別失衡(classimbalance),算法的檢測精度偏低。為了解決類別失衡這一問題,Lin等人(2017b)提出使用focalloss替代交叉熵損失,通過調整損失函數(shù)的計算公式使一階段目標檢測算法達到和FasterR-CNN同樣的準確度。focalloss的計算方式....
本文編號:4033722
本文鏈接:http://www.lk138.cn/kejilunwen/shengwushengchang/4033722.html