中国韩国日本在线观看免费,A级尤物一区,日韩精品一二三区无码,欧美日韩少妇色

基于深度學習的細粒度圖像分類方法研究

發(fā)布時間:2025-02-11 19:06
  細粒度圖像分類是指在區(qū)分出基本類別的基礎上,進行更詳細的子類劃分,如區(qū)分鳥的種類、車的款式、飛機的型號等。細粒度圖像分類在現(xiàn)實中具有較高的研究價值和深遠的應用前景,因而成為計算機視覺領域的研究熱點。然而,現(xiàn)階段的細粒度圖像分類研究依然面臨一些挑戰(zhàn)。比如:子類別之間的差異往往非常微妙,導致類別間的鑒別性區(qū)域難以被準確定位;物體的姿態(tài)變化與視覺變化,導致對圖像中有效特征的提取工作較難開展。針對這兩個問題,本文基于深度學習,構建了一個細粒度圖像分類模型,該模型包括基于無監(jiān)督學習的鑒別性區(qū)域定位方法、基于循環(huán)注意力的細粒度特征提取方法。模型有效解決了鑒別性區(qū)域難以定位和圖像有效特征難以提取的問題。模型在CUB-200-2011、FGVC-Aircraft以及Stanford Cars數(shù)據(jù)集上進行了實驗,實驗結果表明,該模型與現(xiàn)有先進方法相比具有明顯優(yōu)勢。本文的主要貢獻如下:(1)提出了一種基于無監(jiān)督學習的鑒別性區(qū)域定位方法(Discriminant Region Location Method Based on Unsupervised Learning,DRLU)。首先,方法中的區(qū)域檢測器利用...

【文章頁數(shù)】:75 頁

【學位級別】:碩士

【部分圖文】:

圖2 人臉細粒度圖像分類識別結果

圖2 人臉細粒度圖像分類識別結果

為了驗證所研究方法的分類識別的效果,隨機選取上文數(shù)據(jù)庫中的三幅不同人臉、不同表情的人臉圖像。將所研究方法與文獻[3](基于深度遷移學習的微型細粒度圖像分類)和文獻[4](基于文本與視覺信息的細粒度圖像分類)進行對比仿真,測試三種方法的分類如圖2所示。由圖2可知,文獻[3]方法的分....


圖1.1總體技術方案

圖1.1總體技術方案

基于深度學習的細粒度圖像分類方法研究6使用多尺度特征采樣方法對特征區(qū)域進行采樣,在兼顧巖石樣本整體特征信息的同時,挖掘樣本多種尺度細節(jié)信息;最后,使用超圖的特征融合方法統(tǒng)籌樣本的整體和細節(jié)特征信息。該識別方法為大規(guī)模的巖石圖像標注和識別提供了一種新方法,有效提高了細粒度巖石圖像的....


圖2.1ResNet構建單元(Heetal.,2016)

圖2.1ResNet構建單元(Heetal.,2016)

判愕奶卣魈崛∧芰Γ??綺閌?蕉啾澩錟芰υ角浚?深層網(wǎng)絡提取的特征更抽象,更具有語義信息。但隨著網(wǎng)絡深度的增加,模型的精度會逐漸增加到飽和并迅速下降,這就是深層網(wǎng)絡的“退化(degradation)”問題。雖然許多深度網(wǎng)絡采取了ReLU激活函數(shù)、批量歸一化(BN)等操作緩解梯度消失....


圖2.2RetinaNet基礎結構(Linetal.,2017b)

圖2.2RetinaNet基礎結構(Linetal.,2017b)

由于受制于類別失衡(classimbalance),算法的檢測精度偏低。為了解決類別失衡這一問題,Lin等人(2017b)提出使用focalloss替代交叉熵損失,通過調整損失函數(shù)的計算公式使一階段目標檢測算法達到和FasterR-CNN同樣的準確度。focalloss的計算方式....



本文編號:4033722

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/kejilunwen/shengwushengchang/4033722.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶c73d5***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com