基于微分流形的非線性降維方法研究
本文選題:非線性數(shù)據(jù)降維 + 流形學(xué)習(xí); 參考:《上海大學(xué)》2016年博士論文
【摘要】:現(xiàn)今信息時(shí)代中,文字、聲音、圖像等幾乎所有的信息載體均以高維非結(jié)構(gòu)化數(shù)據(jù)的形式進(jìn)行存儲(chǔ)、處理和傳輸。但是,高維數(shù)據(jù)難以直接被現(xiàn)有的機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘和數(shù)據(jù)分析算法有效的處理。如何在海量繁雜的高維數(shù)據(jù)中找出影響其變化或分布的潛在關(guān)鍵因素是信息科學(xué)領(lǐng)域中的基本問題。數(shù)據(jù)降維是解決這類問題的主要技術(shù)手段,包括線性降維和非線性降維兩類方法。由于現(xiàn)實(shí)數(shù)據(jù)的分布往往具有非線性的特點(diǎn),線性降維方法在實(shí)際應(yīng)用中受到了很大的限制。因此,非線性降維方法成為解決這類問題的主要方法,在機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺、數(shù)據(jù)挖掘和圖像分析等眾多領(lǐng)域得到了廣泛的研究,是該領(lǐng)域的研究熱點(diǎn)之一。目前,數(shù)據(jù)的非線性降維方法主要包括基于神經(jīng)網(wǎng)絡(luò)的方法、基于核函數(shù)的方法和流形學(xué)習(xí)方法。其中,流形學(xué)習(xí)方法因其具有清晰的幾何解釋和生物學(xué)依據(jù)吸引了廣泛的關(guān)注。但是,現(xiàn)階段流形學(xué)習(xí)方法仍處于理論研究階段,存在著許多問題阻礙著其實(shí)際應(yīng)用。本文重點(diǎn)針對(duì)流形學(xué)習(xí)方法中的鄰域選擇、嵌入方法和高維數(shù)據(jù)預(yù)處理等關(guān)鍵問題,開展理論方法和仿真實(shí)驗(yàn)研究。首先通過算法解析現(xiàn)有流形學(xué)習(xí)方法如Isomap、LLE、LTSA等的優(yōu)缺點(diǎn),以及在人臉識(shí)別與頭部姿態(tài)估計(jì)和人體三維步態(tài)捕獲問題中的應(yīng)用。根據(jù)計(jì)算機(jī)視覺中人臉識(shí)別與頭部姿態(tài)估計(jì)兩者相互作用的現(xiàn)象,通過使用近鄰圖構(gòu)建覆蓋,定義點(diǎn)到流形的距離等方法和手段,提出一種對(duì)于人臉識(shí)別與頭部姿勢(shì)估計(jì)問題的整體解決方案,并通過對(duì)FacePix數(shù)據(jù)集的仿真實(shí)驗(yàn)驗(yàn)證了方法的有效性;诹餍畏从尺\(yùn)動(dòng)變化規(guī)律這一特性,利用Isomap方法找出像素空間和人體骨架點(diǎn)空間中的低維步態(tài)流形,采用廣義回歸神經(jīng)網(wǎng)絡(luò)建立圖像、步態(tài)流形、人體骨架點(diǎn)之間的映射關(guān)系,達(dá)到從圖像中獲取人體三維步態(tài)信息的目的,并采用Weizamann人體行為數(shù)據(jù)庫和卡內(nèi)基梅隆大學(xué)運(yùn)動(dòng)捕捉數(shù)據(jù)庫,通過實(shí)驗(yàn)驗(yàn)證了方法的有效性。其次,分析降維效果的評(píng)價(jià)指標(biāo)和現(xiàn)有鄰域選取方法的缺陷。針對(duì)目前鄰域選取方法存在的短路現(xiàn)象和曲率差異過大等問題,使用奇異值分解、余弦定理等數(shù)學(xué)工具,通過分析合理鄰域的特性,提出兩種基于流形曲率變化的自適應(yīng)最大線性鄰域選擇方法,即基于法空間夾角的鄰域選擇方法和基于數(shù)據(jù)點(diǎn)分布的鄰域選擇方法。進(jìn)一步地,針對(duì)經(jīng)典流形學(xué)習(xí)方法對(duì)于鄰域參數(shù)選取敏感的問題,以Isomap和LLE兩種方法為例,提出了改進(jìn)算法,通過使用最大線性鄰域替代固定鄰域,并在目標(biāo)函數(shù)中引入權(quán)重,以提升降維效果和降維魯棒性。另外,基于微分幾何中流形的定義,提出了一種基于圖集相容性轉(zhuǎn)換的流形學(xué)習(xí)方法。通過分析‘圖集’和‘相容性條件’,及其在散亂點(diǎn)云數(shù)據(jù)中的物理意義,使用PCA和仿射變換等數(shù)學(xué)方法,構(gòu)建最小化鄰域交集點(diǎn)嵌入坐標(biāo)誤差的目標(biāo)函數(shù),將其轉(zhuǎn)化為帶約束的極值問題。采用拉格朗日乘子法研究該問題的廣義特征向量求解方法,并給出增量學(xué)習(xí)和重構(gòu)問題的解決方案。通過在散亂點(diǎn)云數(shù)據(jù)集、Isomap人臉圖像數(shù)據(jù)集和LLE人臉圖像數(shù)據(jù)集上的降維和重構(gòu)實(shí)驗(yàn),驗(yàn)證了該方法的有效性。最后,針對(duì)高維數(shù)據(jù)集中的噪聲和數(shù)據(jù)點(diǎn)分布不均勻情況下,會(huì)導(dǎo)致流形降維誤差增大的問題,對(duì)含有不同強(qiáng)度噪聲和不同稀疏度的數(shù)據(jù)集的降維結(jié)果進(jìn)行了分析。提出了去除噪聲和數(shù)據(jù)插值的預(yù)處理方法,使用線性投影、坐標(biāo)系變換、快速凸包算法等手段,去除噪聲并使數(shù)據(jù)點(diǎn)的分布相對(duì)均勻。通過對(duì)散亂點(diǎn)云數(shù)據(jù)集進(jìn)行數(shù)據(jù)預(yù)處理,并進(jìn)行降維實(shí)驗(yàn)驗(yàn)證了方法的有效性。
[Abstract]:This paper presents a general solution to the problem of human face recognition and head pose estimation by using Isomap method to find out the relationship between human face recognition and head pose estimation . In addition , based on the definition of manifold in differential geometry , this paper presents a method for solving the problem of reducing dimension error by using PCA and affine transformation .
【學(xué)位授予單位】:上海大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP391.41
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 曾憲華;羅四維;;局部保持的流形學(xué)習(xí)算法對(duì)比研究[J];計(jì)算機(jī)工程與應(yīng)用;2008年29期
2 劉志勇;;基于保距與保拓?fù)涞牧餍螌W(xué)習(xí)算法[J];長江大學(xué)學(xué)報(bào)(自然科學(xué)版)理工卷;2010年02期
3 閆志敏;劉希玉;;流形學(xué)習(xí)及其算法研究[J];計(jì)算機(jī)技術(shù)與發(fā)展;2011年05期
4 楊海紅;;流形學(xué)習(xí)中鄰域大小的選擇算法[J];山西煤炭管理干部學(xué)院學(xué)報(bào);2011年01期
5 周華;蔡超;丁明躍;;基于流形學(xué)習(xí)和流形高階近似的圖像距離度量[J];華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2012年03期
6 石陸魁;張軍;宮曉騰;;基于鄰域保持的流形學(xué)習(xí)算法評(píng)價(jià)模型[J];計(jì)算機(jī)應(yīng)用;2012年09期
7 談超;關(guān)佶紅;周水庚;;增量與演化流形學(xué)習(xí)綜述[J];智能系統(tǒng)學(xué)報(bào);2012年05期
8 徐蓉;姜峰;姚鴻勛;;流形學(xué)習(xí)概述[J];智能系統(tǒng)學(xué)報(bào);2006年01期
9 羅四維;趙連偉;;基于譜圖理論的流形學(xué)習(xí)算法[J];計(jì)算機(jī)研究與發(fā)展;2006年07期
10 周紅;吳煒;滕奇志;楊曉敏;李e,
本文編號(hào):2087544
本文鏈接:http://www.lk138.cn/shoufeilunwen/xxkjbs/2087544.html