国产伦乱,一曲二曲欧美日韩,AV在线不卡免费在线不卡免费,搞91AV视频

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

面向中文科研機(jī)構(gòu)的實(shí)體解析研究與實(shí)現(xiàn)

發(fā)布時(shí)間:2025-06-25 23:37
  實(shí)體解析是指匹配并合并數(shù)據(jù)中指向現(xiàn)實(shí)世界同一實(shí)體的數(shù)據(jù)記錄,它是數(shù)據(jù)清洗數(shù)據(jù)集成中關(guān)鍵的一步。傳統(tǒng)的實(shí)體解析研究工作主要是針對(duì)一個(gè)或多個(gè)數(shù)據(jù)庫中的數(shù)據(jù)記錄進(jìn)行解析。網(wǎng)頁數(shù)據(jù)具有非結(jié)構(gòu)化,非格式化的特性,且真實(shí)數(shù)據(jù)中數(shù)據(jù)問題是多種多樣的,因此傳統(tǒng)匹配特征單一的算法很難獲得令人滿意的召回效果。本文通過對(duì)萬方網(wǎng)上的論文數(shù)據(jù)進(jìn)行爬取與解析,構(gòu)建科研信息知識(shí)庫,與傳統(tǒng)實(shí)體解析工作具有不同的應(yīng)用背景。本文首先分析了現(xiàn)有實(shí)體解析算法的特點(diǎn),提出了基于文本匹配的實(shí)體解析算法模型。將長(zhǎng)文本語義屬性的相似度計(jì)算看作文本匹配問題,根據(jù)實(shí)體解析應(yīng)用場(chǎng)景對(duì)文本匹配模型進(jìn)行調(diào)整,結(jié)合字符級(jí)相似度度量方式,捕捉數(shù)據(jù)對(duì)中字符相似度特征和語義相似度特征,對(duì)數(shù)據(jù)進(jìn)行實(shí)體解析。實(shí)驗(yàn)證明該方法比傳統(tǒng)僅考慮字符相似度特征的算法在數(shù)據(jù)噪音較大的任務(wù)中能獲得更好的結(jié)果。隨后分析了實(shí)際網(wǎng)站中爬取的科研數(shù)據(jù)特點(diǎn),提出了結(jié)合屬性相似度、關(guān)系相似度、語義信息相似度的多特征融合實(shí)體解析算法。爬取科研論文數(shù)據(jù),標(biāo)注數(shù)據(jù)構(gòu)建數(shù)據(jù)集。對(duì)機(jī)構(gòu)名稱相似度、關(guān)系網(wǎng)絡(luò)相似度、研究領(lǐng)域相似度三種特征進(jìn)行研究與實(shí)驗(yàn),設(shè)計(jì)了科研機(jī)構(gòu)名稱特征詞算法,構(gòu)建科研機(jī)構(gòu)關(guān)...

【文章頁數(shù)】:68 頁

【學(xué)位級(jí)別】:碩士

【部分圖文】:

圖2-1卷積神經(jīng)網(wǎng)絡(luò)中pooling層示意圖??

圖2-1卷積神經(jīng)網(wǎng)絡(luò)中pooling層示意圖??

它是對(duì)循環(huán)神經(jīng)網(wǎng)絡(luò)RNN的一種改進(jìn),RNN只能較好地利用較近的??信息,對(duì)于較遠(yuǎn)的信息會(huì)逐漸削弱,針對(duì)RNN無法解決的長(zhǎng)期依賴問題,LSTM??在循環(huán)神經(jīng)單元中增加了三個(gè)交互層,如圖2-2所示。LSTM神經(jīng)單元有一條水??平線貫穿整個(gè)模型結(jié)構(gòu),它表征著細(xì)胞狀態(tài),與每個(gè)神經(jīng)單元的輸....


圖2-2?LSTM神經(jīng)單元結(jié)構(gòu)示意圖??LSTM的第一步是決定從細(xì)胞狀態(tài)中丟棄多少信息,即ft函數(shù),也稱為“忘??

圖2-2?LSTM神經(jīng)單元結(jié)構(gòu)示意圖??LSTM的第一步是決定從細(xì)胞狀態(tài)中丟棄多少信息,即ft函數(shù),也稱為“忘??

BDBD?BB???>??圖2-1卷積神經(jīng)網(wǎng)絡(luò)中pooling層示意圖??Relu是一個(gè)非線性的激活函數(shù),它的表達(dá)式是max(0,x)。如果在網(wǎng)絡(luò)結(jié)構(gòu)中??不使用激活函數(shù),那么每一層的輸出都將會(huì)是輸入的線性組合,就會(huì)失去隱藏層??的效果,無法逼近任意函數(shù)。所以需要引入非線性的激活....


圖3-2基于匹配矩陣的文本匹配模型機(jī)構(gòu)??通過卷積核,第一個(gè)卷積層可以捕捉詞與詞之間的匹配特征,第二層卷積層??捕捉到n元組匹配信息,如“喬丹和詹姆斯”與“詹姆斯與喬丹”,“很受歡迎”??與“非常出名”

圖3-2基于匹配矩陣的文本匹配模型機(jī)構(gòu)??通過卷積核,第一個(gè)卷積層可以捕捉詞與詞之間的匹配特征,第二層卷積層??捕捉到n元組匹配信息,如“喬丹和詹姆斯”與“詹姆斯與喬丹”,“很受歡迎”??與“非常出名”

??Q⑩??#?????受麵??圖3-1文本匹配矩陣??在圖像識(shí)別領(lǐng)域,卷積神經(jīng)網(wǎng)絡(luò)(CNN)被廣泛的應(yīng)用,它能成功地從像素??中一層一層的抽取出圖像的各種級(jí)別的相似度特征。受此啟發(fā),PangLiang等人??[21】提出把文本匹配問題看作圖像識(shí)別問題,并用CNN網(wǎng)絡(luò)來捕捉兩個(gè)文....


圖3-3基于文本匹配的實(shí)體解析算法模型??

圖3-3基于文本匹配的實(shí)體解析算法模型??

??圖3-3基于文本匹配的實(shí)體解析算法模型??正如圖3-3所示,n和rj表示兩個(gè)數(shù)據(jù)記錄組成的數(shù)據(jù)記錄對(duì),Ai,A2,A3...An??分別為數(shù)據(jù)的各個(gè)屬性,紅色表示的屬性代表長(zhǎng)文本屬性,藍(lán)色表示的屬性代表??數(shù)值、名詞性屬性。紅色和藍(lán)色的方框分別代表語義相似度模塊和字符相似度模....



本文編號(hào):4052797

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/kejilunwen/ruanjiangongchenglunwen/4052797.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶bee65***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
黑人大屌日本| 大鸡巴插小骚逼免费视频国产| 殴美日韩AAA| 亚洲午夜99| 操自己的视频免费| 在线播放小视频免费视频| www.4卡4| 熟妇丝袜脚中文字幕| 日日躁夜夜躁狠狠久久A∨| 日韩无码电影一区| 国产美女孕妇销魂一区二区| 插入大香蕉在线视频| 无码人妖一区二区| av基地久久久| 精品一区二区三区老司机| 中文字幕无码最新| 免费黄色av网站大全| 欧美插管黄片| 久久午夜美女视频| 美女张开腿网站免费| 美女AV网站免费| 欧美日韩国产亚洲日本精品性爱| 国产精品扒开腿又大又圆| 香港大香蕉一二区| 国产精品99久久免费黑人| 精品一区二区三区四s| 美女被干在线观看| 导航av伦理网播放| 无码在线视频二区| 国产精品2020| 草草影院免费a| 偷拍自拍超碰| 亚洲一区二区三区精品韩国| 亚洲黄色的| 丰满熟女丝袜诱惑视频网站| 久久久久a牛肉| 日韩一区在线ab| 亚洲欧美日本三区三州| 猛天少妇视频| 人妻丁香在线视频| 本道无码电影|