国产伦乱,一曲二曲欧美日韩,AV在线不卡免费在线不卡免费,搞91AV视频

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

垂直搜索引擎中的網(wǎng)頁對象抽取模型及實現(xiàn)技術研究碩士論文.pdf

發(fā)布時間:2016-08-10 20:15

  本文關鍵詞:垂直搜索引擎中的網(wǎng)頁對象抽取模型及實現(xiàn)技術研究,,由筆耕文化傳播整理發(fā)布。


文檔介紹:
湖南大學碩士學位論文垂直搜索引擎中的網(wǎng)頁對象抽取模型及實現(xiàn)技術研究姓名:王實申請學位級別:碩士專業(yè):軟件工程指導教師:林亞平20090401摘要隨著因特網(wǎng)技術的快速發(fā)展,網(wǎng)上信息呈幾何級數(shù)增長,由于網(wǎng)絡信息載體的異構性和多變性,如何檢索和處理這些海量信息成為目前重要的研究課題。Web信息抽取是指從半結構化的網(wǎng)頁中抽取指定的信息,將其形成結構化的數(shù)據(jù)填入數(shù)據(jù)庫中供用戶查詢使用的過程。Web信息抽取是提高信息檢索尤其是垂直領域信息檢索性能的重要手段之一,本文研究垂直搜索引擎中的Web信息抽取技術。本文首先總結了Web信息抽取的主要技術,從Web信息抽取系統(tǒng)的構成入手,分析了模板檢測、模板生成和數(shù)據(jù)抽取三個主要過程涉及到的關鍵問題及傳統(tǒng)解決方式。針對垂直搜索引擎應用背景下傳統(tǒng)信息抽取技術的局限性,提出了相應的改進方法。對于模板檢測,本文在傳統(tǒng)的DOM樹編輯距離算法的基礎上,根據(jù)節(jié)點的對布局的影響程度賦予其不同的權值,提出一種新的網(wǎng)頁結構相似性計算算法,實驗結果分析表明,采用新的算法對動態(tài)模板網(wǎng)頁進行聚類的效果比傳統(tǒng)算法有明顯改進。對于模板生成和數(shù)據(jù)抽取,本文提出了基于聚類的模板混合生成算法,該算法結合網(wǎng)頁聚類過程中樣本網(wǎng)頁之間結構相似性... 內容來自轉載請標明出處.


  本文關鍵詞:垂直搜索引擎中的網(wǎng)頁對象抽取模型及實現(xiàn)技術研究,由筆耕文化傳播整理發(fā)布。



本文編號:90948

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/kejilunwen/sousuoyinqinglunwen/90948.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶364ec***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
日韩小说视频一区在线观看| 亚洲AV日韩美AV在线播放| 久久国产欧美日韩一区二| 欧美 日韩 五月 性爱| 好吊妞儿视频WWW| 欧美内射WWW·COM| 女人特黄视频直播| 亚洲第一福利导航| 男人到了天堂AV电影在线| av丝袜在线干| 久色成人电影| 国产人妻| 熟女丝袜一区二区三区免费视频| 日本激情免费网站| 色综合视频在线| 国产护士又大又大又粗又爽| 大香蕉网视频免费| 亚洲一区二区小说| 高清中文av| 欧美亚洲国产一区二区三| 精品久九久九| 久久影院精品| 麻豆63区| 中文字幕日韩经典一区二区不卡| 欧美午福利在线视频| 4hu影院| 久久亚洲最新地址一| 淫荡五月| 我久久国产成人av| 美女高潮久久久久久久久| 97欧美伦理| 久久精品欧美一区二区三区在线电影| 亚洲加勒比一区二区| 三级久久网| 久久久九九九伦理| 成年午夜黄色| 国产原创自拍一区| 精品一区ww.| 亚洲欧美综合九区| 欧美日韩三区=区| 国产裸体美女永久免费无遮挡|