热久久国产精品-热久久国产欧美一区二区精品-热久久精品-热久久精品免费视频-热久久精品在线-热久久久

  熱門(mén)關(guān)鍵詞:
中文文本分類(lèi)中的特征選擇研究
  • 該文件為pdf格式
  • 文件大小: 899.23 KB
  • 下載次數(shù)
  • 文件評(píng)級(jí)
  • 更新時(shí)間:2014-06-12
  • 發(fā) 布 人: lengbingbing
  • 文件下載:
  • 立即下載

  • 文件介紹:
  • 該文件為 pdf 格式(源文件可編輯),下載需要 20 積分
  • 中文文本分類(lèi)中的特征選擇研究
    目的: 隨著信息技術(shù)不斷前進(jìn)和互聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展和普及,信息呈近乎爆炸的形式急速膨脹。無(wú)論網(wǎng)絡(luò)上、企業(yè)中或是個(gè)人系統(tǒng)上,都有海量的信息需要處理。文本作為計(jì)算機(jī)系統(tǒng)中信息的最重要表現(xiàn)形式之一,其增長(zhǎng)速度更為驚人。如何在海量文本庫(kù)中搜尋、過(guò)濾和管理這些文本成為一個(gè)亟待解決的問(wèn)題。作為數(shù)據(jù)挖掘技術(shù)的重要手段之一,基于機(jī)器學(xué)習(xí)的文本分類(lèi)技術(shù)可以在較大程度上解決文本庫(kù)雜亂無(wú)章的現(xiàn)象,幫助人們將大量的文本自動(dòng)分門(mén)別類(lèi),從而更好地把握文本信息,使信息的價(jià)值最大化。 在采用向量空間模型對(duì)文本進(jìn)行表示的情況下,文本分類(lèi)的最大特點(diǎn)和困難之一是特征空間的高維性和文檔表示向量的稀疏性。中文的詞條總數(shù)有二十多萬(wàn)條,尋求一種有效的特征抽取算法,降低特征空間的維數(shù),提高分類(lèi)的效率和精度,成為文本自動(dòng)分類(lèi)中需要首先面對(duì)的重要問(wèn)題。特征選擇是解決這個(gè)問(wèn)題的有效方法。 本選題的核心目的就在于研究如何進(jìn)行特征項(xiàng)的選取,使得分類(lèi)的效率和效果最好。 思路: 首先需要理解中文文本分類(lèi)技術(shù)以及應(yīng)用的框架,熟悉中文文本分類(lèi)技術(shù)的各個(gè)組成部分,然后搭建一個(gè)中文文本分類(lèi)的輔助平臺(tái)(包括分詞組件、分類(lèi)器、測(cè)試文檔集、訓(xùn)練文檔集,大部分都可以從開(kāi)源軟件或公開(kāi)資料里獲得),在輔助平臺(tái)的基礎(chǔ)上研究特征相的提取并用實(shí)驗(yàn)檢驗(yàn)之。 方法: 通過(guò)閱讀大量的資料或文檔學(xué)習(xí)所要用的知識(shí)和技術(shù),并通過(guò)實(shí)驗(yàn)驗(yàn)證自己的想法和理論。 相關(guān)支持條件: PC、java或C++開(kāi)發(fā)環(huán)境、中文文本分類(lèi)輔助平臺(tái)(自己搭建)、Internet ...
驗(yàn)證碼: 請(qǐng)?jiān)谟覀?cè)輸入驗(yàn)證碼 看不清楚,換一個(gè)
中文文本分類(lèi)中的特征選擇研究_下載(pdf格式) 技術(shù)文檔 主站蜘蛛池模板: 国产精久久一区二区三区 | 亚洲精品高清国产麻豆专区 | 91视频青青草| 农村高清性色生活片 | 国产色婷婷 | 精品午夜寂寞影院在线观看 | 97影院理论片在线观看 | 国内精品自在欧美一区 | 日日草夜夜草 | 2021在线永久免费视频 | 久久精品亚洲99一区二区 | 国内精品久久久久不卡 | 日日爽日日操 | 网站久久 | 五月婷婷免费视频 | 日本在线一区二区三区 | 日日躁夜夜躁狠狠天天 | 国产成人精品日本亚洲直接 | 在线视频 自拍 | 亚洲欧美日本国产综合在线 | 96国产xxxx | 国产精选一区二区 | 黄色理伦 | 日本 在线播放 | 12345国产精品高清在线 | 欧美天天性影院 | 国产精品尹人在线观看免费 | 日本中文字幕在线观看 | 国产免费人成在线视频视频 | 久久国产精品自在自线 | 日韩成人一级 | 神马97| 成人免费在线视频 | 中文欧美一级强 | 中文字幕在线播放一区 | 狠狠做狠狠做综合日日 | 最新狠狠色狠狠色综合 | 欧美黑人激情性久久 | 狼人香蕉香蕉在线视频播放 | 一级日本强免费 | 一区二区三区日韩 |