中國水利水電出版?zhèn)髅郊瘓F(tuán) 中國水利水電出版社
聯(lián)合國教科文組織合作伙伴
打造水電知識資源中心、水電知識服務(wù)中心
水電知識網(wǎng)»網(wǎng)上書店»計(jì)算機(jī)»文本分類中的幾個(gè)關(guān)鍵問題研究
作者/譯者: 裴志利 著
出版時(shí)間: 2015年05月第1版 2015年05月第1次印刷
出版社: 中國水利水電出版社
書號: ISBN 978-7-5170-3115-4
定價(jià) ¥25.00
| 書 號 | ISBN 978-7-5170-3115-4 | 計(jì)算機(jī)號 | |
|---|---|---|---|
| 書 名 | 文本分類中的幾個(gè)關(guān)鍵問題研究 | ||
| 作 譯 者 | 裴志利 著 | ||
| 開 本 | 特16 平裝 | 字 數(shù) | 105 千字 |
| 印 張 | 6 | 頁 數(shù) | 96 頁 |
| 出版時(shí)間 | 2015年05月第1版 2015年05月第1次印刷 | ||
| 出 版 社 | 中國水利水電出版社 | ||
| 定 價(jià) | 25.00 元 | 網(wǎng)上售價(jià) | 22.50 元 |
| 分 類 號 | TP274 | ||
| 主 題 詞 | 數(shù)據(jù)采集-研究 | ||
本書基于數(shù)據(jù)挖掘的相關(guān)技術(shù)做了如下幾個(gè)方面的工作:①針對標(biāo)準(zhǔn)互信息和tf.idf特征權(quán)重公式的缺點(diǎn)提出了改進(jìn)方法,改進(jìn)的方法明顯提高了宏觀準(zhǔn)確率、宏觀召回率和宏觀F1值;②針對標(biāo)準(zhǔn)tf.idf方法估算特征權(quán)重的盲目性,提出了基于實(shí)數(shù)域粗糙集理論的特征頻率重要度加權(quán)方法,該方法改善了樣本空間的分布狀態(tài),明顯提高了文本分類的效果;③提出了一種基于互信息和信息熵對的特征選擇方法,利用該方法進(jìn)行特征選擇的分類效果接近代表分類水平的支持向量機(jī);④提出了基于粗糙集的多知識粒度的啟發(fā)式屬性約簡方法,通過引入悲觀和樂觀多粒度函數(shù),有效提高了分類的效率和準(zhǔn)確率;⑤研究了基于深度學(xué)習(xí)的主要模型,并選擇其中的Autoencoder進(jìn)行文本分類研究,在語料庫20NG上進(jìn)行了驗(yàn)證,證明了方法的有效性。

¥63.00¥70.00

¥41.40¥46.00

¥44.10¥49.00

¥50.40¥56.00

¥62.10¥69.00

¥43.20¥48.00

¥53.82¥59.80

¥62.82¥69.80

¥71.82¥79.80

¥43.20¥48.00