中國水利水電出版傳媒集團 中國水利水電出版社
聯合國教科文組織合作伙伴
打造水電知識資源中心、水電知識服務中心
作者/譯者: 張學龍 著
出版時間: 2017年08月第1版 2017年08月第1次印刷
出版社: 中國水利水電出版社
書號: ISBN 978-7-5170-5687-4
定價 ¥30.00
| 書 號 | ISBN 978-7-5170-5687-4 | 計算機號 | |
|---|---|---|---|
| 書 名 | 數據挖掘中的文本分類研究 | ||
| 作 譯 者 | 張學龍 著 | ||
| 開 本 | 特16 平裝 | 字 數 | 105 千字 |
| 印 張 | 6 | 頁 數 | 96 頁 |
| 出版時間 | 2017年08月第1版 2017年08月第1次印刷 | ||
| 出 版 社 | 中國水利水電出版社 | ||
| 定 價 | 30.00 元 | 網上售價 | 27.00 元 |
| 分 類 號 | TP274 | ||
| 主 題 詞 | 數據采集-研究 | ||
本書基于數據挖掘的相關技術做了如下幾個方面的工作:①針對標準互信息和tf.idf特征權重公式的缺點提出了改進方法,改進的方法明顯提高了宏觀準確率、宏觀召回率和宏觀F1值;②針對標準tf.idf方法估算特征權重的盲目性,提出了基于實數域粗糙集理論的特征頻率重要度加權方法,該方法改善了樣本空間的分布狀態,明顯提高了文本分類的效果;③提出了一種基于互信息和信息熵對的特征選擇方法,利用該方法進行特征選擇的分類效果接近代表分類水平的支持向量機;④提出了基于粗糙集的多知識粒度的啟發式屬性約簡方法,通過引入悲觀和樂觀多粒度函數,有效提高了分類的效率和準確率;⑤研究了基于深度學習的主要模型,并選擇其中的Autoencoder進行文本分類研究,在語料庫20NG上進行了驗證,證明了方法的有效性。

¥70.20¥78.00

¥79.20¥88.00

¥34.20¥38.00

¥31.50¥35.00

¥62.10¥69.00

¥31.50¥35.00

¥44.10¥49.00

¥88.20¥98.00

¥61.20¥68.00

¥80.82¥89.80