《計算機應用研究》|Application Research of Computers

基于支持向量機的中文極短文本分類模型

Classification model based on support vector machine for Chinese extremely short text

免費全文下載 (已被下載 次)  
獲取PDF全文
作者 王楊,許閃閃,李昌,艾世成,趙傳信,甄磊,黃少芬
機構 安徽師范大學 計算機與信息學院
統計 摘要被查看 次,已被下載
摘要 隨著智能終端設備的不斷普及,微信、網絡即時新聞、電商客戶產品評論等富含極短文本數據的信息呈爆發式增長。為了有效提取極短文本中的關鍵特征信息,提出了一種基于支持向量機的極短文本分類模型。首先對原數據進行數據清洗并利用Jieba分詞將清洗過的數據進行處理;再將處理后的數據存入數據庫,通過TF-IDF進行文本特征的提??;同時,利用支持向量機對極短文本進行分類。經過(1-0)檢驗,驗證了模型的有效性。實驗以蕪湖市社管平臺中的9906條極短文本數據作為樣本進行算法檢驗與分析。結果表明在分類準確率方面,該方法相比于樸素貝葉斯、邏輯回歸、決策樹等傳統方法得到有效提高;在誤分度與精確度指標上匹配結果更加均衡。
關鍵詞 支持向量機;Jieba分詞;極短文本分類;TF-IDF
基金項目 國家自然科學基金資助項目(61871412)
安徽省自然科學基金資助項目(1808085MF178)
安徽省人文社科基金資助項目(SK2014ZD033,AHSKY2017D42)
本文URL http://www.oirznw.live/article/02-2020-02-002.html
收稿日期
修回日期
頁碼 -
中圖分類號 TP391.1
文獻標志碼
水果机返水 浙江11选5预测 老11选5是哪里的 18选7 贵州快3走势图图表走 网上的三分赛车是合法的吗 欧美a片演员 内蒙古十一选五开奖一定牛 浙江快乐彩开奖走势 世界杯韩国对德国比分预测 黑龙江11选5推荐号 好运彩3 内蒙古快3彩票走势图 内蒙古11选5牛 辽宁快乐十二选五一 皇冠比分99814纯净版 北京pk10今天开奖记录