《計算機應用研究》|Application Research of Computers

一種基于鄰域系統密度差異度量的離群點檢測算法

Outlier detection algorithm based on neighborhood system density difference measurement

免費全文下載 (已被下載 次)  
獲取PDF全文
作者 杜旭升,于炯,陳嘉穎,王躍飛,蒲勇霖,葉樂樂
機構 新疆大學 軟件學院;新疆大學 信息科學與工程學院;西安交通大學 軟件學院
統計 摘要被查看 次,已被下載
摘要 離群點檢測是數據挖掘中熱點研究方向之一。針對離群點檢測算法LOF在高維離散分布數據集中檢測精度較低及參數敏感性較高的問題,提出了基于鄰域系統密度差異度量的離群點檢測NSD(neighborhood system density difference)算法。算法相較于傳統基于密度的離群點檢測方法引入了截取距離的概念,首先計算數據集中對象在截取距離內的鄰居點個數;其次計算對象的鄰域系統密度;然后將對象的密度與它鄰居的密度進行比較,判定目標對象與其鄰居趨向于同一簇的程度;最后將最可能是離群點的對象輸出。將NSD算法與LOF、LDOF、CBOF算法在真實數據集與合成數據集中對比實驗發現,NSD算法具有較高的檢測準確率和執行效率以及較低的參數敏感性,證明了NSD算法是有效可行的。
關鍵詞 數據挖掘;離群點檢測;基于密度;LOF;LDOF;CBOF
基金項目 國家自然科學基金資助項目(61862060,61462079,61562086,61562078)
本文URL http://www.oirznw.live/article/02-2020-07-013.html
收稿日期
修回日期
頁碼 -
中圖分類號 TP311.1
文獻標志碼
水果机返水