基于模糊聚類的報警數(shù)據(jù)并行融合方法
【文章頁數(shù)】:6 頁
【部分圖文】:
圖1并行FCM算法流程圖
Map過程的主要任務(wù)是計算數(shù)據(jù)樣本點到聚類中心的幾何距離,再通過隸屬度計算公式將幾何距離轉(zhuǎn)化成隸屬度,最后將該樣本點數(shù)據(jù)、所屬的聚類中心點以及對應(yīng)的隸屬度輸出。首先從HDFS上讀取數(shù)據(jù),并以指定的(key,value)對輸入格式作為Map函數(shù)的輸入值,其中key為數(shù)據(jù)樣本點的id....
圖2Ambari大數(shù)據(jù)平臺拓?fù)鋱D
通過搭建真實的Ambari版本的大數(shù)據(jù)平臺來驗證所提方法的有效性。分布式大數(shù)據(jù)處理平臺環(huán)境為CentOS7開源平臺下的分布式集群。實驗環(huán)境的整體拓?fù)鋱D如圖2所示,其中Ambari分布式集群由4個節(jié)點組成,包括1臺服務(wù)器主節(jié)點Master和3臺服務(wù)器作為從節(jié)點,分別為Slave1、....
圖3不同模糊指數(shù)下的融合率對比
同時,為驗證本設(shè)計的并行融合方法比常規(guī)的FCM融合方法在單臺服務(wù)器上運行的時間效率和數(shù)據(jù)融合率更高,通過控制大數(shù)據(jù)集群工作的服務(wù)器數(shù)量,來進(jìn)行時間效率和數(shù)據(jù)融合率的對比。圖4和圖5分別給出了不同模糊指數(shù)下改進(jìn)的并行融合方法和常規(guī)的FCM融合方法的運行時間和數(shù)據(jù)融合率對比圖。圖4....
圖5融合率對比
圖4運行時間對比由圖4可知,本算法提出的基于MapReduce編程模型的并行融合方法比常規(guī)的FCM融合方法在運行效率上有明顯的優(yōu)勢,當(dāng)1≤m≤3時,消耗的時間縮短,當(dāng)m>3時,融合所需要的時間開始變長,并隨著模糊指數(shù)的增大趨向平穩(wěn),雖然當(dāng)m=3時所消耗的時間最短,但是從圖5可知....
本文編號:3986907
本文鏈接:http://www.wukwdryxk.cn/guanlilunwen/ydhl/3986907.html