a国产,中文字幕久久波多野结衣AV,欧美粗大猛烈老熟妇,女人av天堂

基于Hadoop云計算平臺的K-Means聚類算法研究

發(fā)布時間:2018-03-11 21:47

  本文選題:Hadoop 切入點:云計算 出處:《哈爾濱理工大學》2017年碩士論文 論文類型:學位論文


【摘要】:聚類分析作為數據挖掘技術最熱門的研究方向之一,一直倍受廣大研究學者與開發(fā)人員的青睞。聚類可以將用戶輸入的原始數據對象分成數個類簇,算法的目標就是相同類簇內的數據對象間相似程度較高,不同類簇內的數據對象間相似程度較低。隨著移動互聯網、物聯網以及人工智能的發(fā)展,Web端產生的信息量越來越龐大,如何高效穩(wěn)定地對超大規(guī)模數據進行聚類分析成為了一個全新的研究課題。Hadoop分布式云計算平臺的興起,使利用多個計算節(jié)點進行并行計算去解決傳統串行算法的性能問題成為可能。本文深入研究Hadoop分布式云計算平臺和聚類算法等相關技術。設計并實現一套基于Hadoop平臺的聚類分析系統。系統共分為三層架構,分別為底層驅動層、中間邏輯層以及對外服務層。文中詳細闡述系統的設計思想及具體實現過程,旨在將聚類分析具體操作在內部進行高度封裝,并對外暴露簡單操作接口,使具體算法實現對用戶透明,穩(wěn)定高效地執(zhí)行聚類分析。通過深入分析K-Means算法中存在的問題,設計基于Hadoop分布式平臺的改進方案。使用本文實現的聚類分析系統配置實驗環(huán)境,分別從并行隨機采樣、樣本距離計算并行化以及數據對象聚類過程并行化三個方向優(yōu)化算法執(zhí)行過程,同時對改進的K-Means并行算法流程進行了詳細描述。最后分別從收斂速度、正確率、初始化采樣速率和集群環(huán)境下加速比四個方向對改進的K-Means并行算法進行實驗測試。實驗結果表明本文設計的基于Hadoop分布式云計算平臺的聚類分析系統能夠提供高效、穩(wěn)定、可配置的聚類分析服務。改進的K-Means并行聚類算法能夠快速處理大規(guī)模的聚類分析計算。
[Abstract]:As one of the hottest research directions of data mining technology, clustering analysis has always been favored by many researchers and developers. Clustering can divide the original data objects input by users into several clusters. The target of the algorithm is that the degree of similarity among data objects in the same cluster is higher, and the similarity degree among data objects in different clusters is lower. With the development of mobile Internet, the Internet of things and the development of artificial intelligence, the amount of information generated by the Web end becomes more and more large. How to cluster large scale data efficiently and stably has become a new research topic, Hadoop distributed cloud computing platform. It is possible to solve the performance problems of traditional serial algorithms by parallel computing with multiple computing nodes. In this paper, we deeply study the Hadoop distributed cloud computing platform and clustering algorithms, and design and implement a set of Hadoop based on cloud computing platform and clustering technology. The system is divided into three layers. In this paper, the design idea and implementation process of the system are described in detail. The purpose of this paper is to encapsulate the concrete operation of cluster analysis in the inside, and to expose the simple operation interface. By analyzing the problems existing in K-Means algorithm, an improved scheme based on Hadoop distributed platform is designed, and the experimental environment is configured with the cluster analysis system realized in this paper. The parallel random sampling, the parallelization of sample distance computation and the parallelization of data object clustering are respectively used to optimize the execution process of the algorithm. At the same time, the improved K-Means parallel algorithm flow is described in detail. Finally, the convergence rate of the improved K-Means parallel algorithm is discussed. The experimental results of the improved K-Means parallel algorithm show that the cluster analysis system based on Hadoop distributed cloud computing platform can provide high efficiency. Stable and configurable clustering services. The improved K-Means parallel clustering algorithm can deal with large scale cluster analysis and computation quickly.
【學位授予單位】:哈爾濱理工大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TP311.13

【相似文獻】

相關期刊論文 前10條

1 李斌,郭劍毅;聚類分析在客戶關系管理中的研究與應用[J];計算機工程與設計;2005年02期

2 張宏翔;李星;;基于聚類分析的學生學習相關性研究[J];計算機光盤軟件與應用;2013年11期

3 蔡建國;;排序聚類分析在成組技術中的應用[J];機械工藝師;1985年01期

4 董玉祥;排序聚類分析計算程序[J];成組生產系統;1986年01期

5 A·Gongaware,Inyong Ham,焦虹;用于成組制造系統的聚類分析法[J];成組生產系統;1986年02期

6 史逸芬,蔡建國;排序聚類分析法在相似零件成組中的應用[J];成組生產系統;1986年03期

7 徐大威,王鴻歌;聚類分析應用程序系統[J];冶金自動化;1988年01期

8 張春早;會議評判與聚類分析[J];機械工程;1988年02期

9 吳國安;聚類分析在鳥的分類中的應用[J];黑龍江大學自然科學學報;1989年04期

10 盧澤生;;零件分類成組的聚類分析法[J];機械工程師;1990年04期

相關會議論文 前10條

1 梅翠;;我國各地區(qū)居民收入差距及其對消費的制約[A];中國現場統計研究會第12屆學術年會論文集[C];2005年

2 李均立;傅國華;;海南各縣(市)經濟實力的聚類分析[A];中國現場統計研究會第12屆學術年會論文集[C];2005年

3 劉黃金;曹林峰;;南京服務業(yè)發(fā)展的聚類分析[A];江蘇省現場統計研究會第十次學術年會論文集[C];2006年

4 肖靜;楊澤峰;徐辰武;;微陣列表達譜監(jiān)督聚類分析方法的比較研究[A];江蘇省遺傳學會第七屆代表大會暨學術研討會論文摘要匯編[C];2006年

5 路愛峰;崔玉杰;;滬市電力上市公司經營業(yè)績的聚類分析[A];中國數學力學物理學高新技術交叉研究學會第十二屆學術年會論文集[C];2008年

6 陳國華;廖小蓮;夏君;;證券投資分析的聚類分析方法[A];中國企業(yè)運籌學[2011(1)][C];2011年

7 張紅衛(wèi);隗金水;;聚類分析評價與測量效度關系探討[A];第九屆全國體育科學大會論文摘要匯編(4)[C];2011年

8 牛東曉;乞建勛;;網絡資源平衡問題的聚類分析優(yōu)化遺傳算法研究[A];2001年中國管理科學學術會議論文集[C];2001年

9 詹原瑞;彭書杰;李如一;;基于聚類分析的企業(yè)信用等級評價方法[A];西部開發(fā)與系統工程——中國系統工程學會第12屆年會論文集[C];2002年

10 鄒曉玫;修春波;;基于聚類分析的犯罪率相關因素的研究[A];當代法學論壇(二○一○年第3輯)[C];2010年

相關博士學位論文 前4條

1 張建萍;基于計算智能技術的聚類分析研究與應用[D];山東師范大學;2014年

2 李成安;分布式環(huán)境下聚類分析新方法的研究[D];浙江大學;2006年

3 楊旭杰;基于統計方法模型分析的中藥復方專利保護研究[D];北京中醫(yī)藥大學;2012年

4 李寶玲;王裕頤教授學術思想與臨床經驗總結及治療眩暈證治規(guī)律研究[D];北京中醫(yī)藥大學;2012年

相關碩士學位論文 前10條

1 李元俊;大學生就業(yè)能力培養(yǎng)與社會需求的匹配性研究[D];山東建筑大學;2015年

2 馮雪冰;基于模糊理論的EM算法在聚類分析的應用研究[D];中國地質大學(北京);2015年

3 張沛之;基于聚類分析的海報風格分類之研究[D];青島大學;2015年

4 何力驁;基于聚類分析的激光誘導擊穿光譜爆炸物識別技術研究[D];北京理工大學;2016年

5 趙文睿;基于聚類分析的中國房地產企業(yè)信用評級實證研究[D];吉林大學;2016年

6 賈偉;基于聚類分析和灰色模型的短期雷擊預警系統設計[D];吉林大學;2016年

7 欒海洋;動車組質量數據聚類分析研究與應用[D];北京交通大學;2016年

8 黃智函;盜竊犯罪時空分布特征研究[D];福州大學;2014年

9 王冰冰;雙類型信息網絡聚類分析[D];吉林大學;2016年

10 劉劍;基于聚類分析的CAM模板自動提取的研究[D];華中科技大學;2014年

,

本文編號:1600043

資料下載
論文發(fā)表

本文鏈接:http://www.wukwdryxk.cn/shoufeilunwen/xixikjs/1600043.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶6b582***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
午夜男女刺激爽爽影院| 亚洲日韩一中文字暮AV | 国产 字幕 制服 中文 在线| 亚洲www| 成年免费视频黄网站在线观看| 亚洲精品无码专区在线| 无码人妻丰满熟妇啪啪网站| 蜜芽亚洲AV无码精品国产| 日韩啪啪视频| 91香蕉亚洲精品一区二区| 三级国产三级国产三级国产电影| 99亚洲| 久久人人爽人人爽爽久久小说| 五月婷婷在线观看| 黄页网站免费频道大全| AAA级久久久精品无码片软件| 亚洲成a人v电影在线观看| 丁香五月缴情在线| 99久久人妻无码精品系列蜜桃| 日韩精品无码一区二区三区免费| 久久亚洲精品11p| 亚洲一区| 狠狠爱av| www.欧美.com| www.超碰在线| 欧美精品一区二区三区四区| 日韩综合在线| 久久久久久久久久久久久久久| av鲁鲁| 脱丝袜| 欧美九九九| 欧美日韩国产激情一区| 性高朝久久久久久久3小时| 欧美性大战xxxxx久久久| 国产成人免费一区二区三区| 丰满人妻被公侵犯完整版| JZZIJZZIJ日本成熟少妇| 国产在线午夜卡精品影院| 久久久久国色A∨免费看| 久久久久99精品成人片| 亚洲AV专区无码观看精品天堂|