基于CUDA的離散元法DEM實現(xiàn)方法的改進
本文選題:GPU + OpenCL。 參考:《吉林大學》2017年碩士論文
【摘要】:DEM(Discrete Element Method)離散元法是一種數(shù)值模擬仿真方法,在研究并分析大量顆粒物體在運動過程中產(chǎn)生相互作用方面頗有成效,是目前為止最為流行的一種分析方法,最先由Cundall提出。它的理論核心是離散化運動過程中的非連續(xù)物體,從而通過公式計算出非連續(xù)體的整體運動狀態(tài)?焖俚挠嬎、較小存儲空間的需求是DEM離散元法的特點。本課題組持續(xù)多年的研究,對離散元法的理論架構(gòu)和體系結(jié)構(gòu)有了深入的了解。但是當進行大規(guī)模數(shù)量的顆粒的運算時仍然會出現(xiàn)由于計算時間過長導(dǎo)致的計算結(jié)果不及預(yù)期的現(xiàn)象。本課題組成員針對上述問題提出了一種解決方法,使用GPU來替代CPU,從而加快計算速度。GPU在單核性能方面遠不及CPU,如處理復(fù)雜邏輯算法方面GPU相對CPU稍遜一些;但是在多個核心的并發(fā)方面,GPU的并發(fā)能力要遠遠超過CPU,該比例可達1~2個數(shù)量級。為了達到GPU替代CPU的目的,該成員使用了并行計算架構(gòu)Open CL。Open CL是較為普遍的并行計算架構(gòu),不局限于硬件條件,因此經(jīng)常受到大多數(shù)科研人員的青睞。但是,在性能與精確度方面,遠不如CUDA并行計算架構(gòu),如在處理雙精度數(shù)值時,由于Open CL只能處理單精度,在計算結(jié)果中會出現(xiàn)較大的誤差。CUDA是由NVIDIA公司提出的一種并行計算架構(gòu)。該計算架構(gòu)提供了雙精度運算,同時還提供了大量豐富的API,在提高開發(fā)效率的同時降低了實現(xiàn)設(shè)備端程序的成本。本論文在已有的理論基礎(chǔ)與算法之上,使用CUDA,對以O(shè)pen CL顆粒系統(tǒng)進行改進,從而滿足了運算速度與精確度的要求。通過大量數(shù)據(jù)的測試,CUDA顆粒系統(tǒng)的計算結(jié)果與Open CL顆粒系統(tǒng)的計算結(jié)果相似,在使用相同計算參數(shù)時程序的運行時間差別不大,但是在顆粒細微運動下的仿真效果更為精確。同時,根據(jù)算法和CUDA并行計算架構(gòu)的特點,對CUDA顆粒系統(tǒng)進行優(yōu)化,從而進一步加快運行速度。最后,本論文對CUDA顆粒系統(tǒng)進行了全面測試,通過顆粒與顆粒、顆粒與多種圖元邊界碰撞的測試來分析CUDA顆粒系統(tǒng)的正確性以及運行效率。
[Abstract]:DEM(Discrete Element method discrete element method is a numerical simulation method, which is very effective in studying and analyzing the interaction of a large number of particles in the process of motion. It is the most popular analysis method by far, first proposed by Cundall. The core of its theory is the discontinuous object in the process of discrete motion, and the whole motion state of the discontinuous body is calculated by the formula. Fast calculation and small storage space are the characteristics of DEM discrete element method. After many years of research, we have a deep understanding of the theoretical framework and architecture of the discrete element method (DEM). However, when a large number of particles are calculated, the calculation results are not as expected due to the long calculation time. In view of the above problems, the members of our group put forward a solution, using GPU to replace CPU, so as to speed up the calculation speed. GPU in the performance of single core is far less than CPU, such as handling complex logic algorithm GPU is a bit inferior to CPU; However, the concurrency capability of GPUs in multiple core concurrency is much higher than that of CPU, and the ratio can reach 1 ~ 2 orders of magnitude. In order to replace CPU with GPU, Open CL.Open CL is a common parallel computing architecture, which is not limited to hardware, so it is often favored by most researchers. However, in terms of performance and accuracy, it is far less than the CUDA parallel computing architecture, for example, when dealing with double-precision values, because Open CLs can only handle single-precision, Large errors occur in the calculation results. CUDA is a parallel computing architecture proposed by NVIDIA. The architecture provides double precision operation and a lot of rich API, which improves the development efficiency and reduces the cost of implementing the device side program. Based on the existing theories and algorithms, this paper improves the particle system with Open CL by using CUDA, which meets the requirements of operation speed and accuracy. The calculation results of CUDA particle system are similar to those of Open CL particle system, and the running time of the program is not different when the same calculation parameters are used, but the simulation results are more accurate under the fine motion of particles. At the same time, according to the characteristics of the algorithm and CUDA parallel computing architecture, the CUDA particle system is optimized to further accelerate the running speed. Finally, the CUDA particle system is tested in this paper, and the correctness and operation efficiency of CUDA particle system are analyzed by the collision test of particle and particle, particle and many kinds of graph element boundary.
【學位授予單位】:吉林大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TB115
【相似文獻】
相關(guān)期刊論文 前10條
1 侯再恩,張可村;堆積顆粒系統(tǒng)中顆粒級配的優(yōu)化[J];高校應(yīng)用數(shù)學學報A輯(中文版);2005年04期
2 張林;傅金波;鄧成榮;;外力作用下二維六角密排顆粒系統(tǒng)中力的分布[J];湖北民族學院學報(自然科學版);2006年04期
3 王春香;陳麗梅;;顆粒系統(tǒng)的自組織臨界性[J];科技信息;2008年31期
4 王宏達;李子軍;;較大顆粒上浮的物理機制[J];物理通報;1998年12期
5 宜晨虹;慕青松;苗天德;;帶有點缺陷的二維顆粒系統(tǒng)離散元模擬[J];物理學報;2008年06期
6 王春香;陳麗梅;;顆粒系統(tǒng)的廣義勢函數(shù)及自組織臨界指數(shù)[J];齊齊哈爾大學學報;2009年02期
7 宜晨虹;蔣慶宇;慕青松;苗天德;;點缺陷對二維顆粒系統(tǒng)力鏈幾何分布的影響[J];蘭州大學學報(自然科學版);2009年06期
8 云中客;;鋼球使沙塵飛濺[J];物理;2007年09期
9 蘇軍偉;顧兆林;李云;;各向同性顆粒系統(tǒng)數(shù)量平衡方程直接矩積分求解法的研究[J];化學反應(yīng)工程與工藝;2006年04期
10 張玲;歐陽潔;;顆粒系統(tǒng)的多尺度耦合方法[J];工程數(shù)學學報;2006年02期
相關(guān)會議論文 前4條
1 厚美瑛;彭政;劉銳;吳耀宇;陸坤權(quán);陳志強;;顆粒系統(tǒng)中的阻力形式(英文)[A];軟件物質(zhì)物理研討會論文集[C];2005年
2 朱海平;余艾冰;;顆粒系統(tǒng)的平均法[A];數(shù)學·力學·物理學·高新技術(shù)交叉研究進展——2010(13)卷[C];2010年
3 侯再恩;張可村;;堆積顆粒系統(tǒng)中顆粒級配的優(yōu)化模型[A];中國運籌學會第七屆學術(shù)交流會論文集(中卷)[C];2004年
4 宜晨虹;幕青松;苗天德;;點缺陷對二維顆粒系統(tǒng)力鏈幾何分布的影響研究[A];中國力學學會學術(shù)大會'2009論文摘要集[C];2009年
相關(guān)博士學位論文 前4條
1 蔡慧;垂直激勵下環(huán)形顆粒系統(tǒng)中的波動與流動[D];南京大學;2015年
2 李睿;復(fù)雜顆粒系統(tǒng)暫態(tài)特性的研究[D];華中科技大學;2007年
3 王等明;密集顆粒系統(tǒng)的離散單元模型及其宏觀力學行為特征的理論研究[D];蘭州大學;2009年
4 陳志遠;均勻驅(qū)動的復(fù)雜顆粒氣體系統(tǒng)的動力學特征研究[D];華中科技大學;2008年
相關(guān)碩士學位論文 前10條
1 王有偉;各向異性顆粒系統(tǒng)對微波傳播過程的影響[D];寧夏大學;2016年
2 趙晨;探索科普插圖在醫(yī)學研究中的應(yīng)用[D];北京印刷學院;2017年
3 姜振平;基于CUDA的離散元法DEM實現(xiàn)方法的改進[D];吉林大學;2017年
4 張林;二維顆粒系統(tǒng)中力分布的理論研究[D];南京師范大學;2005年
5 蘇向英;低維非均勻顆粒系統(tǒng)的動力學行為研究[D];華中科技大學;2006年
6 雷雅潔;非均勻顆粒系統(tǒng)的物理特性研究[D];華中科技大學;2004年
7 王春香;顆粒系統(tǒng)中雙穩(wěn)現(xiàn)象的研究[D];貴州大學;2006年
8 鄭鶴鵬;軸對稱顆粒系統(tǒng)的靜應(yīng)力分析[D];中南大學;2008年
9 李湘群;側(cè)面受限顆粒系統(tǒng)的Janssen轉(zhuǎn)向比問題研究[D];中南大學;2010年
10 田健;基于OpenCL的離散元法仿真優(yōu)化軟件改進研究[D];吉林大學;2015年
,本文編號:1822641
本文鏈接:http://www.wukwdryxk.cn/shoufeilunwen/benkebiyelunwen/1822641.html