廣告推薦系統(tǒng)的硬件優(yōu)化設計與實現(xiàn)
發(fā)布時間:2020-12-09 06:38
新型互聯(lián)網(wǎng)廣告通過建立網(wǎng)絡用戶與廣告之間的信息關系,利用智能化廣告推薦技術匹配用戶潛在感興趣的廣告定向投放。目前智能化廣告推薦系統(tǒng)以傳統(tǒng)的軟件CPU實現(xiàn)方式為主,但是隨著數(shù)據(jù)量的增加,由于CPU的計算性能不足,軟件CPU的實現(xiàn)方式存在用戶響應時間長和吞吐量低的問題。針對本文研究的廣告推薦系統(tǒng),綜合分析并且選擇基于FPGA的硬件加速方案提升廣告推薦系統(tǒng)的計算性能。本文概述了廣告推薦系統(tǒng)模型并且分析了FM和FFM算法優(yōu)缺點,設計了基于FFM和DNN的混合推薦算法。為了解決廣告推薦系統(tǒng)的服務器CPU計算性能不足,本文做了四方面工作:第一,充分利用本文研究的推薦算法的重復計算和FPGA的并行計算能力設計了基于FPGA的廣告推薦系統(tǒng)的硬件加速架構。第二,本文通過設計了基于URAM的數(shù)據(jù)分片的方案優(yōu)化了FPGA計算時的數(shù)據(jù)傳輸時耗。第三,本文通過可重構計算、分布式并行計算和DSP資源復用的優(yōu)化設計方案提高了FPGA的并行計算能力。第四,本文提出了基于LSM的分段多項式算法和分段線性查找表和EC-CORDIC算法擬合激活函數(shù),提高了傳統(tǒng)擬合方法的精度,減少了FPGA邏輯資源使用。最后本文搭建了廣告推...
【文章來源】:華中科技大學湖北省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:94 頁
【學位級別】:碩士
【部分圖文】:
廣告推薦系統(tǒng)模型
圖 3-2服務器CPUCPUCPUCPUDDRFPGA計算DDRPCIE=4, =10, =18 損失函數(shù)變化可以發(fā)現(xiàn),F(xiàn)FM 算法隱向量的維度 對算法的性能后性能評估參數(shù) AUC 如表 3-1 所示。表 3-1 =4, =10, =18 AUC 值對比 4 維 10 維 值 0.7479 0.7606 值 0.7237 0.7326 節(jié)采用 AdaGrad 優(yōu)化器的迭代算法以及 FFM 算法的 值,本仿真測試的參數(shù) =80, =18,在迭代過程法的損失函數(shù)對比曲線如圖 3-3。
24圖 3-3 FM 和 FFM 算法的損失值從圖 3-3 中可以發(fā)現(xiàn),剛開始迭代損失函數(shù)下降很快,越到后面下降的越慢,說明經(jīng)過了 100 次迭代已經(jīng)收斂理論極限值。而且可以看出 FFM 算法的迭代的損失函數(shù)極限值是小于 FM 算法的,所以 FFM 算法的性能是優(yōu)于 FM 算法的。AdaGrad 優(yōu)化器對應的 AUC 指標如表 3-2。表 3-2 AUC 值數(shù)據(jù)集 FM 算法 FFM 算法 DNN+FMM 算法訓練 AUC 值 0.7457 0.7780 0.7902測試 AUC 值 0.7248 0.7380 0.7633從上表中的測試結果可以看出,不管是訓練數(shù)據(jù)集還是線上測試數(shù)據(jù)集基于FFM 和 DNN 混合推薦算法 AUC 值都優(yōu)于 FM 算法和 FFM 算法,而且 FFM 算法的性能是優(yōu)于 FM 算法的,所以說明本文研究推薦系統(tǒng)使用基于 FFM 和 DNN 混合推薦算法時可行的。3.2 廣告推薦系統(tǒng)的硬件架構設計第二章分析了 CPU/GPU/FPGA/ASIC 的性能,選擇 FPGA 作為本文研究的廣告推薦系統(tǒng)的硬件加速方案,所以需要在廣告推薦系統(tǒng)利用 FPGA 的并行計算能力和低延時的特性設計加速系統(tǒng)架構
本文編號:2906456
【文章來源】:華中科技大學湖北省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:94 頁
【學位級別】:碩士
【部分圖文】:
廣告推薦系統(tǒng)模型
圖 3-2服務器CPUCPUCPUCPUDDRFPGA計算DDRPCIE=4, =10, =18 損失函數(shù)變化可以發(fā)現(xiàn),F(xiàn)FM 算法隱向量的維度 對算法的性能后性能評估參數(shù) AUC 如表 3-1 所示。表 3-1 =4, =10, =18 AUC 值對比 4 維 10 維 值 0.7479 0.7606 值 0.7237 0.7326 節(jié)采用 AdaGrad 優(yōu)化器的迭代算法以及 FFM 算法的 值,本仿真測試的參數(shù) =80, =18,在迭代過程法的損失函數(shù)對比曲線如圖 3-3。
24圖 3-3 FM 和 FFM 算法的損失值從圖 3-3 中可以發(fā)現(xiàn),剛開始迭代損失函數(shù)下降很快,越到后面下降的越慢,說明經(jīng)過了 100 次迭代已經(jīng)收斂理論極限值。而且可以看出 FFM 算法的迭代的損失函數(shù)極限值是小于 FM 算法的,所以 FFM 算法的性能是優(yōu)于 FM 算法的。AdaGrad 優(yōu)化器對應的 AUC 指標如表 3-2。表 3-2 AUC 值數(shù)據(jù)集 FM 算法 FFM 算法 DNN+FMM 算法訓練 AUC 值 0.7457 0.7780 0.7902測試 AUC 值 0.7248 0.7380 0.7633從上表中的測試結果可以看出,不管是訓練數(shù)據(jù)集還是線上測試數(shù)據(jù)集基于FFM 和 DNN 混合推薦算法 AUC 值都優(yōu)于 FM 算法和 FFM 算法,而且 FFM 算法的性能是優(yōu)于 FM 算法的,所以說明本文研究推薦系統(tǒng)使用基于 FFM 和 DNN 混合推薦算法時可行的。3.2 廣告推薦系統(tǒng)的硬件架構設計第二章分析了 CPU/GPU/FPGA/ASIC 的性能,選擇 FPGA 作為本文研究的廣告推薦系統(tǒng)的硬件加速方案,所以需要在廣告推薦系統(tǒng)利用 FPGA 的并行計算能力和低延時的特性設計加速系統(tǒng)架構
本文編號:2906456
本文鏈接:http://www.wukwdryxk.cn/wenyilunwen/guanggaoshejilunwen/2906456.html