音樂流媒體的用戶流失預(yù)測(cè)分析
發(fā)布時(shí)間:2020-12-03 07:46
隨著更多極具競(jìng)爭(zhēng)力產(chǎn)品不斷地涌入市場(chǎng),用戶有著更高的主動(dòng)性去選擇其感興趣的音樂流媒體服務(wù),導(dǎo)致各平臺(tái)必將面臨用戶流失問題加劇的危險(xiǎn)。然而,一方面由于音樂流媒體的用戶記錄數(shù)據(jù)更新速度較快,一個(gè)模型并不能產(chǎn)生永久的效用。另一方面,針對(duì)不同行業(yè)、不同特征的數(shù)據(jù)集,用戶流失預(yù)警模型具有不同的表現(xiàn)形態(tài),不能一概而論。所以,要保證用戶流失預(yù)警體系的實(shí)時(shí)性,必須對(duì)新業(yè)務(wù)和新數(shù)據(jù)集進(jìn)行新的研究。綜上所述,有必要針對(duì)音樂流媒體的用戶流失預(yù)測(cè)問題展開研究,確保準(zhǔn)確預(yù)測(cè)訂閱業(yè)務(wù)中付費(fèi)用戶流失,這對(duì)平臺(tái)長(zhǎng)期成功至關(guān)重要。針對(duì)上述問題,考慮到某個(gè)音樂流媒體服務(wù)平臺(tái)對(duì)付費(fèi)用戶流失預(yù)測(cè)的需求,本文選取了2015年1月1日至2017年2月28日該平臺(tái)生成的用戶記錄數(shù)據(jù)作為原始數(shù)據(jù)。通過數(shù)據(jù)挖掘的相關(guān)方法對(duì)訂閱用戶在當(dāng)前會(huì)員資格到期后的30天內(nèi)是否會(huì)流失的問題進(jìn)行了研究。在研究?jī)?nèi)容上,本文主要從分類分析和聚類分析兩個(gè)角度,展開音樂流媒體用戶流失預(yù)測(cè)模型分析、用戶流失原因及用戶細(xì)分模型分析兩個(gè)方面的討論研究。首先,在流失預(yù)測(cè)模型分析方面。利用Python軟件,對(duì)各數(shù)據(jù)集初步清洗后進(jìn)行單變量和多變量對(duì)比的特征分析,探索音樂...
【文章來源】:廣西師范大學(xué)廣西壯族自治區(qū)
【文章頁數(shù)】:53 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
-means算法流程圖
圖 2 性別變量、流失變量分布圖.2 多變量對(duì)比分析各個(gè)變量進(jìn)行獨(dú)立的統(tǒng)計(jì)分析后,接下來探索變量相互間的特性。通過比較各變對(duì)應(yīng)的流失標(biāo)簽變量的總數(shù),可以較為直觀地了解各變量與流失標(biāo)簽的關(guān)系以及體分布情況。具體結(jié)果如下:1)各城市的用戶流失情況對(duì)比、不同性別下用戶流失情況對(duì)比下圖 3 中的左圖可知,來自編碼為 1 的城市的用戶最多,同時(shí)所占的流失比例也以初步認(rèn)為編碼 1 的城市對(duì)流失預(yù)測(cè)具有很大的影響。從圖 3 中的右圖中可以看男女?dāng)?shù)量相當(dāng),其中的流失人數(shù)也相當(dāng),說明年齡字段點(diǎn)用戶流失預(yù)測(cè)影響不大前對(duì)年齡字段對(duì)變量分析結(jié)果,可以明確可以在建模時(shí)刪除性別變量。
教宓撓沒Я魘гげ夥治?2圖 2 性別變量、流失變量分布圖3.3.2 多變量對(duì)比分析對(duì)各個(gè)變量進(jìn)行獨(dú)立的統(tǒng)計(jì)分析后,接下來探索變量相互間的特性。通過比較各變量取值下對(duì)應(yīng)的流失標(biāo)簽變量的總數(shù),可以較為直觀地了解各變量與流失標(biāo)簽的關(guān)系以及數(shù)據(jù)的大體分布情況。具體結(jié)果如下:(1)各城市的用戶流失情況對(duì)比、不同性別下用戶流失情況對(duì)比從下圖 3 中的左圖可知,來自編碼為 1 的城市的用戶最多,同時(shí)所占的流失比例也最大?梢猿醪秸J(rèn)為編碼 1 的城市對(duì)流失預(yù)測(cè)具有很大的影響。從圖 3 中的右圖中可以看到用戶的男女?dāng)?shù)量相當(dāng),其中的流失人數(shù)也相當(dāng),說明年齡字段點(diǎn)用戶流失預(yù)測(cè)影響不大,結(jié)合之前對(duì)年齡字段對(duì)變量分析結(jié)果,可以明確可以在建模時(shí)刪除性別變量。圖 3 各城市用戶流失情況對(duì)比圖及不同性別下用戶流失情況對(duì)比圖(2)不同訂閱支付方式下和不同注冊(cè)方式下用戶流失情況對(duì)比由下圖 4 中的左圖可知,編碼為 41 的訂閱支付方式最受用戶歡迎,而且其中的流失用戶數(shù)量與其他支付方式區(qū)別不大,編碼為 38 的支付方式用戶流失占比最大。從圖 4 中
【參考文獻(xiàn)】:
期刊論文
[1]基于隨機(jī)森林與RFM模型的財(cái)險(xiǎn)客戶分類管理研究[J]. 閆春,孫海棠,李亞琪. 科技與經(jīng)濟(jì). 2018(01)
[2]基于客戶價(jià)值的客戶行為特征分類模型探討[J]. 朱明英,邢豫,王海霞,王保中. 現(xiàn)代計(jì)算機(jī)(專業(yè)版). 2017(01)
[3]基于新三維客戶細(xì)分模型的線上會(huì)員客戶價(jià)值研究[J]. 葉志龍,黃章樹. 統(tǒng)計(jì)與信息論壇. 2016(05)
[4]基于組合預(yù)測(cè)的電信客戶流失預(yù)測(cè)[J]. 陳曄,覃曉群. 計(jì)算機(jī)與數(shù)字工程. 2015(04)
[5]基于代價(jià)敏感決策樹的客戶價(jià)值細(xì)分(英文)[J]. 鄒鵬,莫佳卉,江亦華,葉強(qiáng). 管理科學(xué). 2011(02)
[6]基于錯(cuò)分類成本的AdaBoost客戶流失預(yù)測(cè)模型研究[J]. 唐邁. 中國(guó)商界(上半月). 2010(11)
[7]基于聚類分析的客戶細(xì)分研究[J]. 季越江,呂佳. 辦公自動(dòng)化. 2009(08)
[8]聚類算法在銀行客戶細(xì)分中的應(yīng)用[J]. 花海洋,趙懷慈. 計(jì)算機(jī)工程. 2008(24)
[9]聚類分析在客戶細(xì)分中的研究與應(yīng)用[J]. 趙喜倉,崔冬梅,竇志紅. 江蘇商論. 2007(08)
[10]數(shù)據(jù)挖掘方法在用戶流失預(yù)測(cè)分析中的應(yīng)用[J]. 劉光遠(yuǎn),苑森淼,董立巖. 計(jì)算機(jī)工程與應(yīng)用. 2007(09)
博士論文
[1]基于半監(jiān)督和集成學(xué)習(xí)的不平衡數(shù)據(jù)特征選擇和分類[D]. 房曉南.山東師范大學(xué) 2016
碩士論文
[1]基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)消費(fèi)者價(jià)值研究[D]. 魏秀安.哈爾濱商業(yè)大學(xué) 2017
[2]基于支持向量機(jī)的不平衡數(shù)據(jù)分類算法研究[D]. 劉東啟.浙江大學(xué) 2017
[3]基于數(shù)據(jù)挖掘的網(wǎng)購(gòu)用戶流失預(yù)測(cè)研究[D]. 郭成蹊.吉林大學(xué) 2016
[4]基于RFM改進(jìn)模型的互聯(lián)網(wǎng)金融平臺(tái)用戶細(xì)分研究[D]. 吳曉雪.北京交通大學(xué) 2016
[5]移動(dòng)通信網(wǎng)用戶流失預(yù)測(cè)[D]. 尹丹丹.中國(guó)科學(xué)技術(shù)大學(xué) 2016
[6]網(wǎng)絡(luò)客戶流失預(yù)測(cè)算法研究[D]. 馬文斌.廣西師范大學(xué) 2016
[7]高維數(shù)據(jù)集上的降維算法及其應(yīng)用[D]. 肖招娣.華南理工大學(xué) 2013
[8]網(wǎng)購(gòu)客戶流失的實(shí)證分析[D]. 馮倩.西南財(cái)經(jīng)大學(xué) 2013
[9]基于數(shù)據(jù)挖掘的客戶流失預(yù)測(cè)實(shí)證研究[D]. 司學(xué)峰.北京工業(yè)大學(xué) 2009
本文編號(hào):2896217
【文章來源】:廣西師范大學(xué)廣西壯族自治區(qū)
【文章頁數(shù)】:53 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
-means算法流程圖
圖 2 性別變量、流失變量分布圖.2 多變量對(duì)比分析各個(gè)變量進(jìn)行獨(dú)立的統(tǒng)計(jì)分析后,接下來探索變量相互間的特性。通過比較各變對(duì)應(yīng)的流失標(biāo)簽變量的總數(shù),可以較為直觀地了解各變量與流失標(biāo)簽的關(guān)系以及體分布情況。具體結(jié)果如下:1)各城市的用戶流失情況對(duì)比、不同性別下用戶流失情況對(duì)比下圖 3 中的左圖可知,來自編碼為 1 的城市的用戶最多,同時(shí)所占的流失比例也以初步認(rèn)為編碼 1 的城市對(duì)流失預(yù)測(cè)具有很大的影響。從圖 3 中的右圖中可以看男女?dāng)?shù)量相當(dāng),其中的流失人數(shù)也相當(dāng),說明年齡字段點(diǎn)用戶流失預(yù)測(cè)影響不大前對(duì)年齡字段對(duì)變量分析結(jié)果,可以明確可以在建模時(shí)刪除性別變量。
教宓撓沒Я魘гげ夥治?2圖 2 性別變量、流失變量分布圖3.3.2 多變量對(duì)比分析對(duì)各個(gè)變量進(jìn)行獨(dú)立的統(tǒng)計(jì)分析后,接下來探索變量相互間的特性。通過比較各變量取值下對(duì)應(yīng)的流失標(biāo)簽變量的總數(shù),可以較為直觀地了解各變量與流失標(biāo)簽的關(guān)系以及數(shù)據(jù)的大體分布情況。具體結(jié)果如下:(1)各城市的用戶流失情況對(duì)比、不同性別下用戶流失情況對(duì)比從下圖 3 中的左圖可知,來自編碼為 1 的城市的用戶最多,同時(shí)所占的流失比例也最大?梢猿醪秸J(rèn)為編碼 1 的城市對(duì)流失預(yù)測(cè)具有很大的影響。從圖 3 中的右圖中可以看到用戶的男女?dāng)?shù)量相當(dāng),其中的流失人數(shù)也相當(dāng),說明年齡字段點(diǎn)用戶流失預(yù)測(cè)影響不大,結(jié)合之前對(duì)年齡字段對(duì)變量分析結(jié)果,可以明確可以在建模時(shí)刪除性別變量。圖 3 各城市用戶流失情況對(duì)比圖及不同性別下用戶流失情況對(duì)比圖(2)不同訂閱支付方式下和不同注冊(cè)方式下用戶流失情況對(duì)比由下圖 4 中的左圖可知,編碼為 41 的訂閱支付方式最受用戶歡迎,而且其中的流失用戶數(shù)量與其他支付方式區(qū)別不大,編碼為 38 的支付方式用戶流失占比最大。從圖 4 中
【參考文獻(xiàn)】:
期刊論文
[1]基于隨機(jī)森林與RFM模型的財(cái)險(xiǎn)客戶分類管理研究[J]. 閆春,孫海棠,李亞琪. 科技與經(jīng)濟(jì). 2018(01)
[2]基于客戶價(jià)值的客戶行為特征分類模型探討[J]. 朱明英,邢豫,王海霞,王保中. 現(xiàn)代計(jì)算機(jī)(專業(yè)版). 2017(01)
[3]基于新三維客戶細(xì)分模型的線上會(huì)員客戶價(jià)值研究[J]. 葉志龍,黃章樹. 統(tǒng)計(jì)與信息論壇. 2016(05)
[4]基于組合預(yù)測(cè)的電信客戶流失預(yù)測(cè)[J]. 陳曄,覃曉群. 計(jì)算機(jī)與數(shù)字工程. 2015(04)
[5]基于代價(jià)敏感決策樹的客戶價(jià)值細(xì)分(英文)[J]. 鄒鵬,莫佳卉,江亦華,葉強(qiáng). 管理科學(xué). 2011(02)
[6]基于錯(cuò)分類成本的AdaBoost客戶流失預(yù)測(cè)模型研究[J]. 唐邁. 中國(guó)商界(上半月). 2010(11)
[7]基于聚類分析的客戶細(xì)分研究[J]. 季越江,呂佳. 辦公自動(dòng)化. 2009(08)
[8]聚類算法在銀行客戶細(xì)分中的應(yīng)用[J]. 花海洋,趙懷慈. 計(jì)算機(jī)工程. 2008(24)
[9]聚類分析在客戶細(xì)分中的研究與應(yīng)用[J]. 趙喜倉,崔冬梅,竇志紅. 江蘇商論. 2007(08)
[10]數(shù)據(jù)挖掘方法在用戶流失預(yù)測(cè)分析中的應(yīng)用[J]. 劉光遠(yuǎn),苑森淼,董立巖. 計(jì)算機(jī)工程與應(yīng)用. 2007(09)
博士論文
[1]基于半監(jiān)督和集成學(xué)習(xí)的不平衡數(shù)據(jù)特征選擇和分類[D]. 房曉南.山東師范大學(xué) 2016
碩士論文
[1]基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)消費(fèi)者價(jià)值研究[D]. 魏秀安.哈爾濱商業(yè)大學(xué) 2017
[2]基于支持向量機(jī)的不平衡數(shù)據(jù)分類算法研究[D]. 劉東啟.浙江大學(xué) 2017
[3]基于數(shù)據(jù)挖掘的網(wǎng)購(gòu)用戶流失預(yù)測(cè)研究[D]. 郭成蹊.吉林大學(xué) 2016
[4]基于RFM改進(jìn)模型的互聯(lián)網(wǎng)金融平臺(tái)用戶細(xì)分研究[D]. 吳曉雪.北京交通大學(xué) 2016
[5]移動(dòng)通信網(wǎng)用戶流失預(yù)測(cè)[D]. 尹丹丹.中國(guó)科學(xué)技術(shù)大學(xué) 2016
[6]網(wǎng)絡(luò)客戶流失預(yù)測(cè)算法研究[D]. 馬文斌.廣西師范大學(xué) 2016
[7]高維數(shù)據(jù)集上的降維算法及其應(yīng)用[D]. 肖招娣.華南理工大學(xué) 2013
[8]網(wǎng)購(gòu)客戶流失的實(shí)證分析[D]. 馮倩.西南財(cái)經(jīng)大學(xué) 2013
[9]基于數(shù)據(jù)挖掘的客戶流失預(yù)測(cè)實(shí)證研究[D]. 司學(xué)峰.北京工業(yè)大學(xué) 2009
本文編號(hào):2896217
本文鏈接:http://www.wukwdryxk.cn/guanlilunwen/tongjijuecelunwen/2896217.html
最近更新
教材專著