在線社會網絡用戶的興趣主題分析與地理位置預測
發(fā)布時間:2020-07-24 07:57
【摘要】:隨著社會發(fā)展,人類的信息傳播活動越來越明顯地展示出分眾特征,對用戶的細致分類及預測成為信息傳播領域一個重要的研究課題。在社會網絡中,快速準確地對用戶進行分類,尋找相似的在線社會網絡用戶,預測受眾地理位置,對理解用戶特點、改善用戶體驗、提高信息傳播效果等方面都具有重要的意義。本文研究用戶興趣主題分類、多屬性綜合相似用戶查找、視頻受眾地理位置預測,具體內容如下:(1)提出了三種對微博用戶進行分類的方法。①提出了基于信息內容對微博用戶進行分類的方法,首先使用LDA主題模型從信息內容中提取每個用戶的主題分布作為特征值,然后采用支持向量機等模型對用戶進行分類。②提出了基于粉絲拓撲關系對用戶分類的方法,首先依據我們所發(fā)現(xiàn)的具有相同興趣主題的用戶傾向于擁有共同粉絲這一關系,使用平均值法從粉絲交集中提取每個用戶的特征值,然后采用支持向量機等模型進行分類。③提出了比較概率估計值和合并特征值兩種綜合方法,用這兩種綜合方法把上述基于信息內容分類方法和基于粉絲拓撲關系分類方法的結果綜合起來,得到更準確的分類結果。(2)提出基于直覺模糊集發(fā)現(xiàn)興趣、行為、個人信息等多個屬性綜合相似的用戶的方法。首先根據兩個用戶的某個屬性的差值,通過計算相似度和差異度,構造出表示這個屬性相似程度的一個直覺模糊數。然后采用集成算子,根據每個屬性分別對應的直覺模糊數,計算得到表示多個屬性綜合相似程度的直覺模糊數。最后對每個表示綜合相似程度的直覺模糊數,計算出它的得分值和精確度,并進行排序。多個屬性綜合相似的用戶就是與得分值和精確度排名靠前者相對應的用戶。(3)提出了基于k近鄰多標簽分類的在線視頻受眾位置預測方法。首先把受眾位置預測轉換為多標簽分類問題,在線視頻受眾位置預測即是預測視頻最受歡迎的地區(qū)排名,把在線視頻看作樣本,把受眾地區(qū)看作標簽,則受眾位置預測問題即看成多標簽分類問題。然后對經典的k近鄰多標簽分類方法ML-KNN進行了兩點改進:①引入基于權重的樣本相似度測量方法,并給出了計算特征權重的方法;②設計了快速查找相似樣本的算法,提高了查找速度。在此基礎上,提出基于k近鄰多標簽分類的受眾位置預測方法AL-KNN。這三部分的研究內容,都使用了大規(guī)模的數據對研究的結果進行了驗證:對用戶興趣分類和相似用戶查找,使用了最具影響力的微博網絡Twitter的數據進行實驗驗證;對視頻受眾位置預測,使用了最流行的在線視頻分享網絡Youtube的數據進行實驗驗證。
【學位授予單位】:武漢大學
【學位級別】:博士
【學位授予年份】:2015
【分類號】:TP391.1;G206
【圖文】:
2013年底,美國科技博客Business邋Insider對全球最為流行的在線社會網絡逡逑做了統(tǒng)計分析,排名最前面的15個在線社會網絡站點的月度活躍用戶數量都超逡逑過了邋1億⑴,如圖1-1所示。其中,用戶量最大的Facebook月度活躍用戶人數達逡逑到了邋11.5億,緊跟其后的YouTube月度活躍用戶人數為10億人,新浪微博和逡逑twitter分別為5億和2億?梢哉f,僅僅從用戶數量看,在線社會網絡也是人們逡逑不可忽視的領域,更不用說它還從速度、信息容量和形式上改變了人們的社交方逡逑式,對社會經濟、政治和文化產生了巨大的影響。逡逑Largest邋Social邋Networks邋In邋The邋World逡逑Monthfy邋Active邋Users邋(Unless邋Noini邋Otherwfse}逡逑ym逡逑US9邋..:u?逡逑l.QOd逡逑103&逡逑Br邋iNTELLfGENCK逡逑:i邋.逡逑too逡逑.Ill逡逑圖1-1在線社會網絡用戶數量統(tǒng)計逡逑1.1.2在線社會網絡用戶特征分析逡逑在線社會網絡為人們提供了各種便捷的生活方式,最重要的是,比起社會網逡逑絡中社會關系的維持,建立和保持在線社會網絡中的人際聯(lián)系所需要的時間和精逡逑力要少的多,在這里,人們更傾向于保持一個更為廣泛的社會關系網絡。因此,逡逑這個體系也就擁有了越來越多的人的參與
圖1-2研究內容的結構圖逡逑論文的組織逡逑文共分為六個章節(jié)。逡逑一章為緒論,主要介紹本文選題的研究背景、動機、主要研究內容安排。逡逑二章對本文所涉及的國內外相關工作進行介紹,給出了用戶興趣用戶、受眾位置預測等所涉及的研究領域的相關工作,以及介紹相識構成了本文的研宄基礎。逡逑三章首先基于信息內容對用戶按興趣進行分類,然后分析用戶興撲關系,并基于這一分析對用戶按興趣進行分類,最后綜合信息內關系對用戶進行分類。逡逑四章首先提出確定每種屬性的直覺模糊數的方法,然后給出基于
MySpace中用戶的宗教、國家、年齡等方面都表現(xiàn)出了明顯的同質性。我們依據逡逑這些研究所得出的結果,假設微博中粉絲關系與其興趣偏好之間與存在同質性,逡逑即具有相同興趣的用戶傾向于擁有共同的粉絲。圖3-1顯示了粉絲一致性假設的逡逑示例,節(jié)點al和a2為同一興趣類別的用戶,節(jié)點bl和cl為另外兩種不同興_邋.逡逑類別的用戶,節(jié)點fl到f9為粉絲用戶,兩個節(jié)點間的有向箭頭表示粉絲關系廣逡逑例如節(jié)點al和fl之間存在指向fl的箭頭表明fl為al的粉絲。在圖中實例即表逡逑現(xiàn)出了粉絲一致性假設,即因為用戶al和a2具有共同的興趣類別,所以他們的逡逑共同粉絲數量較多,包括f3、f5、f6和f7四個共同粉絲。而al和bl因為具有逡逑不同的興趣類別,所以他們的共同粉絲數量較少,包括fl和f4兩個共同粉絲,逡逑同時另外三組al和cl、a2和bl以及a2和cl同樣因為屬于不同的興趣類別,逡逑所以粉絲數量較小,其值小于等于2,明顯小于屬于同一興趣類別的al和a2的逡逑共同粉絲數量。逡逑33逡逑
本文編號:2768545
【學位授予單位】:武漢大學
【學位級別】:博士
【學位授予年份】:2015
【分類號】:TP391.1;G206
【圖文】:
2013年底,美國科技博客Business邋Insider對全球最為流行的在線社會網絡逡逑做了統(tǒng)計分析,排名最前面的15個在線社會網絡站點的月度活躍用戶數量都超逡逑過了邋1億⑴,如圖1-1所示。其中,用戶量最大的Facebook月度活躍用戶人數達逡逑到了邋11.5億,緊跟其后的YouTube月度活躍用戶人數為10億人,新浪微博和逡逑twitter分別為5億和2億?梢哉f,僅僅從用戶數量看,在線社會網絡也是人們逡逑不可忽視的領域,更不用說它還從速度、信息容量和形式上改變了人們的社交方逡逑式,對社會經濟、政治和文化產生了巨大的影響。逡逑Largest邋Social邋Networks邋In邋The邋World逡逑Monthfy邋Active邋Users邋(Unless邋Noini邋Otherwfse}逡逑ym逡逑US9邋..:u?逡逑l.QOd逡逑103&逡逑Br邋iNTELLfGENCK逡逑:i邋.逡逑too逡逑.Ill逡逑圖1-1在線社會網絡用戶數量統(tǒng)計逡逑1.1.2在線社會網絡用戶特征分析逡逑在線社會網絡為人們提供了各種便捷的生活方式,最重要的是,比起社會網逡逑絡中社會關系的維持,建立和保持在線社會網絡中的人際聯(lián)系所需要的時間和精逡逑力要少的多,在這里,人們更傾向于保持一個更為廣泛的社會關系網絡。因此,逡逑這個體系也就擁有了越來越多的人的參與
圖1-2研究內容的結構圖逡逑論文的組織逡逑文共分為六個章節(jié)。逡逑一章為緒論,主要介紹本文選題的研究背景、動機、主要研究內容安排。逡逑二章對本文所涉及的國內外相關工作進行介紹,給出了用戶興趣用戶、受眾位置預測等所涉及的研究領域的相關工作,以及介紹相識構成了本文的研宄基礎。逡逑三章首先基于信息內容對用戶按興趣進行分類,然后分析用戶興撲關系,并基于這一分析對用戶按興趣進行分類,最后綜合信息內關系對用戶進行分類。逡逑四章首先提出確定每種屬性的直覺模糊數的方法,然后給出基于
MySpace中用戶的宗教、國家、年齡等方面都表現(xiàn)出了明顯的同質性。我們依據逡逑這些研究所得出的結果,假設微博中粉絲關系與其興趣偏好之間與存在同質性,逡逑即具有相同興趣的用戶傾向于擁有共同的粉絲。圖3-1顯示了粉絲一致性假設的逡逑示例,節(jié)點al和a2為同一興趣類別的用戶,節(jié)點bl和cl為另外兩種不同興_邋.逡逑類別的用戶,節(jié)點fl到f9為粉絲用戶,兩個節(jié)點間的有向箭頭表示粉絲關系廣逡逑例如節(jié)點al和fl之間存在指向fl的箭頭表明fl為al的粉絲。在圖中實例即表逡逑現(xiàn)出了粉絲一致性假設,即因為用戶al和a2具有共同的興趣類別,所以他們的逡逑共同粉絲數量較多,包括f3、f5、f6和f7四個共同粉絲。而al和bl因為具有逡逑不同的興趣類別,所以他們的共同粉絲數量較少,包括fl和f4兩個共同粉絲,逡逑同時另外三組al和cl、a2和bl以及a2和cl同樣因為屬于不同的興趣類別,逡逑所以粉絲數量較小,其值小于等于2,明顯小于屬于同一興趣類別的al和a2的逡逑共同粉絲數量。逡逑33逡逑
【參考文獻】
相關期刊論文 前6條
1 葛紅美;何炎祥;陳強;徐超;;一種基于時間片的微博用戶分類方法[J];小型微型計算機系統(tǒng);2013年11期
2 李思男;李寧;李戰(zhàn)懷;;多標簽數據挖掘技術:研究綜述[J];計算機科學;2013年04期
3 周雒維;管春;盧偉國;;多標簽分類法在電能質量復合擾動分類中的應用[J];中國電機工程學報;2011年04期
4 龔艷冰;丁德臣;何建敏;;一種基于直覺模糊集相似度的多屬性決策方法[J];控制與決策;2009年09期
5 姜遠;佘俏俏;黎銘;周志華;;一種直推式多標記文檔分類方法[J];計算機研究與發(fā)展;2008年11期
6 李凡,徐章艷;Vague集之間的相似度量[J];軟件學報;2001年06期
本文編號:2768545
本文鏈接:http://www.wukwdryxk.cn/xinwenchuanbolunwen/2768545.html