基于用戶偏好的購(gòu)物系統(tǒng)信息挖掘
摘 要:
摘 要:隨著電子商務(wù)的蓬勃發(fā)展,本文主要說明建立一個(gè)基于Web數(shù)據(jù)挖掘技術(shù)開發(fā)的購(gòu)物系統(tǒng)。本系統(tǒng)采用B/S 三層體系結(jié)構(gòu),它根據(jù)用戶偏好挖掘?yàn)橛脩籼峁﹤(gè)性化的購(gòu)物服務(wù)。該系統(tǒng)是一個(gè)功能強(qiáng)大、費(fèi)用低廉、通用性強(qiáng)、適合我國(guó)國(guó)情的購(gòu)物網(wǎng)站。
關(guān)鍵詞:
關(guān)鍵詞:購(gòu)物系統(tǒng) 用戶偏好 Web數(shù)據(jù)挖掘技術(shù)
1 問題的提出
近年來,隨著因特網(wǎng)技術(shù)的快速普及和迅猛發(fā)展,各種信息可以以非常便捷的方式在網(wǎng)絡(luò)上獲得,由于因特網(wǎng)在全球互聯(lián)互通,可以從中取得的信息數(shù)量難以計(jì)算,而且因特網(wǎng)的發(fā)展趨勢(shì)繼續(xù)看好,特別是電子商務(wù)的蓬勃發(fā)展為網(wǎng)絡(luò)應(yīng)用提供了強(qiáng)大的支持。那么,購(gòu)物系統(tǒng)中的用戶怎么才能在因特網(wǎng)這個(gè)全球最大的信息倉(cāng)庫(kù)中發(fā)現(xiàn)自己需要的、有價(jià)值的購(gòu)物信息就成為各購(gòu)物網(wǎng)站的研究熱點(diǎn)。然而,Web網(wǎng)頁的內(nèi)容紛繁復(fù)雜,沒有固定結(jié)構(gòu)和規(guī)律、呈現(xiàn)方式也是動(dòng)態(tài)、多樣化,這就大大增加了商品信息檢索的難度。數(shù)據(jù)倉(cāng)庫(kù)資源中蘊(yùn)含的知識(shí)未能得到充分的挖掘和利用,在這個(gè)大數(shù)據(jù)時(shí)代,這個(gè)問題已經(jīng)非常嚴(yán)重。于是有人提議使用搜索引擎(Search Engine)為人們解決信息需求問題,但結(jié)果不盡如人意。因?yàn)槟壳暗乃阉饕娲蟛糠质峭ㄟ^關(guān)鍵字進(jìn)行查詢,面對(duì)這樣浩瀚的商品信息,命中率低并且不能對(duì)特定用戶給予個(gè)性化的服務(wù)。于是基于用戶偏好的Web數(shù)據(jù)挖掘技術(shù)無疑為購(gòu)物商城帶來新的生機(jī),企業(yè)通過有效的用戶信息,可以分析和預(yù)測(cè)用戶的興趣偏好和將來的行為,并為之提供有針對(duì)性的服務(wù),大大降低運(yùn)營(yíng)成本。
這是一種新的商業(yè)處理技術(shù),它是通過商業(yè)數(shù)據(jù)庫(kù)中有效的業(yè)務(wù)數(shù)據(jù)進(jìn)行提取、轉(zhuǎn)換、分析和其他模型化的處理之后提煉出輔助商業(yè)決策的重要數(shù)據(jù)。因此,實(shí)現(xiàn)基于用戶偏好的購(gòu)物系統(tǒng)信息挖掘就顯得格外重要。
2 基于用戶偏好的購(gòu)物系統(tǒng)結(jié)構(gòu)分析
該購(gòu)物系統(tǒng)不僅能實(shí)現(xiàn)商品銷售網(wǎng)站的各種功能,還能根據(jù)用戶的特點(diǎn)和需求有預(yù)見性地提供服務(wù),另外管理員還具有對(duì)商品信息的管理功能。一個(gè)成熟的購(gòu)物系統(tǒng)不僅具有電子商城全部的業(yè)務(wù)功能,還能實(shí)現(xiàn)針對(duì)用戶的個(gè)性化服務(wù)。
用戶管理模塊包括用戶瀏覽購(gòu)物系統(tǒng)中所有商品信息,按需求搜索相關(guān)商品,注冊(cè)為會(huì)員后對(duì)商品進(jìn)行選購(gòu)、下單,還具有查詢訂單、物流信息以及評(píng)價(jià)等權(quán)限。⑴用戶注冊(cè)信息;⑵用戶登陸;⑶訂單信息;⑷商品信息分類顯示;⑸商品詳細(xì)信息顯示;⑹購(gòu)物車功能;⑺付款功能;⑻店長(zhǎng)推薦;⑼評(píng)價(jià)與留言模塊。
系統(tǒng)管理模塊包括管理員對(duì)商品種類的添加、歸類,對(duì)用戶購(gòu)物訂單的處理,和對(duì)網(wǎng)站的信息維護(hù)等操作。購(gòu)物系統(tǒng)實(shí)現(xiàn)了從用戶購(gòu)物到付款、收貨,管理員管理與建設(shè)網(wǎng)站,以及訂單處理等功能。建成一個(gè)功能齊全、合理、完善的基于B/S的在線購(gòu)物系統(tǒng)。⑴管理員信息;⑵商品信息類別;⑶商品信息修改;⑷購(gòu)物訂單管理;⑸付款方式管理;⑹管理員信息。
基于用戶偏好挖掘技術(shù)的購(gòu)物系統(tǒng)是利用Web挖掘從浩瀚的商品信息中自動(dòng)、高效地提取有價(jià)值的商品。Web數(shù)據(jù)挖掘任務(wù)分為3個(gè)子任務(wù)。一是尋找資源,網(wǎng)站提供的商品、服務(wù)或數(shù)據(jù)。對(duì)Web上大量的文檔集合的內(nèi)容進(jìn)行總結(jié)、分類、聚類和關(guān)聯(lián)分析等。從文檔中提取關(guān)鍵信息,用簡(jiǎn)潔的形式對(duì)文檔內(nèi)容進(jìn)行摘要或解釋。二是信息的選擇和預(yù)處理。信息的預(yù)處理是將有效的用戶日志文件經(jīng)過一系列的信息處理轉(zhuǎn)化成事務(wù)數(shù)據(jù)集合,以供商品信息挖掘使用。主要包括信息清洗和事務(wù)識(shí)別兩個(gè)部分,信息清洗主要是對(duì)無關(guān)記錄的刪除,判斷是否有重要的訪問沒有被記錄、用戶的識(shí)別等。將頁面訪問序列劃分為代表Web事務(wù)或用戶會(huì)話的邏輯單元。商品信息挖掘是為了形成事務(wù)信息集合,通過數(shù)據(jù)挖掘的有效算法來發(fā)現(xiàn)一些隱藏的模式和規(guī)則,并對(duì)這些模式和規(guī)則進(jìn)行分析和處理,找出用戶感興趣的模式為用戶提供服務(wù)。三是分析涉及網(wǎng)站將其內(nèi)容傳達(dá)給用戶的方法。例如,有一些用戶經(jīng)常瀏覽女性、母嬰等信息,經(jīng)過分析這些用戶被聚類為一組,就可以知道這是一組用戶,通過購(gòu)物系統(tǒng)自動(dòng)地給這個(gè)用戶組群發(fā)送具有針對(duì)性的、新的信息郵件,還可以及時(shí)調(diào)整購(gòu)物系統(tǒng)頁面結(jié)構(gòu)和頁面內(nèi)容,使得網(wǎng)站中的活動(dòng)能夠在一定程度上滿足用戶的需求,使得網(wǎng)站中的活動(dòng)具有更高的價(jià)值和意義。
本系統(tǒng)的設(shè)計(jì)是基于B/S模式,只要可以接入網(wǎng)絡(luò),消費(fèi)者就可以隨時(shí)隨地根據(jù)自己的偏好進(jìn)行瀏覽和購(gòu)買,同時(shí)銷售者可以根據(jù)商品的要求靈活的設(shè)計(jì)和修改商品的信息,還有訂單和售后管理是相結(jié)合,能夠?qū)ι唐沸畔⑦M(jìn)行實(shí)時(shí)的增、刪、改。本在線購(gòu)物系統(tǒng)還通過Web數(shù)據(jù)挖掘技術(shù)為用戶提供個(gè)性化的服務(wù),既提高工作效率,節(jié)省人力、財(cái)力和物力,又推動(dòng)了網(wǎng)上商城的迅速發(fā)展。
3 算法分析和數(shù)據(jù)挖掘
3.1 網(wǎng)站設(shè)計(jì)算法
⑴實(shí)現(xiàn)連接數(shù)據(jù)庫(kù)access,與之綁定實(shí)現(xiàn)用戶注冊(cè)模塊。
……
<% set rs=server.createobject("adodb.recordset")
sql="select * from newsclass"
rs.open sql,conn,3,3
……
<%newsclass_id=rs("newsclass_id")
……
<%=rs("newsclass_name")%> ]
……
<%=rs("newsclass_name")%> ]
……
、瀑(gòu)物車模塊設(shè)置
……
<% set rs=server.createobject("adodb.recordset")
<%newsclass_id=rs("newsclass_id")
[%=rs("newsclass_name")%> ]
[<%=rs("newsclass_name")%>
……
⑶function的特殊功能
函數(shù)與過程相似,也是用來完成特定功能的獨(dú)立程序代碼,它由一組符合VB語法的語句組成,它與過程不同的是,函數(shù)可以返回一個(gè)值給調(diào)用程序,自定義函數(shù)過程的格式如下:
[Publicl Private][Static]Function函數(shù)過程名([形參表列])[As類型]
局部變量常量定義
(語句塊>
函數(shù)名=返回值
[Exit Function]
函數(shù)名=返回值
[語句塊]
End Function
功能:定義一個(gè)函數(shù)過程。
3.2 Page-rank算法
Page-rank算法是目前被廣泛應(yīng)用的一種衡量網(wǎng)頁權(quán)威性的算法,它是根據(jù)網(wǎng)頁之間的鏈接結(jié)構(gòu)來計(jì)算的。如果某個(gè)頁面被多次引用,則就有許多頁面有指向它的鏈接,就說明這個(gè)頁面很重要;如果一個(gè)頁面沒有被多次引用,但卻被一個(gè)重要頁面引用過,那么也可以說這個(gè)頁面很重要。S.Brin和L.Page提出了計(jì)算頁面權(quán)威性的算法,計(jì)算公式如下:
默認(rèn)c的最佳值為0.85,其中, 是指頁面的權(quán)威度。利用這個(gè)算法計(jì)算出購(gòu)物系統(tǒng)的權(quán)威頁面,,再通過商城活動(dòng)等形式將有針對(duì)性的信息傳達(dá)給特定的用戶,這就實(shí)現(xiàn)了基于用戶偏好的購(gòu)物系統(tǒng)信息挖掘。
這個(gè)算法的特點(diǎn)是如果提前計(jì)算Page-rank值,檢索時(shí)不必再重新計(jì)算,減少在線時(shí)間。其缺點(diǎn)是它的檢索具有全局性,要計(jì)算一個(gè)網(wǎng)頁的Page-rank值就要計(jì)算出整個(gè)文檔集合里所有網(wǎng)頁的Page-rank值,計(jì)算量比較大。
4 結(jié)語
基于用戶偏好的購(gòu)物系統(tǒng)對(duì)客戶端配置要求低,只需要在線瀏覽商品信息,用戶和管理員的加密、登陸驗(yàn)證技術(shù)保證了系統(tǒng)的安全性,以及對(duì)商品類別管理的實(shí)現(xiàn),使得本系統(tǒng)更加具有商業(yè)價(jià)值,適應(yīng)電子商務(wù)類系統(tǒng)的開發(fā)需求。特別是對(duì)用戶偏好的商品信息挖掘,實(shí)現(xiàn)網(wǎng)站智能化,增強(qiáng)網(wǎng)站的軟實(shí)力。
基于具有以上特性的在線購(gòu)物系統(tǒng)的使用提高了工作效率,節(jié)省人力、財(cái)力和物力,推動(dòng)網(wǎng)上商城的迅速發(fā)展,將人們的生產(chǎn)和生活領(lǐng)入新信息時(shí)代。
參考文獻(xiàn):
[1]Alex Homer.ASP.NET Web Forms Programming[M].北京:清華大學(xué)出版,2011.
[2]Angshuman Chakrab,NET Framework[M].北京:中國(guó)水利水電出版社,2011.
[3]陸偉,張曉娟.基于主題與用戶偏好分析的查詢推薦研究[J].情報(bào)學(xué)報(bào),2012.
[4]唐雨.基于用戶偏好的嵌入性網(wǎng)絡(luò)結(jié)構(gòu)分析[J].電子學(xué)報(bào),2012.
[5]楊玉華.網(wǎng)上商店購(gòu)物系統(tǒng)的研究與設(shè)計(jì)[J].軟件開發(fā),2013.
[6]張彥.基于用戶認(rèn)知與個(gè)性化推薦的購(gòu)物系統(tǒng)用戶體驗(yàn)度研究[D].北京:北京郵電大學(xué),2010.
[7]孫家廣.ASP和Access網(wǎng)站數(shù)據(jù)庫(kù)程序設(shè)計(jì)[M].北京:高等教育出版社,2010.
本文編號(hào):14536
本文鏈接:http://www.wukwdryxk.cn/kejilunwen/jisuanjikexuelunwen/14536.html