基于文本挖掘和集成學(xué)習(xí)的外賣(mài)訂單出餐時(shí)長(zhǎng)預(yù)測(cè)
【學(xué)位授予單位】:浙江工商大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類(lèi)號(hào)】:C815
【圖文】:
第一節(jié)文本挖掘理論逡逑用到文本挖掘理論主要包括文本特征提取和文本特征融合兩部文本特征提取逡逑模型的文本特征提取主要有以下兩種:第一種基于深度學(xué)習(xí)[2],編碼器(Auto邋Encoder)1491和深度信念網(wǎng)絡(luò)[5()],第二種是基于集成基于深度學(xué)習(xí)的文本特征提取逡逑Encoder近年來(lái)較為流行。Auto邋Encoder由輸入層、隱含層以及組成。將詞向量進(jìn)行線性變換并用激活函數(shù)激活之后得到編解碼器作用編碼結(jié)果得到重構(gòu)向量Auto邋Encoder?的優(yōu)后得到的輸出層向量z和原始的輸入層向量盡可能相似,即原先輸入的可視層的差異盡可能小。Auto邋Encoder網(wǎng)絡(luò)的結(jié)
筆者選取了某城市2017年4月11日至2017年8月26日的即時(shí)外賣(mài)完成訂單逡逑數(shù)據(jù)作為論文的主要研究數(shù)據(jù),該數(shù)據(jù)集共有記錄2083455條。該數(shù)據(jù)集的出逡逑餐時(shí)長(zhǎng)分布如圖3-1所示。逡逑0.06邋-邋A逡逑0.05-逡逑灥.逡逑U.逡逑丨>逡逑U邋0邐20邐40邐60邐K)邐1D0邐120邐140逡逑Prepare邋FoodlimefmiRUtes)逡逑圖3-1原始數(shù)據(jù)集出餐時(shí)長(zhǎng)分布圖逡逑從圖3-1可以看出,該數(shù)據(jù)集里的分析變量存在較多異常值。本文通過(guò)對(duì)逡逑外賣(mài)商家和配送員進(jìn)行調(diào)研發(fā)現(xiàn)實(shí)際情況中極少有訂單的出餐時(shí)長(zhǎng)在60分鐘逡逑以上。但原始數(shù)據(jù)集里有一定比例的訂單出餐時(shí)長(zhǎng)在60分鐘以上,最大的甚逡逑至達(dá)到125分鐘,這顯然是不合常理的。本文下一節(jié)將研究這些異常點(diǎn)的數(shù)據(jù)逡逑清洗方法。逡逑18逡逑
浙江工商大學(xué)碩士論文逡逑(三)配送員等餐過(guò)程中離開(kāi)商家的數(shù)據(jù)清洗規(guī)則逡逑在一些場(chǎng)景下,騎手到達(dá)商家后擔(dān)心等待出餐的時(shí)間會(huì)過(guò)長(zhǎng),可能離開(kāi)該商家先去其它的商家取餐或者先送完另一個(gè)訂單再來(lái)取餐。但是如手離開(kāi)商家的時(shí)間過(guò)久,當(dāng)他再次回到該商家時(shí),餐品早己做好。逡逑
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 張洞明;鄭宏;張力;;基于多特征集成學(xué)習(xí)的景區(qū)人群密度估計(jì)[J];科學(xué)技術(shù)與工程;2017年05期
2 王健;張俊妮;;統(tǒng)計(jì)模型在中文文本挖掘中的應(yīng)用[J];數(shù)理統(tǒng)計(jì)與管理;2017年04期
3 余小康;陳嶺;郭敬;蔡雅雅;吳勇;王敬昌;;結(jié)合從句級(jí)遠(yuǎn)程監(jiān)督與半監(jiān)督集成學(xué)習(xí)的關(guān)系抽取方法[J];模式識(shí)別與人工智能;2017年01期
4 徐健鋒;湯濤;嚴(yán)軍峰;劉真;;基于多機(jī)器學(xué)習(xí)競(jìng)爭(zhēng)策略的短時(shí)交通流預(yù)測(cè)[J];交通運(yùn)輸系統(tǒng)工程與信息;2016年04期
5 姜芳;李國(guó)和;岳翔;;基于語(yǔ)義的文檔特征提取研究方法[J];計(jì)算機(jī)科學(xué);2016年02期
6 倪志偉;張琛;倪麗萍;;基于螢火蟲(chóng)群優(yōu)化算法的選擇性集成霧霾天氣預(yù)測(cè)方法[J];模式識(shí)別與人工智能;2016年02期
7 朱賀軍;馬丁;;海量短文本實(shí)時(shí)挖掘方法的研究與仿真[J];計(jì)算機(jī)仿真;2015年12期
8 陳翠平;;基于深度信念網(wǎng)絡(luò)的文本分類(lèi)算法[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2015年02期
9 姜麗華;張宏斌;楊曉蓉;;基于領(lǐng)域本體的文本挖掘研究[J];情報(bào)科學(xué);2014年12期
10 劉勘;袁蘊(yùn)英;;基于自動(dòng)編碼器的短文本特征提取及聚類(lèi)研究[J];北京大學(xué)學(xué)報(bào)(自然科學(xué)版);2015年02期
本文編號(hào):2787466
本文鏈接:http://www.wukwdryxk.cn/guanlilunwen/tongjijuecelunwen/2787466.html