基于關(guān)聯(lián)規(guī)則的耕地質(zhì)量評價數(shù)據(jù)檢錯方法研究——以廣州市為例
發(fā)布時間:2024-06-19 09:57
研究目的:從數(shù)據(jù)項(xiàng)之間關(guān)聯(lián)關(guān)系的角度切入,探索一種新的耕地數(shù)據(jù)質(zhì)量檢錯方法,以期更有效地提高耕地數(shù)據(jù)庫的質(zhì)量。研究方法:通過數(shù)據(jù)挖掘算法尋找耕地數(shù)據(jù)庫中的關(guān)聯(lián)關(guān)系,計算這些關(guān)聯(lián)關(guān)系的發(fā)生頻率,從中提取低頻發(fā)生的關(guān)聯(lián)關(guān)系作為檢測規(guī)則(關(guān)聯(lián)規(guī)則),最后利用這些關(guān)聯(lián)規(guī)則識別耕地數(shù)據(jù)庫中的錯誤記錄(包含或符合關(guān)聯(lián)規(guī)則的耕地數(shù)據(jù)記錄為錯誤記錄)。研究結(jié)果:(1)該方法有能力識別耕地數(shù)據(jù)庫中的錯誤,可以做到有效提高耕地參評數(shù)據(jù)庫的正確性;(2)經(jīng)計算,與耕地領(lǐng)域現(xiàn)有的傳統(tǒng)數(shù)據(jù)檢錯方法相比,同等條件下該方法可將檢錯效率提高11倍,甚至更多;(3)該方法可以針對不同的數(shù)據(jù)庫迅速挖掘關(guān)聯(lián)規(guī)則,靈活地應(yīng)對不同的耕地數(shù)據(jù)庫和層出不窮的錯誤類型。研究結(jié)論:基于關(guān)聯(lián)規(guī)則的耕地數(shù)據(jù)庫質(zhì)量檢測方法高效、便捷,為耕地領(lǐng)域現(xiàn)有的數(shù)據(jù)檢錯方法開辟了一個新的角度和思路,可以在地學(xué)領(lǐng)域廣泛應(yīng)用。
【文章頁數(shù)】:9 頁
【部分圖文】:
本文編號:3995213
【文章頁數(shù)】:9 頁
【部分圖文】:
圖1FP-Tree的構(gòu)建過程及結(jié)果
如此,專家只需檢測這些低頻關(guān)聯(lián),相比檢測整個數(shù)據(jù)庫,低頻關(guān)聯(lián)的數(shù)據(jù)量小,會大大節(jié)省工作時間,能有效提高耕地數(shù)據(jù)庫的質(zhì)量檢測的效率。3案例分析
圖2FP-Tree
為了進(jìn)一步驗(yàn)證基于關(guān)聯(lián)規(guī)則的耕地數(shù)據(jù)庫質(zhì)量檢測方法的有效性,本文設(shè)計兩種方法來檢測2015年廣州市耕地數(shù)據(jù)庫。方式一是直接利用方法中生成的低頻關(guān)聯(lián)去尋找那些包含低頻關(guān)聯(lián)的記錄,并將這些記錄作為疑似錯誤記錄,然后再由人工判斷它們是否確實(shí)是錯誤記錄。方式二是先檢查低頻關(guān)聯(lián),再利用專家....
本文編號:3995213
本文鏈接:http://www.wukwdryxk.cn/jingjilunwen/nongyejingjilunwen/3995213.html
上一篇:2020年上半年我國蔬菜生產(chǎn)形勢分析
下一篇:沒有了
下一篇:沒有了
最近更新
教材專著