麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

一種電費回收預測模型的構建方法與流程

文檔序號:11143617閱讀:483來源:國知局
本發明涉及電力系統
技術領域
:,特別是指一種電費回收預測模型的構建方法。
背景技術
::供電公司電費回收管理工作是保證供電公司電費正常回收、實現公司可持續發展的一項重要任務。隨著電力客戶用電量快速增加和外部壞境的不斷變化,供電公司面臨的電費回收風險和不確定性也在逐年加大。對準確預測用戶電費回收不及時信息的研究依舊停留在片面預測、僅能預測用戶是否欠費。技術實現要素:本發明要解決的技術問題是提供一種電費回收預測模型的構建方法,以解決現有技術所存在的僅能預測用戶是否欠費的問題。為解決上述技術問題,本發明實施例提供一種電費回收預測模型的構建方法,包括:確定第一預測模型的指標體系;根據確定的第一預測模型的指標體系,獲取已欠費用戶數據作為第一預測模型的訓練測試集,其中,所述訓練測試集包括:訓練集和測試集;根據所述第一預測模型的訓練集對第一預測模型進行訓練;根據訓練后的第一預測模型預測已欠費用戶的下次欠費時間。進一步地,所述第一預測模型的指標體系包括:上級單位、供電單位、行業類別、用電類別、電壓等級、負荷重要等級、合同容量、運行容量、檢查周期、停電標志、立戶時長、送電時長、計量點個數、受電點個數、電源點個數、是否三方協議、停電次數、年用電量、年變損電量、年無功用電率、年線損率、年欠費總次數、年均欠費用電間隔、年最小欠費用電間隔、最近一次欠費用電距今間隔、年欠費用電占比、月均欠費電費、2.5年欠費總次數中的一種或多種。進一步地,所述根據所述第一預測模型的訓練集對第一預測模型進行訓練包括:根據所述第一預測模型的訓練集,利用SVM算法對第一預測模型進行訓練。進一步地,所述方法還包括:確定第二預測模型的指標體系;根據確定的第二預測模型的指標體系,獲取已欠費用戶數據作為第二預測模型的訓練測試集,其中,所述訓練測試集包括:訓練集和測試集;根據所述第二預測模型的訓練集對第二預測模型進行訓練;根據訓練后的第二預測模型預測已欠費用戶的下次欠費金額。進一步地,所述第二預測模型的指標體系包括:最近一年平均月欠費用電電量、最近一年平均月欠費用電次數、年均欠費用電間隔、最近一年最小欠費用電間隔、平均年欠費用電間隔、最近一個欠費用電距今間隔、欠費用電占比、平均欠費用電電費、第一次欠費用電距離開戶日期的時長、第一次欠費用電金額、最近一年欠費用電電費、最近三個月欠費用電電費、最近2年欠費用電電費、最近6個月欠費用電電費、年欠費用電電費增長率、月欠費用電電費增長率環比、季欠費用電電費增長率、年最大欠費用電電費、年最小欠費用電電費、年最大欠費用電電費的月份、年最小欠費用電電費的月份、用戶分類、是否三方協議、是否分次劃撥、安全隱患間隔、月用電量、季用電量、年用電量、立戶時長、送電時長、合同容量、用電分類、高耗能行業類別、計量點數目、電源數目、月線損增長率、年平均線損率、平均月無功利用率、當前月有功利用率、當前無功與有功占比率、當月月峰/谷/平電比例、年峰/谷/平電比例、年預收電費金額、停電次數、停電間隔、平均停電間隔、年停電頻度、今年上次欠費電費、今年上次欠費電費環比增長率、本次欠費電費中的一種或多種。進一步地,所述方法還包括:確定第三預測模型的指標體系;根據確定的第三預測模型的指標體系,獲取所有用戶數據作為第三預測模型的訓練測試集,其中,所述訓練測試集包括:訓練集和測試集;根據所述第三預測模型的訓練集對第三預測模型進行訓練;根據訓練后的第三預測模型預測用戶下月是否欠費。進一步地,所述第三預測模型的指標體系包括:行業類別、所在地區、用戶分類、是否三方協議、是否分次劃撥、安全隱患次數、年用電量、立戶時長、送電時長、合同容量、用電分類、高耗能行業類別、計量點數目、電源數目、月線損增長率、年平均線損次數、平均月無功利用率、當前月有功利用率、無功與有功占比率、月峰/谷/平電比例、年峰/谷/平電比例、年預收電費金額、停電次數、停電間隔、平均停電間隔、年停電頻度、是否欠費過中的一種或多種。進一步地,生成訓練測試集之前,所述方法還包括:對獲取的已欠費用戶數據或所有用戶數據進行數據清洗、數據變換及數據歸一化處理。進一步地,所述方法還包括:根據歸一化處理后的數據,根據本次欠費電費/最近一次欠費用電距今間隔/是否欠費過分層取樣,生成第一預測模型、第二預測模型、第三預測模型的訓練測試集。本發明的上述技術方案的有益效果如下:上述方案中,通過確定的第一預測模型的指標體系,獲取已欠費用戶數據作為第一預測模型的訓練測試集,其中,所述訓練測試集包括:訓練集和測試集;根據所述第一預測模型的訓練集對第一預測模型進行訓練;根據訓練后的第一預測模型預測已欠費用戶的下次欠費時間,這樣,通過第一預測模型能夠預測已欠費用戶的下次欠費時間。附圖說明圖1為本發明實施例提供的電費回收預測模型的構建方法的流程示意圖;圖2為本發明實施例提供的電費回收預測模型的構建方法的原理示意圖;圖3為本發明實施例提供的用戶數據預處理的流程示意圖。具體實施方式為使本發明要解決的技術問題、技術方案和優點更加清楚,下面將結合附圖及具體實施例進行詳細描述。本發明針對現有的僅能預測用戶是否欠費的問題,提供一種電費回收預測模型的構建方法。參看圖1所示,本發明實施例提供的電費回收預測模型的構建方法,包括:S101,確定第一預測模型的指標體系;S102,根據確定的第一預測模型的指標體系,獲取已欠費用戶數據作為第一預測模型的訓練測試集,其中,所述訓練測試集包括:訓練集和測試集;S103,根據所述第一預測模型的訓練集對第一預測模型進行訓練;S104,根據訓練后的第一預測模型預測已欠費用戶的下次欠費時間。本發明實施例所述的電費回收預測模型的構建方法,通過確定的第一預測模型的指標體系,獲取已欠費用戶數據作為第一預測模型的訓練測試集,其中,所述訓練測試集包括:訓練集和測試集;根據所述第一預測模型的訓練集對第一預測模型進行訓練;根據訓練后的第一預測模型預測已欠費用戶的下次欠費時間,這樣,通過第一預測模型能夠預測已欠費用戶的下次欠費時間。如圖2所示,本實施例中,根據用戶是否有欠費,可以將用戶分為已欠費用戶和非欠費用戶/未欠費用戶這兩類,對已欠費用戶,可以通過第一預測模型預測已欠費用戶下次欠費會在什么時候,圖2中的違約用戶指已欠費用戶。本實施例中,為了得到第一預測模型,需先確定預測欠費時間的直接有效指標。由于,已經欠費的用戶是有極大可能會再次欠費的,本實施例中,對已欠費用戶,將預測用戶什么時候發生欠費轉換為預測相鄰兩次欠費的時間間隔。本實施例中,預測針對已經有過欠費的用戶設計指標,這樣就能利用其相鄰兩次欠費(例如,第二次欠費與第一次欠費)的時間間隔做一個驗證。這里僅有一次欠費記錄的用戶設置其違約間隔為30天。取全部欠費過的用戶數據,取涉及欠費和基礎用電行為指標的指標作為第一預測模型的指標體系,所述第一預測模型的指標體系可以更精準的找出用戶的用電欠費行為特征,進而更科學的預測欠費的用戶再次欠費的時間間隔,從而推斷出已欠費用戶下次會在啥時候再次欠費。本實施例中,所述第一預測模型的指標體系包括:上級單位、供電單位、行業類別、用電類別、電壓等級、負荷重要等級、合同容量、運行容量、檢查周期、停電標志、立戶時長、送電時長、計量點個數、受電點個數、電源點個數、是否三方協議、停電次數、年用電量、年變損電量、年無功用電率、年線損率、年欠費總次數、年均欠費用電間隔、年最小欠費用電間隔、最近一次欠費用電距今間隔、年欠費用電占比、月均欠費電費、2.5年欠費總次數中的一種或多種。例如,若當前時間為2016年7月,則第一預測模型的指標體系如表1所示,以年用電量為例,年用電量的數據為3個,分別為:2014年、2015年、2016年這3個相鄰年份的年用電量。表1第一預測模型的指標體系本實施例中,遇到有些指標時間周期不適用情況,以平均數補足。例如,年用電量這一指標,若用戶開戶不足一年,則將不足一年的部分用當前開戶用電量/當前開戶時長代替。在前述電費回收預測模型的構建方法的具體實施方式中,進一步地,所述根據所述第一預測模型的訓練集對第一預測模型進行訓練包括:根據所述第一預測模型的訓練集,利用SVM算法對第一預測模型進行訓練。本實施例中,根據所述第一預測模型的訓練集,可以利用支持向量機(SupportVectorMachine,SVM)算法對第一預測模型進行訓練,得到訓練后的第一預測模型,進而根據訓練后的訓練后的第一預測模型預測第一預測模型的測試集中的已欠費用戶或其他已欠費用戶的下次欠費時間。本實施例中,第一預測模型的測試集用于對訓練后的第一預測模型進行測試、檢測預測結果的準確性。在前述電費回收預測模型的構建方法的具體實施方式中,進一步地,所述方法還包括:確定第二預測模型的指標體系;根據確定的第二預測模型的指標體系,獲取已欠費用戶數據作為第二預測模型的訓練測試集,其中,所述訓練測試集包括:訓練集和測試集;根據所述第二預測模型的訓練集對第二預測模型進行訓練;根據訓練后的第二預測模型預測已欠費用戶的下次欠費金額。如圖2所示,本實施例中,對已欠費用戶,可以通過第二預測模型預測已欠費用戶下次可能會欠多少金額。本實施例中,用戶欠費的金額在經驗方法中普遍認為與歷史欠費的金額是有很大關聯的。本實施例中,預測針對已經欠費的用戶設計指標,利用歷史數據及基礎的用電行為指標作為第二預測模型的指標體系。本實施例中,所述第二預測模型的指標體系包括:最近一年平均月欠費用電電量、最近一年平均月欠費用電次數、年均欠費用電間隔、最近一年最小欠費用電間隔、平均年欠費用電間隔、最近一個欠費用電距今間隔、欠費用電占比、平均欠費用電電費、第一次欠費用電距離開戶日期的時長、第一次欠費用電金額、最近一年欠費用電電費、最近三個月欠費用電電費、最近2年欠費用電電費、最近6個月欠費用電電費、年欠費用電電費增長率、月欠費用電電費增長率環比、季欠費用電電費增長率、年最大欠費用電電費、年最小欠費用電電費、年最大欠費用電電費的月份、年最小欠費用電電費的月份、用戶分類、是否三方協議、是否分次劃撥、安全隱患間隔、月用電量、季用電量、年用電量、立戶時長、送電時長、合同容量、用電分類、高耗能行業類別、計量點數目、電源數目、月線損增長率、年平均線損率、平均月無功利用率、當前月有功利用率、當前無功與有功占比率、當月月峰/谷/平電比例、年峰/谷/平電比例、年預收電費金額、停電次數、停電間隔、平均停電間隔、年停電頻度、今年上次欠費電費、今年上次欠費電費環比增長率、本次欠費電費中的一種或多種,所述第一預測模型的指標體系如表2所示。表2第二預測模型的指標體系本實施例中,確定第二預測模型的指標體系后;根據確定的第二預測模型的指標體系,獲取已欠費用戶數據作為第二預測模型的訓練測試集,其中,所述訓練測試集包括:訓練集和測試集;根據所述第二預測模型的訓練集,可以利用SVM算法對第二預測模型進行訓練,得到第二預測模型,進而根據訓練后的第二預測模型預測第二預測模型的測試集中的已欠費用戶或其他已欠費用戶的下次欠費金額。本實施例中,第二預測模型的測試集用于對訓練后的第二預測模型進行測試、檢測預測結果的準確性。在前述電費回收預測模型的構建方法的具體實施方式中,進一步地,所述方法還包括:確定第三預測模型的指標體系;根據確定的第三預測模型的指標體系,獲取所有用戶數據作為第三預測模型的訓練測試集,其中,所述訓練測試集包括:訓練集和測試集;根據所述第三預測模型的訓練集對第三預測模型進行訓練;根據訓練后的第三預測模型預測用戶下月是否欠費。如圖2所示,本實施例中,對所有用戶,可以通過第三預測模型預測用戶是否會欠費。本實施例中,對所有用戶,預測用戶下個月欠費的狀態。考慮到沒有欠費的用戶不存在欠費相關指標,為了找出相關特征模式,取全部用戶數據,并取不涉及欠費的指標作為第三預測模型的指標體系,所述第三預測模型的指標體系可以更客觀的找出用戶的用電欠費行為特征,進而更科學的預測從未欠費的用戶是否會有欠費的可能。本實施例中,所述第三預測模型的指標體系可以包括:行業類別、所在地區、用戶分類、是否三方協議、是否分次劃撥、安全隱患次數、年用電量、立戶時長、送電時長、合同容量、用電分類、高耗能行業類別、計量點數目、電源數目、月線損增長率、年平均線損次數、平均月無功利用率、當前月有功利用率、無功與有功占比率、月峰/谷/平電比例、年峰/谷/平電比例、年預收電費金額、停電次數、停電間隔、平均停電間隔、年停電頻度、是否欠費過中的一種或多種,如表3所示。表3第三預測模型的指標體系本實施例中,確定第三預測模型的指標體系后,可以根據確定的第三預測模型的指標體系,獲取所有用戶數據作為第三預測模型的訓練測試集,其中,所述訓練測試集包括:訓練集和測試集;根據所述第三預測模型的訓練集,可以利用SVM算法對第三預測模型進行訓練,得到第三預測模型,進而根據訓練后的第三預測模型預測預測第三預測模型的測試集中的用戶或其他用戶下月是否欠費。本實施例中,第三預測模型的測試集用于對訓練后的第三預測模型進行測試、檢測預測結果的準確性。在前述電費回收預測模型的構建方法的具體實施方式中,進一步地,生成訓練測試集之前,所述方法還包括:對獲取的已欠費用戶數據或所有用戶數據進行數據清洗、數據變換及數據歸一化處理。本實施例中,根據不同預測模型的指標體系和用戶類型,可以從預先設定的營銷系統中抽取相應的用戶數據形成不同預測模型的訓練測試集。本實施例中,從營銷系統中抽取相應的原始用戶數據后,還需對抽取的原始用戶數據進行預處理和訓練集、測試集的劃分工作。本實施例中,以獲取的原始用戶數據為基礎,分析與目標無關或預測模型需要處理的用戶數據,針對此類用戶數據進行預處理,所述預處理包括:數據清洗、數據變換及數據歸一化處理,如圖3所示。本實施例中,在數據分析過程中,發現與分析目標無關的數據進行數據清洗,如圖3所示,所述數據清洗包括:清除重復數據、清除為空的數據、清除其他類型數據。本實施例中,如圖3所示,所述數據變換包括:字符型數據離散化、數據類型轉換、將NA數據轉換為0。例如,2014年3月份所有用戶的欠費金額為0,屬于記錄為空數據;平均年欠費用電間隔(2.5年/總次數-1)中有很多NA值(因為有的用戶沒有欠費過),將NA值替換成0;又例如,將導入的用戶數據作數據類型轉換,轉換為num/int類型,轉換代碼如下:allData$上級單位<-as.numeric(as.factor(allData$上級單位))allData$行業類別<-as.numeric(as.factor(allData$行業類別))allData$供電單位<-as.numeric(as.factor(allData$供電單位))allData$用電類別<-as.numeric(as.factor(allData$用電類別))allData$高耗能用電行業類別<-as.numeric(as.factor(allData$高耗能用電行業類別))allData$是否三方協議<-as.numeric(as.factor(allData$是否三方協議))allData$電壓等級<-as.numeric(as.factor(allData$電壓等級))本實施例中,數據歸一化是指通過某種算法將數據限制在需要的范圍內。首先歸一化是為了后面數據處理的方便,其次是保證程序運行時收斂加快。歸一化的具體作用是歸納統一樣本的統計分布性。對數據做歸一化處理,能夠消除不同數據量級的影響。以R語言自帶的歸一化為例,其中,R語言自帶的歸一化為中心歸一,會將數據歸一成(-1:1)之間,allData1=as.data.frame(scale(allData))。為了消除負值造成的逆作用,可以使用最大最小值歸一法,其中,最大最小值歸一法的代碼如下:在前述電費回收預測模型的構建方法的具體實施方式中,進一步地,所述方法還包括:根據歸一化處理后的數據,根據本次欠費電費/最近一次欠費用電距今間隔/是否欠費過分層取樣,生成第一預測模型、第二預測模型、第三預測模型的訓練測試集。本實施例中,對用戶數據進行預處理后,得到三個數據集,每個預測模型對應一個數據集,每個數據集作為一個訓練測試集,每個訓練測試集包括:訓練集和測試集;將訓練集和測試集的比例設為預定值,例如,0.10,且為根據本次欠費電費/最近一次欠費用電距今間隔/是否欠費過這三個指標分層取樣,生成三種預測模型的訓練測試集。本實施例中,為了更好地理解基于SVM算法的預測模型,以對已欠費用戶,預測下次欠費會在什么時候為例子,即預測欠費間隔為例子,詳細講解具體如何生成第一預測模型。S1,設置SVM參數S11,設置內核函數設置SVM函數的內核參數kernel="radial",其中,radial表示徑向基函數,radial作為一個內核函數,可以通過設置內核參數kernel作為“radial”來使用。當使用一個帶有“radial”的內核時,結果中的超平面就不需要是一個線性的了。通常定義一個彎曲的區域來界定類別之間的分隔,這也往往導致相同的訓練數據,更高的準確度。S12,類別輸出設置設置SVM函數的類別type="C-classification",這表示將結果作為一個類別來判斷而不是預測一個數值。S13,cost,gamma參數的選取經過tune.svm()函數,來尋找svm()函數的最優參數,其中,tune.svm()函數是用于svm算法的e1071包的一個自帶函數,用于來尋找svm()函數的最優參數,經過不同參數范圍的設定,可以得到不同的預測結果錯誤率,進而確定最優參數。經過篩選設置cost=10000,gamma=1e-5,其中,gamma是選擇徑向基函數radial作為kernel后,徑向基函數radial自帶的一個參數,gamma隱含地決定了數據映射到新的特征空間后的分布。cost表示懲罰因子,cost越大,錯分樣本越少,分類間距變小,泛化能力弱;cost越小,錯分樣本越大,分類間距越大,泛化能力強;,cost,gamma參數的選取過程及代碼如下:tuned<-tune.svm(最后一次欠費間隔~.,data=train,gamma=10^(-10:-1),cost=10^(1:4)),其中,<-表示賦值;代碼執行結果如表4所示。表4代碼執行結果表4中,error表示錯誤率,可以看出error最小時,得到最好的參數值,如表5所示。表5gamma、cost的最優參數值gammacost1e-07100S2,利用R語言自帶的包訓練SVM模型將預測欠費間隔的數據(第一預測模型的訓練集)導入第一預測模型(svmfit預測模型)中,利用R語言做訓練,代碼如下:可以看到得到的SVM分類器summary如下:本步驟中預測已欠費用戶的欠費間隔/下次欠費時間的第一預測模型已經訓練好。S3,利用生成的分類器將第一預測模型的測試集數據輸入訓練好的第一預測模型得到預測結果,并檢測預測結果的準確性。將第一預測模型的測試集數據輸入訓練好的svmfit預測模型中,得到預測的結果存儲在pred里。通過以下代碼,將預測的結果與真實結果形成混肴矩陣,如表6所示。>svm1=max.col(iris$targetsTest)>table(svm1,pred)表6混肴矩陣pre12345610252630110110100012010000000042000000001700000100001000100000001210000000001600000001002600000000103000000020060表6中,帶下劃線的單元格部分為預測結果和真實結果重疊的部分,單元格中的數字代表了預測正確的用戶個數。假設混肴矩陣的行坐標為x,即原欠費間隔的數值,縱坐標為y,即預測出的欠費間隔的數值。令混肴矩陣中的單元格的值為Px,y,其中,x表示這個單元格原來屬于什么間隔,y值表示被預測出什么間隔。例如神經網絡的矩陣中,P1,1=2表示原來欠費間隔為1最后被預測稱1的用戶有2個;P12,30=1表示原來欠費間隔為12被預測成30的用戶為1個,其中,Px,y≠0且x=y為精準預測正確的用戶數量。計算本次SVM的準確性:>mean(svm2!=pred)[1]0.1710526可以看到分類器一共預測出6種結果分別對應欠費間隔為1、2、3、4、5、6、15、26、30可以看到預測準確率為82.89474%。本實施例中,可以通過第一預測模型預測已欠費用戶的下次欠費時間(下次欠費與上次欠費之間的時間間隔),通過第二預測模型預測已欠費用戶的下次欠費金額,通過第三預測模型預測用戶下月是否欠費,根據預測結果,對準確率不足70%的預測模型調節他的設置參數和訓練集,重新預測直到準確率達到70%及以上。整合預測結果,可以得到:1、用戶下個月是否會欠費2、對于已經已欠費用戶,下次欠費在什么時候3、對已欠費用戶,預測下次欠費可能會欠費多少金額這樣,從多方位多角度預測出電網用戶的電力回收的未來情況,能夠有效輔助電力企業制定用電和電費預警策略。以上所述是本發明的優選實施方式,應當指出,對于本
技術領域
:的普通技術人員來說,在不脫離本發明所述原理的前提下,還可以作出若干改進和潤飾,這些改進和潤飾也應視為本發明的保護范圍。當前第1頁1 2 3 當前第1頁1 2 3 
當前第1頁1 2 3 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
主站蜘蛛池模板: 卢湾区| 南陵县| 莱阳市| 明星| 赤峰市| 花垣县| 铜鼓县| 宣武区| 天津市| 万载县| 六盘水市| 安塞县| 扎赉特旗| 二手房| 望都县| 杨浦区| 沙坪坝区| 赣州市| 津市市| 永顺县| 绥德县| 永修县| 德江县| 鄯善县| 敖汉旗| 吴旗县| 普兰县| 萝北县| 新巴尔虎左旗| 荆州市| 松潘县| 额尔古纳市| 夹江县| 邵东县| 新沂市| 哈巴河县| 陆良县| 彰武县| 汝州市| 枣阳市| 乐业县|