基于果蠅優化最小二乘支持向量機的交通信息預測方法
【專利摘要】本發明針對現有交通信息預測方法預測精確度不高的問題,提供了一種基于果蠅優化最小二乘支持向量機的交通信息預測方法,包括如下步驟:對原始交通信息數據進行歸一化預處理,將數據歸一化到[0,1]區間內,生成數據集并且進行分組,即訓練集和測試集;選擇徑向基函數作為最小二乘支持向量機模型的核函數,確定參數組合(γ,σ);采用果蠅優化算法對最小二乘支持向量機的參數組合(γ,σ)進行優化,在全局范圍內得到最優值;代入經過優化的參數,構造基于果蠅優化最小二乘支持向量機的交通信息預測模型;輸入數據集,通過預測模型生成交通信息預測結果;進行預測誤差評價分析。
【專利說明】基于果蠅優化最小二乘支持向量機的交通信息預測方法
【技術領域】
[0001] 本發明涉及一種基于果蠅優化最小二乘支持向量機的交通信息預測方法,屬于 公路網交通規劃系統領域。
【背景技術】
[0002] 隨著交通基礎設施建設和智能交通系統的發展,交通規劃和交通誘導成為交通 領域研究的熱點。對于交通規劃和交通誘導來說,準確的交通信息預測有其重要的意義。 交通信息預測結果的好壞將直接關系到交通控制與誘導的效果,無論是交通控制系統還是 交通誘導系統,實時準確地對交通信息進行預測是這些系統實現的前提與關鍵,所以交通 信息預測越來越受到重視。交通信息預測結果可以作為先進的交通系統的輸入,用于制定 主動型的交通控制策略,還可以直接用于先進的交通管理系統的信息發布,為出行者提供 實時有效的信息,幫助他們更好的進行路徑選擇,進而提高路網效率。
[0003] 交通信息數據具有高度非線性和不確定性等特點,并且與時間相關性很 強,是一種典型的時間序列預測問題,目前,比較常見的交通網絡信息預測模型包括 ARIMA(Auto-Regression Intergrated Moving Average)方法、卡爾曼濾波模型(Kalman Filtering Model)和神經網絡模型(Neural Network Model)。ARIMA是一種典型的時間 序列預測方法,有著良好的預測性能,是一種基于線性的模型,而交通信息具有非線性特 征,所以預測結果不理想。卡爾曼濾波是一個非常適用于實時動態預測交通信息的方法, 但是由于卡爾曼濾波模型的誤差項不好確定,因為交通信息的隨機性非常大,這樣卡爾曼 濾波模型中存在著大量的矩陣運算和復雜的參數估計,在實際應用中難以掌握,所以對于 預測結果來說還是存在很多不盡人意的地方。BP神經網絡(BP Neural Network, BPNN)預 測模型存在訓練數據需求大、收斂速度慢等問題,而RBF神經網絡(RBFNN)是一種前向神經 網絡模型,克服了 BP神經網絡訓練數據需求大、收斂速度太慢等缺點,日漸取代BP神經 網絡成為一種新的交通信息預測方法,然而,由于人工神經網絡采用經驗風險最小化原理 (ERM),容易陷入局部極值,從而影響泛化能力。近年來,支持向量機(SVM)在交通信息預測 中應用越來越廣泛,它采用結構風險最小化原則,能有效解決小樣本、非線性等回歸問題, 具有全局尋優能力與良好的泛化推廣能力,同時計算量少。克服了神經網絡局部極值的難 題。目前,用遺傳算法優化支持向量機參數的方法應用較多,但遺傳算法復雜的遺傳操作 (如選擇、交叉、變異)使支持向量機的訓練時間隨問題規模及復雜程度的增大而呈指數級 增長,且存在局部最優等問題。果蠅優化算法(Fruit Fly Optimization Algorithm, F0A) 是一種智能群體搜索方法,它不僅具有很強的全局搜索能力,而且容易實現,非常適用于 最小二乘支持向量機(Least Squares Support Vector Machine, LSSVM)的參數優化。
【發明內容】
[0004] 本發明針對現有交通信息的預測模型預測精確度不高的問題,而提供一種基于果 蠅優化最小二乘支持向量機的交通信息預測方法,該方法能夠有效的提高預測精確度。
[0005] 為實現上述目的,本發明采用如下技術方案:
[0006] 基于果蠅優化最小二乘支持向量機的交通信息預測方法,該預測方法包括如下步 驟:
[0007] 步驟一、對原始交通信息數據(包括交通流量、速度和占有率)進行歸一化預處 理,將數據歸一化到[0,1]區間內,生成數據集并且進行分組,即訓練集和測試集;
[0008] 步驟二、選擇徑向基函數,作為最小二乘支持向量機模型的核函數,確定參數組合 (Y,〇),其中Y為正則化參數,〇為徑向基函數的寬度參數;
[0009] 步驟三、采用果蠅優化算法對最小二乘支持向量機的參數組合(Υ,〇 )進行優 化,在全局范圍內得到最優值;
[0010] 步驟四、代入經過優化的參數,構造基于果蠅優化最小二乘支持向量機的交通信 息預測模型;
[0011] 步驟五、輸入數據集,通過預測模型生成交通信息預測結果;
[0012] 步驟六、根據交通信息預測結果和實際交通信息數據,進行預測誤差評價分析。
[0013] 進一步的技術方案如下:
[0014] 步驟一的具體過程為:
[0015] 為了加快網絡的收斂速度和預測模型的準確率,需要對輸入輸出數據進行歸一化 處理,即通過一定的線性變化將輸入和輸出數據統一限制在[0,1]或[-1,1]區間內,對數 據進行線性歸一化處理:
[0016]
【權利要求】
1. 一種基于果蠅優化最小二乘支持向量機的交通信息預測方法,其特征在于,包括以 下步驟: 步驟一、對原始交通信息數據進行歸一化預處理,將數據歸一化到[〇,1]區間內,生成 數據集并且進行分組,即訓練集和測試集; 步驟二、選擇徑向基函數,作為最小二乘支持向量機模型的核函數,確定參數組合 (Y,〇),其中Y為正則化參數,0為徑向基函數的寬度參數; 步驟三、采用果蠅優化算法對最小二乘支持向量機的參數組合(Υ,σ)進行優化,在 全局范圍內得到最優值; 步驟四、代入經過優化的參數,構造基于果蠅優化最小二乘支持向量機的交通信息預 測模型; 步驟五、輸入數據集,通過預測模型生成交通信息預測結果; 步驟六、根據交通信息預測結果和實際交通信息數據,進行預測誤差評價分析。
2. 根據權利要求1所述的一種基于果蠅優化最小二乘支持向量機的交通信息預測方 法,其特征在于,所述步驟一的具體過程為: 通過一定的線性變化將輸入和輸出數據統一限制在[〇, 1]或[-1,1]區間內,對數據進 行線性歸一化處理:
(1) 式⑴中,Xmax為原始交通信息數據的最大值,Xmin為原始交通信息數據的最小值,\為 t時刻的原始交通信息數據,X/為t時刻相對應的歸一化處理后的交通信息數據。
3. 根據權利要求1所述的一種基于果蠅優化最小二乘支持向量機的交通信息預測方 法,其特征在于,所述步驟二的具體過程為: 采用徑向基函數作為最小二乘支持向量機的核函數:
(2) 式(2)中,〇為徑向基函數的寬度參數。
4. 根據權利要求1所述的一種基于果蠅優化最小二乘支持向量機的交通信息預測方 法,其特征在于,所述步驟三的具體過程為: 1) 讀入交通信息數據集; 2) 確定種群個體數量sizepop = 20和最大迭代次數max gen = 100,在[0, 1]范圍內, 隨機生成果蠅的初始位置; 3) 賦予果蠅個體搜尋食物的隨機飛行方向與距離區間; 4) 估計果蠅位置與原點之間的距離,計算味道濃度判定值Sp Si = Ι/Dp
5) 將參數組合(Y,c〇代入最小二乘支持向量機預測模型中,以預測的誤差平方和作 為味道判定函數,求出該果蠅位置味道濃度Smell,,即誤差平方和; 6) 找出果蠅群體中使得誤差平方和最小的果蠅,即其味道濃度最低; 7) 保留最佳模型參數(Υ,σ)與(Xi,Yi)坐標,此時果蠅群體利用視覺往該位置飛去; 8) 迭代尋優,重復執行以上步驟3)至步驟6),并判斷預測誤差平方和是否優于前一迭 代預測誤差平方和,若是則執行步驟7)。
5.根據權利要求1所述的一種基于果蠅優化最小二乘支持向量機的交通信息預測方 法,其特征在于,所述步驟四的具體過程為: 1) 路段上的交通信息與前幾個時段的交通信息有著必然的聯系,利用路段前幾個時段 的交通信息數據去預測未來時段的交通信息:設x(t)為t時刻的交通信息數據,x(t-l)為 t-Ι時刻的交通信息數據,采用當前時間段和前s個時間段的交通信息對未來時間段的交 通信息進行預測,將X (t),X (t-Ι),…,X (t-s)作為樣本t時刻的輸入值,即Xi,X (t+Ι)作為 樣本的輸出值,即yi ; 2) 建立訓練集{(xpyj,(x2,y2),···,(xN,yN)} e (ΧΧΥ)Ν,N為訓練集中輸入輸出數據 對的個數,以作為最小二乘支持向量機的訓練數據; 3) 通過己知數據的分析,選擇徑向基函數作為核函數以及采用經過果蠅算法優化的參 數,根據最小二乘支持向量機的算法,構造并求解下列問題:
(3) 式(3)中,
為核空間映射函數,
是權矢量,ei e R為誤差變量,b 為偏差量,J為損失函數,Y為可調常數; 構造拉格朗日函數:
(4) 式⑷中,ai e R為拉格朗日乘子,分別求式⑷對ei,ai,w,b的偏導,再消去w, ei, 可得如下方程:
(5) 式(5)中,y = [y! ; ;yN],Iv = [1 ; ;1],a = [ a 丄;...;a N],i,j = 1,2,…,N ; 根據Mercer理論,可以選擇核函數K( ·,·),使得
(6; 由式(5)可解出a i和b。 4) 構造預測函數
(7) 式(7)即為最后的預測函數,其中核函數K(x,Xi)采用徑向基函數; 5) 將測試數據集構造成上述預測函數中輸入變量的形式,代入預測函數得到交通信息 的預測結果。
6.根據權利要求1所述的一種基于果蠅優化最小二乘支持向量機的交通信息預測方 法,其特征在于,所述步驟六的具體過程為: 1) 計算平均誤差:平均誤差
誤差(i)/n,即平均誤差是由所有誤差之和除以輸出 樣本的數量的個數得到的; 2) 計算平均相對誤差:平均相對誤差
相對誤差(i)/n,即平均相對誤差是由所有相 對誤差之和除以輸出樣本的數量的個數得到的。 3) 計算均等系數:
其中,x(k)為實際交通信息數據,X'(k)為預測交通信息數據,η為預測個數。
【文檔編號】G06Q10/04GK104091216SQ201410367168
【公開日】2014年10月8日 申請日期:2014年7月29日 優先權日:2014年7月29日
【發明者】叢玉良, 李曉雷, 郭一粟, 張書揚, 邢麗娟 申請人:吉林大學