時間:2022-05-10 21:33:19
開篇:寫作不僅是一種記錄,更是一種創造,它讓我們能夠捕捉那些稍縱即逝的靈感,將它們永久地定格在紙上。下面是小編精心整理的12篇神經網絡設計,希望這些內容能成為您創作過程中的良師益友,陪伴您不斷探索和進步。
關鍵詞:人工神經網絡;尖峰神經元模型
近年來,人們在計算機智能化領域上取得了很大的進步,但計算機領域還有很多問題無法解決,例如視覺、語言識別和計算機等技術,人們仍不能將計算機系統設計得像生物系統那樣靈活。因此,大批研究者轉移到仿生科學研究,希望由此找到新的技術,設計出新的智能計算機,其中人工神經網絡是其中一個比較熱門的領域。隨著這個領域的發展,一些團隊已經建立起一些創造性的、復雜的神經電路模型,并將其應用到一些項目中,也有研究團隊在致力研究人工神經網絡的軟件和硬件方案,希望能夠為智能計算機提供更高層次的理解能力。
人工神經網絡模型的并行特性使它與傳統的計算機模型相比具有更強的理能力,使它更有機會解決如手寫文字識別這類問題。長期以來,大多數研究者都是在CPU上使用模擬的方式進行神經網絡的計算,由于CPU工作模式和結構的限制,無法提供最佳的計算性能,因此本文尋求一種新的智能計算硬件平臺,在硅芯片上設計神經網絡電路。
一、神經網絡模型
人工神經網絡理論已發展了很多年,并日益趨于成熟,在各領域都得到了一定的應用。人工神經網絡的運算主要由計算的基本單位神經元進行,通過若干個神經元構成神經網絡以解決現實中的各種問題。
如圖1所示,一組神經元構成一個神經網絡系統。每一個神經元都有獨立的計算單元。神經元計算公式如下:yi(t)=■W■?著ij(t-tij) (1)
公式(1)中yi(t)表示神經元的輸出結果,i表示神經元序號,?著ij(t-tij)表示神經元輸入值,W■表示每個神經元的權值。
人工神經網絡的基本運算包括了乘法和加法運算。為了能夠在硬件上執行神經網絡的理功能,必須為每個神經元設計獨立的加法器和乘法器,我們將其稱為加乘法運算單元(MAC),每個神經元都包含了一個MAC單元。
為了使系統能夠更好地模擬人類神經系統工作原理,發揮硬件的理能力,本文采用了Gerstner的尖峰神經元模型構建神經元理器的工作流程。在該模型中,每個神經元的膜電位在時間t時表示如下:
ui(t)=■■■W■?著ij(t-tij)+?濁i(t-tij) (2)
?著ij(t)=exp(-■)-exp(-■)*H(t-t■) (3)
公式(2)中,W■表示為第i神經元和第j神經元之間連接的權值,?著ij(t-tij)表示為神經元i能夠提供給神經元j的突觸后電位(PSP),而?濁i(t-tij)表示倔強函數。公式(3)表示突觸后電位(PSP)的計算方法,其中t■和t■為時間常數,H(t-t■) 為Heaviside階梯函數,t■為軸突傳輸延時系數。
二、神經元硬件設計
如圖2所示,神經網絡系統是由多個神經元構成,每個神經元是一個單獨的實體,神經元既相互獨立,又相互聯系,神經元根據所受到外界的刺激(輸入)和鄰居神經元對自己的影響,做出判斷與決策(輸出),并影響到周圍神經元的反應。為了能夠實現神經網絡功能,需要模擬神經元單位設計一個特殊的理器用于計算外界刺激而做出的反應,它包含了簡單的算數邏輯運算單元、寄存器和控制器,在本文中使用PN表示該理器。
圖3顯示了一個PN理單元的工作流程圖,每個PN理器包括了進行神經元計算必須的運算器和存儲器以及相關附屬器件。PN理單元的工作流程是:當外部有輸入數據通過總線進入PN理器時先存放在輸入事件存儲器;系統根據事件時間將數據輸入到突觸后電勢寄存器;同時輸入值被編號后分別放入公共連接存儲器;突觸后電勢PSP值與其他神經元的權值相乘后與原有膜電位值相加,相加結果更新膜電位存儲器值;同時結果與閾值相比較,如果大于閾值則將結果輸出到輸出存儲器中作為該神經元的輸出結果存放在輸出時間存儲器。
系統是由若干個神經元理器構成。如圖4所示,人工神經網絡系統由若干個神經元共同構成,圖5表示了人工神經網絡的硬件構成。每一個人工神經網絡都是由若干個神經元理單元構成,每個神經元理單元又是由邏輯運算器、存儲器和通信單元構成。將這些神經元理器構建在一塊電路板或者芯片上,同時理器與理器通過總線連接起來相互通信,共同完成神經網絡的運算。系統還為每一個神經元單位配置了一個PN理器,理器之間相互獨立,并行計算。當外部刺激(輸入)進入系統時,立刻被分配到各個PN理器并行計算神經元對刺激的響應(輸出),同時根據計算結果,調整神經元之間的權值系數,并更新存儲其中的權值。由于PN理器是并行計算,相對于傳統計算機模擬運算,極大地提高了神經網絡的計算速度。
本文以Gerstner的尖峰神經元模型為基礎,設計了模擬神經元工作的PN理單元,并由若干個PN理單元構成模擬人類神經系統的人工神經網絡的硬件系統。相對于在傳統計算機上的操作,PN理單元的并行性使新系統有更強的理能力,有效地提高了神經網絡的計算速度,使神經網絡系統有更好的應用前景。
(作者單位:廣東肇慶科技職業技術學院)
參考文獻:
[1]Gerstner,W. & Kistler,W.M.Spiking neuron models:single neurons,populations,plasticity. Cambridge,UK:Cambridge University Press,2002.
[2]Mazad S. Zaveri. Dan Hammerstrom1. Performance/price estimates for cortex-scale hardware: A design space exploration,2011,(24).
[3]徐明華,甘強.脈沖神經網絡的振蕩與分割[J].生物物理學報,1997,(1).
關鍵詞:自主角色; 神經網絡; 遺傳算法
中圖分類號: TP183
文獻標識碼:A
0引言
隨著計算機圖形學和硬件技術的高速發展,計算機游戲近十幾年也取得了很大的發展,游戲軟件已成為軟件產業中非常重要的內容。游戲的類型主要包括FPS(第一人稱射擊)、RPG(角色扮演類型)和RTS(即時戰略游戲)等幾種類型,這些不同類型的游戲都要求游戲控制的角色(NPC)與玩家控制的角色(PLAYER)要有行為的交互,交互的方式直接影響玩家對游戲的興趣度。因此,對NPC與PLAYER之間的角色交互行為方式的研究已經成為游戲軟件中的一個非常重要的研究課題。
目前大多數游戲中的角色行為的交互方式采用的是確定型的交互行為,其特征主要表現在角色的行為都是預先確定的,這種類型的行為實現起來較為簡單,也是目前大多數游戲所采用的交互方式。像這種確定性的行為往往體現不出角色的自主性,而且還會導致角色行動單調乏味,其行動很容易被玩家所預測,降低游戲的可玩性。為此,我們需要在游戲軟件中設計和實現這樣的NPC角色,它能夠根據當前環境的變化以及以往的經驗知識來動態地改變對PLAYER的行為。具有這種能力的角色,我們稱之為自主角色,也稱為自適應角色。具有自主和自適應特點的角色可具有推理能力和自適應能力,在游戲環境下可更受玩家的歡迎。
一款擁有自主角色的游戲能夠牢牢地吸引玩家的注意力,從而延長這款游戲的生命周期,因此促使游戲開發人員花更多的時間來研究自主角色的實現。一些公司已經開始嘗試從人工智能領域發展出更加高級的技術,如采用決策樹或者強化學習來實現角色的自主性,也有的像著名的游戲Colin McRae Rally2則采用了學習系統和神經網絡來實現角色的自主性。
有關自主角色行為的論文已經有很多做出了卓有成效的成績,如在Reynolds的文獻[1]中,對自主角色的群體行為進行了描述。Blumberg和Galyean[2]中引入更多的行為控制機制,并考慮了行為學習這樣一個令人感興趣的問題。對于自主角色的更高層次的認知能力方面,John David Fungc[3]中指出,認知模型是用于創建虛擬世界的模型“金字塔”的頂層,底層的行為模型作為認知模型和物理學模型之間的緩沖區,并將情景演算(situation calculus)[4]用于高度動態的虛擬世界。
但是,上述各種方法因為側重點不同,各有優缺點,且相互之間較為獨立,因此本文結合上述一些方法的優點,在此基礎上提出了基于認知角色建模,采用神經網絡和遺傳算法相結合的游戲自主角色的設計思路。基于此,各小節安排如下:
第一節確定了基于認知建模方法的游戲自主角色模型;第二節介紹了神經網絡在實現自主角色中的應用;第三節說明了遺傳算法對神經網絡的優化;第四節對自主角色的實驗進行了分析。
1基于認知建模的角色自主性模型
由于認知建模方法能夠采用精確的數學方式來定義自主角色的行為和學習模式,因此本文采用認知建模方法來對游戲角色的自主性進行建模。這里將游戲中存在的非玩家控制的角色簡稱為NPC,通過認知建模方法研究NPC的高級行為規劃,指導NPC,提高NPC的智能水平能力,使NPC能夠對環境作出判斷,并根據當前的狀態進行推理,進而完成相應的行動序列,有利于創建聰明自主的智能體――具有認知能力的自主的角色。
在計算機游戲中,我們將游戲角色關于他所在世界的內部模型稱“認知模型”(Cognitive Model)。認知模型可以用于游戲中,控制一類自主的角色。通過認知模型支配游戲角色對其所在環境的了解程度,如何獲取知識,以及如何利用知識選擇行動。
NPC的行為分為“預定義的”和“非確定性的”兩種,建立的認知模型也各不相同。建立預定義行為的認知模型比較簡單,只要將事先定義好的NPC所在環境的領域知識賦予NPC系統,NPC就可以根據人們的要求采取某種行動。而非確定性的行為不容易控制。為了實現人為的控制,我們采取一種折中的方法,即將領域知識和人的指導賦予NPC,使NPC主動地向人們希望它達到的目標發展。可由下面的公式表示:
知識+指導=行為
領域知識能夠用來規劃目標,而指導對如何達到目標提供一種框架計劃。
當然NPC在決定采取什么樣的行動時并不需要整個虛擬世界的知識。所以,我們認為NPC的認知模型是角色對其虛擬世界的一種內部簡化模型〔simplified model〕。
為此我們在現有游戲系統之上營造一個通過認知模型定義的高級行為規劃器來實現對NPC的行為指導。規劃器模型設計如圖1所示。
NPC的預定義行為和非確定行為都可以形式化為認知模型,通過認知模型來指導NPC高級行為規劃器,由于神經網絡在非確定中的強大的學習作用,因此本項目通過神經網絡來實現NPC高級行為規劃器的三個方面:目標引導、行為協調、約束滿足。
2基于人工神經網絡的角色自主系統
這里,我們采用的是神經網絡中的BP網絡作為NPC的感知系統。BP算法是一種用于多層前向網絡的學習算法,它包括輸入層、輸出層和隱含層,隱含層可以是多層結構。BP網絡的學習過程包括兩個階段:第一階段計算前向輸出;第二階段從反向調整連接權矩陣。
在前向傳播過程中,輸入信息從輸入層經隱含層逐層處理,并傳向輸出層,每一層神經元的輸出作為上層神經元的輸入.如果在輸出層,實際輸出值與期望輸出值有誤差時,則以反向將誤差信號逐層修改連接權系數并且反復迭代,最后使實際輸出值與期望值的均方差為最小。在修正連接權系數時,通常采用梯度下降算法。
BP神經網絡使用的是指導式的學習方法,即在學習過程中,向網絡提供有明確輸入和輸出目標的樣本對。BP學習算法是基于最小二乘法LMS 算法,運用梯度下降方法,使網絡的實際輸出與期望輸出的均方差最小。網絡的學習過程是一種誤差邊向后傳播邊修正連接權的過程。因為BP網絡對以分類為主要目的的學習非常有效,所以,我們采用B P網絡進行NPC分類的自學習。需要輸入NPC自主系統中BP網絡的特征參數主要是NPC的生命值,NPC的攻擊力,NPC的防御力,NPC的情感值等,玩家虛擬角色的生命值,玩家虛擬角色的攻擊力,玩家虛擬角色的防御力,玩家虛擬角色的情感值等。
NPC在虛擬游戲環境下,在與玩家的不斷交互中刺激著感知系統,在外界環境發生變化時產生認知模型指導下的自主行為,通過神經網絡最終演化成具有自主性的行為系統,同時,利用遺傳算法使適應度有一定程度的增加,使NPC更適應外界環境的變化。關于NPC的感知系統的設置如下:
1) 輸入參數的確定
NPC的感知系統由人工神經網絡構成,虛擬游戲環境的特征參數作為輸入送入神經網絡進行學習。在我們的游戲項目中,輸入主要包括三種類型:布爾類型、枚舉類型和連續類型三種,但是這三種類型都需要轉化成神經網絡所認可的實數類型。
2) 權重的確定
權重有些類似于生物神經網絡的樹突聯結,權重影響了輸出變量的值,并且定義了神經網絡的行為,實際上訓練或者演化神經網絡的主要目標就是確定NPC神經網絡的權重。為了確定每個輸入參數的權重,需要確定激活函數。
3) 激活函數的確定
激活函數確定了輸入與輸出參數之間的映射關系,針對NPC自主角色的神經網絡,我們采用的是非線性激活函數,具體采用的是S型激活函數。
3基于遺傳算法的神經網絡優化
神經網絡的基本特征是大規模并行處理、容錯性、自適應性和自組織性,適合處理直覺和形象思維信息。神經網絡與遺傳算法的結合使神經網絡的訓練有了一個嶄新的面貌,目標函數既不要求連續,也不要求可微,僅要求該問題可計算,而且它的搜索始終遍及整個解空間,因此容易得到全局最優解。用遺傳算法優化神經網絡,可以使得神經網絡具有自進化、自適應能力,從而構造出進化的神經網絡(ENN)[5]。
研究NPC的進化,要建立NPC在虛擬環境中進行的各種行為模型。另外,同虛擬環境本身也會發生競爭。由于適應度是NPC競爭力大小的直接反映,為了建立NPC的競爭機制,首先要建立NPC的適應度函數。
首先,NPC的適應度函數和NPC的種類相關。在同一環境下,不同NPC的適應度肯定是不相同的[6]。同時,為了表現NPC自學習對進化的影響,有了學習能力的同種NPC適應度的取值也有所不同。其次,NPC的適應度還與其所處的不同階段有關。適應度取值在其不同階段中不是一成不變的。
在環境不發生變化時,NPC的適應度函數F(t)可以用此函數表示:
其中,參數a表示NPC的生命力值;參數k表示NPC的類型,不同的NPC對同一游戲環境的適應性是不一樣的,當k取不同的值時,會得到適應度不同的各種NPC。接著按照以下工作步驟操作:
1) 從NPC神經網絡中提取權重向量;
2) 用遺傳算法演化出一個新的網絡權重群體;
3) 把新的權重插入到NPC神經網絡;
4) 轉到第一步進行重復,直至獲得理想的性能。
4試驗分析
我們的實驗測試場景如下:
在一個仿真的三維游戲環境下,游弋著若干個NPC角色和一個玩家控制的虛擬角色,主角可以漫游整個游戲場景,這些NPC當遇到主角后,可能會對主角采取不同的行為,比如攻擊行為,逃避行為,團隊作戰行為,對話行為等,所有這些行為的決策都取自于神經網絡的訓練。
在采用神經網絡算法之前,所有的NPC無論強弱,都會主動向玩家角色發起攻擊,而在采用神經網絡算法之后,這些NPC都具有了一個人工大腦,每個NPC在與玩家角色的交互過程不斷地學習,不斷地演化,最終變成自主角色,具體表現在:NPC根據以往與玩家角色交互過程中的經驗,從而產生較為理智的行為,比如當NPC感覺玩家的綜合實力要高于自己時,它可能會采取逃避的行為,而當NPC感覺其綜合實力要高于玩家時,它往往會主動攻擊玩家。
表1和表2列舉了應用神經網絡算法前后的測試數據。
應用神經網絡算法所采取的實驗方案如下:
(1) 對于NPC感知系統的輸入,包括與虛擬玩家角色的距離, 虛擬玩家的攻擊力,防御力,生命力,魔法力,信譽度,NPC自身的攻擊力,防御力,生命力,魔法力,信譽度。并將參數歸一化,使最終的參數范圍位于[-1, 1]之間;
(2) 對于NPC感知系統的輸出,包括躲避,單獨攻擊,潛伏,召喚同伴,團隊攻擊等行為。即將神經元的輸出元設計成五個,這些行為通過一些標志符來確定,例如, 如果代表攻擊的輸出位為1,則其他位為零。
通過對比兩組測試試驗,可以發現后一組試驗中,NPC能夠根據自己的實力和玩家的實力對比,理智的采取一些行為(比如退避,呼喚同伴協同作戰)而不是一味盲目攻擊, NPC的存活率顯然就很高,因此也顯得較為智能。
關鍵詞:神經網絡;智能設計;特征編碼;智能推理;基于知識的工程(KBE)
中圖分類號:TP391文獻標識碼:A文章編號:1009-3044(2011)16-3917-03
Research and Implementation of Intelligent Design System Based on Artificial Neural Network
WU Zheng
(The CAD Research Center of Tongji University, Shanghai 200092)
Abstract:Axisymmetric part of the design for the introduction of the concept of the feature encoded file, its characteristic features in a coded form to be expressed. In order to achieve intelligent process state model output, the use of artificial neural networks for automatic reasoning capabilities. Through the intelligent reasoning system to remove the experience of design continued exploration and improvement, will be part of the feature modeling input, the system can automatically determine the parts of the process, then automate production. The intelligent system can help developers and designers to quickly produce design example, so developers can focus more on product innovation activities of enterprises to improve product design and R & D has important practical significance.
Key words: neural network; intelligent design; feature coding; intelligent reasoning; KBE
產品工藝設計是產品開發的首要環節,也是關系到產品設計成功與否的核心問題。提高工藝設計集成化、系統化和智能化程度,實現經驗設計向科學設計的飛躍是研究人員多年追求的目標。而智能設計作為現階段的熱點技術,吸引了越來越多的專家和學者的目光。[1]伴隨著計算機軟硬件的成熟,以及圖形圖像學、CAD、人工智能設計技術和工藝模式理論的發展,顯著的提高了設計的質量和效率,大大縮短了設計周期和工時,形成了工藝設計的的新領域,對我國智能設計和計算機輔助設計的發展起到了極其重要的推動作用。[2]
1 人工神經網絡智能設計系統模型的表達
1.1 智能設計系統的體系結構
該智能設計系統主要的結構模塊如圖1所示。本文將該智能設計系統主要劃分為以下幾個模塊,特征造型器主要將零件的特征進行錄入,數據會同用戶的輸入數據共同進入特征編碼器;特征編碼器相當于一個接口,將形式數據轉化為模式映射器能夠識別的規范化數據(即特征編碼文件),在模式映射器內部,通過神經網絡對數據的處理,同時結合已有的經驗知識庫、材料庫、規則設計庫、工藝特征庫、映射規則和標準庫的數據交互,將數據輸出到數值公式計算模塊。數值公式計算模塊主要是在具體的場景中將約束條件進行量化,結合具體的設計要求將工藝設計順序進行調整。最后將結果反饋到用戶界面,實現智能設計。
1.2 KBE思想和本系統的有機結合
在工程實踐中,人們發現專家知識一般來源于該領域內專家的經驗和積累,具有很大程度的不確定性和模糊性,這對于知識的交流和繼承帶來了很大的困難。歐洲面向KBE應用的方法和軟件工具研究聯盟提出了KBE的概念,KBE是計算機輔助工程領域的一個進步,它是一種將面向對象方法(Object Oriented Methods)、AI和CAD技術三者集成的工程方法,能夠提供設計過程客戶化、變量化和自動化的解決方案[3-4]。,我們認為:KBE是通過知識驅動和繁衍,對工程問題和任務提供最佳解決方案的計算機集成處理技術,是AI和CAx技術的有機融合。[5-6]
KBE系統的要點主要是知識的表示、知識建模、知識推理和知識的繁衍。本系統主要通過特征造型器進行知識的表示,進而在特征編碼器中對所得知識建模,形成了特征編碼文件。模式映射器利用人工神經網絡對于特征編碼文件進行不斷的映射,實現了知識推理;同時模式映射器將學習所得的知識存儲在相應的知識庫中,進行知識繁衍。將經驗知識和隱形知識轉化為顯式知識,實現了智能系統的關鍵一步。我們將KBE的思想結合到本文所開發的系統中來。
2 零件的工藝特征及特征的編碼
2.1 特征的確定和數字化表達
首先我們需要確定零件的特征,進而將零件的特征數字化。本文根據以下原則確立零件的特征:
1)現實性。零件的特征是客觀存在的,不因人的主觀意志的轉移而改變該特征。2)可測量性。相比于傳統的經驗化設計模式,能夠準確的測量和量化零件特征是智能設計的重要要求。3)唯一性。作為零件信息的重要載體,特征的無歧義性是需要重點考慮的原則,不能同時將一個特征收錄到兩個屬性中,進而造成建模中零件屬性的混亂。
本文主要針對軸對稱的零件工藝模式,我們將主要研究零件的以下特征:沖孔、翻邊、正向拉深、反向拉深、帶孔小階梯成形法等。
考慮到神經網絡我們采用的是S型參數,所以我們將特征編碼確定為0到1之間的數,本文共確定了10種特征形狀。如表1所示。
通過確定特征參數,進而可以構建特征造型器,特征造型器以零件的實體特征為基礎,結合零件的幾何信息和拓撲信息,將參數化設計思想和特征編碼思想統一,用尺寸驅動的方法來定義特征,便于計算機對于零件特征的識別和處理。
2.2 面向對象的特征建模語言
由于在實際設計征的復雜性和多樣性,而面向對象的語言具有數據的封裝性、數據與操作的集成性、對象重載、現實世界對象的數據和行為的全面抽象、對象數據的繼承性等等許多的優點,目前已成為設計領域廣泛采用的設計手段,應用在特征設計領域,可將特征的對象數據類型抽象出來。
特征對象首先具有本身的特征尺寸和屬性,考慮到具體的應用,這些尺寸要能夠實現參數化,除此之外,還具有公差、材料、技術設計要求等信息;特征的操作類型主要分為兩種:一種是成型過程,即所謂的造型映射,另一種操作是特征在零件上的形成位置即有關位置的變動操作。在這兩種操作中,造型映射與工藝設計的過程聯系緊密,而特征位置操作則與產品的設計過程相關。下面主要是該特征對象的基類型的原型定義。
class Feature
{Stringfeature ;//零件對象的三維實體名。
StringName;//零件特征名。
Stringmaterial;//特征的材料。
intfeature_parametre; //特征尺寸的參數。
intfeature_num.;// 特征類型的編號。
intfeature_code;// 特征的編碼。
intpt1,pt2,pt3;//特征基點的坐標。
int angle1,angle2,angle3;//特征在三維空間中與X, Y, Z軸的夾角。
Public:
virtualvoidmodel();//構造三維實體特征。
virtualvoidlocate();//確定特征的空間位置。
voidmove (ap_solid *sol, ap_real tx, ap_real ty, ap_real tz);//將特征移動{tx,ty,tz}。
voidrotate (ap_solid *sol, ap_real rx, ap_real ry, ap_real rz);//將特征旋轉。
void chang_feature_para (int class_name, ap_solid *sol, ads_point pt, ap_direc ang, feature_parametre, void model); //該特征的幾何尺寸的參數化修改操作。
voidcal_area(); // 特征面積的計算。
voidcal_circl();//特征周長的計算。
}
通過實例化語言,我們能夠對零件的特征進行描述,進而便于計算機識別和處理。特征編碼的構造加入到零件基類中,具體零件的定義將繼承特征編碼的操作,并能夠進行適當的重載。
3 特征編碼器和特征編碼文件
將特征數字化表示后,本系統主要通過特征編碼器將特征組成特征編碼文件,使后續的人工神經網絡能夠對文件進行處理。有了特征編碼,我們能夠讓機器識別特征;但是為了保存特征的其他信息,如沖孔工藝中孔的直徑,翻邊的高度等等,我們引入了特征參數的概念。特征參數即為了更明確的定義特征的幾何、物理屬性,跟隨在特征編碼后面的一系列數值。圖3表示了部分特征編碼所對應的特征參數。
我們將特征編碼和特征參數組成特征編碼文件,輸入到模式映射器中。特征編碼文件的格式為:每一行表示切僅表示一個特征,其中第一個數字為特征編碼,特征參數在特征編碼之后給出。圖4顯示了一個特征編碼文件的實例。
4 智能設計系統中工藝模式的生成、映射以及神經網絡的構造
4.1 工藝模式映射的過程
我們將零件的特征編碼文件輸入人工神經網絡后,人工神經網絡進行反向推理,將零件的成型信息反向輸出,同時結合知識庫、材料庫等已有的信息,輸出結果。
工藝模式用于指導工藝計算模塊的工作,而經過特征造型之后的零件信息只有特征編碼文件。因此,人工神經網絡的任務就是根據零件的特征編碼組信息,推導出生成零件的各個中間成形形狀的特征編碼組,以及各個中間形狀在零件成形過程中的排列順序。
因為對于神經網絡來講,得到的是設計者輸入的零件模式信息,輸出是零件成形的各個中間狀態(特征編碼表示),這就決定了工藝模式在神經網絡中的映射過程是一個“逆順序”的過程,這一過程又可以描述為“反推導”過程,即:將零件的特征編碼組(零件模式)輸入到經過訓練的神經網絡中,由其輸出該零件成形的各個過程的中間形狀的特征編碼(中間形狀模式)。我們以計算機的視角來看待零件的分解,即:零件->特征->特征編碼文件->人工神經網絡。在人工神經網絡中,特征編碼文件被反編譯,特征結構后得出特征形成的順序,進而輸出,即:人工神經網絡->特征反編譯->特征工藝序列->特征編碼組->特征->零件。由此可見,人工神經網絡是用于處理工藝模式的主要工具,在前面的特征造型器、特征編碼器中生成的零件的工藝模式,以及特征編碼組等概念,都是為了便于神經網絡的處理而建立的。
最后,由這些“中間形狀模式”、“零件模式”等特征編碼組信息及其排列順序,組成該零件成形的“工藝模式”信息文件。這一過程,就是以零件模式作為輸入、以經過訓練。
4.2 神經網絡的比較及選擇
人工神經網絡用于工藝模式映射的工作主要是以下幾個:1)是針對輸入的零件模式經過映射后輸出該零件成形的中間形狀;2)生成按照工藝成形的過程而排列的零件成形中間形狀的排列順序;3)進行反向學習,從輸入的特征編碼文件中提取零件成型順序,存儲到知識庫中。[7]
神經網絡主要由以下幾類:1)分解映射結構;2)集中映射結構;3)前向網絡;4)集中反饋式網絡。[8]
我們選擇的是集中反饋式的神經網絡,相比于其他類型的網絡,反饋式結構的優點是:統一的網絡便于訓練模式的組織和映射工作的開展;輸入單元和輸出單元的數目相同,可以形成對稱的網絡結構,使得網絡的穩定性和收斂性有了保障;工藝模式的成形順序性問題不占用網絡的實際結構形式,順序性問題轉化為反饋映射的順序問題,映射的順序代表成形的順序;網絡在結構上將保證各個單步成形映射的準確性,從而提高網絡的訓練質量。[9]
表2給出了神經網絡訓練的相關內容,由于神經網絡中節點和隱層數目的不同會極大的影響神經網絡的性能,本文主要對各個不同的網絡進行了比較,得出了一個最優的網絡(即網絡7)。
5 實例模型
本文在研究的基礎上開發了一個應用實例,該實例主要是設計者將零件的特征編碼和特征參數輸入系統后,經過神經網絡的智能推理,將輸出反饋到設計平臺上。
系統首先進行特征編碼的輸入,以確定零件的特征造型;然后輸入每一個特征編碼對應的特征參數,圖5顯示了拉深工序對應的特征參數的錄入。特征參數錄入完成后可以選擇繼續添加特征或者生成特征編碼文件。圖6為一個以記事本方式打開的特征編碼文件。將特征編碼文件輸入人工神經網絡,對應的輸出為特征造型順序文件(Y.SFM),數值公式計算模塊處理該文件,最后給出智能設計工藝流程(圖7)。
圖5特征參數錄入 圖6特征編碼文件圖7 智能設計系統給出的零件成型順序及計算結果
6 結論
本文提出了軸對稱零件成型工藝的產品建模方法,然后給出了面向對象的建模語言,能夠量化表示零件的特征,在將零件的特征編碼文件通過神經網絡映射和輸出的同時,運用KBE系統的自學習理念,將習得的知識存儲。實踐表明,通過人工神經網絡和工藝智能設計系統的應用,能夠解決實際的零件設計成型問題。
參考文獻:
[1] 高偉.工藝設計信息系統中的知識發現技術研究[D].成都:四川大學,2005:22-23.
[2] 羅小賓.機械產品圖像識別技術及其在反求設計中的應用研究[D].成都:四川大學,2004:15-16.
[3] The Knowledge Engineering and Management Centre at Coventry University,UK,[EB/OL].kbe.cov.ar.uk.
[4] MOKA-Methodology & soft-ware tools-- Knowledge based engineering Applications[M].ESPRIT proposal EP25418,1997.
[5] Peng Ying-hong,Zhao Zhen,Ruen Xue-yu.Application of KBE technology in Die & Mold Design[J].International Conference on Die end Mold Technology, Beijing,2000,90-86.
[6] Peng Ying-hong,Zhao Zhen,Ruen Xue.KBE technology in Engineering Design[J].International Conference on Engineering end Technological Sciences 2000, Beijing,2000:94-100
[7] 劉振凱.智能CAD人工神經網絡專家系統的模型和結構[J].中國機械工程,1997(2).
[8] 肖人彬.智能設計:概念、發展與實踐[J].中國機械工程,1997,8(2):61-64.
【關鍵詞】神經網絡 提釩模型 控制系統
目前我國轉爐提釩爐裝備均以人工經驗操作,導致提釩工藝效率不高。本文以轉爐提釩為研究對象,結合轉爐提釩的工藝特點,通過BP神經網絡建立了提釩冷卻劑控制模型、供氧控制模型以及吹煉終點半鋼成分和溫度的預測模型。
一、 冷卻劑模型
提釩過程的熱量主要來源于鐵水本身帶來的物理熱和鐵水內各元素反應放出的化學熱,由于提釩過程中化學反應放出的熱量高于提釩過程中的散熱,因此整個過程中吹煉溫度將逐漸升高,當溫度超過了釩與碳氧化順序交換的轉化溫度時,鐵水中的碳將大量氧化,從而抑制了釩的氧化,為使吹煉溫度不高于轉化溫度,可在吹煉過程中加入冷卻劑來調節溫度。
(一)在實時控制時,取半鋼成分和半鋼溫度的目標值作為模型的輸入。
(二)冷卻劑盡量在吹煉前期加入,吹煉后期不再加入任何冷卻劑使熔池溫度接近或稍超過轉化溫度。冷卻劑主要分兩批加入:兌鐵前生鐵塊、絕廢渣等用廢鋼槽由轉爐爐口加入,冷固球團在吹煉前3分鐘之內從爐頂料倉加入爐內。
(三)在吹煉過程中,溶解于鐵水中的氧和鐵水中的氧化元素發生的氧化反應都是放熱反應,會使鐵水溫度升高,為了反映上述氧化反應的熱效應,就必須將鐵水和半鋼中的上述元素的含量作為神經網絡的輸入參數,但這樣會大大增加神經網絡的輸入節點數目,增加訓練的負擔。為了減少神經網絡的輸入變量數目,可以將上述元素按照其化學反應的反應熱進行折算。
二、供氧模型
根據不同的鐵水成分和吹煉方式,耗氧量有很大差別,同時耗氧量的多少也影響著半鋼中的碳和余釩的多少。
(一) 在實時控制時,取半鋼成分和半鋼溫度的目標值作為模型的輸入;料倉中冷卻劑的加入量以冷卻劑加入模型的輸出量作為本模型的輸入量。
(二)冷卻劑除了具有冷卻能力外,還具有氧化能力,冷卻劑中的FeO等物質既是冷卻劑又是氧化劑。因此,供氧量的多少不僅和鐵水成分、重量有關還與冷卻劑的攜氧量密切相關。
(三)吹煉完畢后,說鐵水中的Si、Mn、Ti變成了氧化產物。為了減少神經網絡的輸入變量數目,可以按照這些元素的耗氧量將其折算成釩。
三、 終點預測模型
終點預測模型如圖2所示。
(一)耗氧量和冷卻劑加入量在訓練時使用實際的加入量作為輸入參數,在實時控制時使用冷卻劑加入模型和供氧模型的輸出作為本模型的輸入參數。
(二)各種加入的冷卻劑要分別轉換為冷卻劑熱效應和冷卻劑攜氧量。
四、模型集成
模型包括冷卻劑模型、吹氧模型和終點預測模型3個子模型,通過VC++建立了模型的動態鏈接庫。
鏈接庫主要由4個類組成, 其中類CBpNeuralNetworks為基類,主要用于神經網絡的建立、訓練、存儲和模擬,其它3個派生類分別為:冷卻劑控制模型、吹氧控制模型以及半鋼成分與溫度預測模型,3個派生類的主要功能是完成各自模型的數據預處理和后處理功能。
五、結論
本文利用BP神經網絡設計了轉爐提釩冷卻劑模型、供氧模型、終點預測模型,生產現場的應用情況證實了這一方法的有效性。結果表明,該模型具有較高的一致性和泛化能力。
參考文獻:
[1]黃云,齊振亞,董履仁利用人工神經網絡系統預報鋼水溫度[J].煉鋼,2001,Vol.17, No.5, 43-46.
關鍵詞:神經網絡;齒輪;優化設計
中圖分類號:TP183文獻標識碼:A
1 齒輪傳動優化設計的研究內容
目前,齒輪優化設計的研究內容大體可以分為下列三個方面:
1)單級齒輪傳動,這方面問題有:對齒面接觸強有利的最佳齒廓設計;蝸桿傳動齒輪副最佳接觸位置設計,齒輪副中形成最佳油膜條件的齒輪幾何參數設計;齒輪輻板應力和應變值最小化的結構參數優化設計等。
2)多級齒輪傳動,這方面涉及到運動學、結構強度、振動等許多方面的問題,如最佳傳動級數、最佳傳動比分配、最佳幾何參數、最佳結構參數的設計等。
3)齒輪傳動的動態優化設計[1],這個方面的問題包括動態特性優化、慣性質量最佳分配、動載荷最小化等問題。
2 ANN在齒輪傳動優化設計中的應用
BP網絡的重要功能之一就是實現從Rn到Rm之間的非線性映射,一個單影層的BP網絡,是一個通用的函數逼近器[2]。
鑒于BP網絡的這種功能,有專家利用它來實現變厚齒輪RV減數器中設計變量與動態參數之間的映射關系,從而解決了動態優化設計中目標函數難以建立的難題,使復雜的動態優化問題轉化為簡單的普通優化問題;也有專家學者利用BP網絡來實現齒輪傳動機構中設計變量到齒面接觸疲勞強度和齒根彎曲疲勞強度的映射關系,從而簡化了計算中反復計算齒形系數、應力校正系數帶來的麻煩;還有專家學者利用BP網絡來處理強度計算中大量圖表的插值計算問題,為圖表的計算機化提供了一條有效的途徑等等。
由此看來,在齒輪傳動優化設計中,只要是非線性映射或函數逼近的問題,都可以用BP網絡加以解決。但有一點必須明確的是BP網絡最適合于處理輸入輸出之間關系不明確而又無法用一個明確的函數關系表達的場合。對于有確切函數關系的輸入輸出,使用ANN也就沒有多大意義了。
3 ANN和遺傳算法的齒輪傳動離散優化設計
以一單級斜齒圓柱齒輪減速器為例。已知名義功率P=20kw,小齒輪轉速n1=1000r/min,齒數比U=3,載荷穩定,預期使用壽命10年,每年工作300個工作日,工作時間占20%,動力機為電動機,工作中有中等振動,傳動不逆轉,齒輪對稱布置。
3.1 數學模型的建立
以體積最小為目標函數,體積最小等價于重量最小。在影響齒輪強度的參數中選擇法向模數Mn、小齒數Z1,螺旋角β及系數Φd為設計變量,故數學模型[3]為:
值得注意的是,數學模型當中,目標函數和約束條件的建立是因問題的建立不同而異的。一般情況下,設計者希望優化設計后主要達到什么目的,就選擇什么做為目標函數。有時希望達到多個指標,就成了多目標優化設計問題。對于約束條件,應當將設計中要避免的情況全盤考慮,這樣才能獲得一個實際意義的解。如本例,還應該考慮重合度系數約束,因為螺旋角的變化會影響重合度的大小。當然也有這種可能,約束條件太多,可行域都不存在了。這時,采用任何優化方法都不可能收斂。于是就要仔細研究一下,是約束條件定得不對,還是什么其他問題。
計算技術與自動化2007年6月第26卷第2期鐘 波:基于人工神經網絡在齒輪優化設計中的應用3.2 方法的優化
對上述約束條件下的極小化問題,有許多優化方法可以求解[5]。
對于本優化問題,齒數是整型變量,模數是離散變量,螺旋角和齒寬系數為連續變量。采用一般優化方法處理含有連續及離散變量的優化設計,處理思路是:首先暫時將有設計變量統一地看作連續變量,采用傳統的優化方式求得最優設計點,然后,再將離散設計變量圓整到鄰近的離散點[4]。
但這樣處理有兩個缺陷:
1)圓整后的設計點可能跑出可行域。
2)傳統的優化方法大多采用基于梯度的算法,搜索很可能陷于局部級小而不能“自拔”。
遺傳算法對處理含連續及離散變量的優化問題有獨到之處,許多研究表明了其有效性,故本文采用遺傳算法作為優化方法。
與傳統的優化方法相比,遺傳算法有下列特點:
1)對函數的要求極少,不需要梯度信息,不需要函數連續,因而具有很強的通用化能力。
2)由于同時對設計空間中的多個評估、操作因而有效避免了陷入局部最優解。
3)雖然是一種隨機概率搜索方式,但不是在解空間內盲目地窮舉,而是一種啟發式搜索,因而搜索效率較高。
4)由于處理對象是設計變量的編碼,而不是設計變量本身,因而可以方便用來處理含連續及離散變量的優化設計問題。
3.3 BP網絡用于逼近各種線圖
齒輪傳動設計的特點是系數多,決定這些系數要用到各種線圖和圖表。要在優化設計中將確定這些系數的過程程序化,有時是很繁雜的。而用BP網絡來實現這些曲線的插值程序化[5],卻非常方便有效。圖1是變位系數x=0時結點區域系數相對的螺旋角的關系曲線,圖中“+”表示曲線離散化的點,這些點將作為訓練樣本數據用語網絡訓練。樣本數據為:
利用Matlab工具箱中的工具函數訓練網絡,訓練完成后的網絡權值及閾值陣存入指定的文件中。這個過程需要編一段程序來完成[6],程序流程如下:
開始清除內存空間的所有函數及變量從命令式M文件中讀入訓練樣本數據對數據歸一化處理調用工具函數initff初始化網絡調用trainlm訓練網絡利用save命令將權值閾值陣存入到指定文件中[6][7]。
圖1 神經網絡對結點區域系數的
逼近原始曲線及取樣點[JZ)]
當在齒輪強度計算中用到該線圖時,只需要將存儲下來的權值閾值利用load命令加載到內存空間,然后利用工具函數simuff就可實現不同螺旋角對應的結點區域系數的插值計算了。
關于BP網絡須說明的是:訓練樣本數太少,則樣本的信息不能反映待逼近曲線的特性,訓練樣本數太多,又存在獲取的困難。一般認為,樣本數硎淙虢岬閌即可,這個確切的數據可以動態[2]確定樣本數,即將可獲取的樣本分為訓練集和測試集,用訓練集訓練網絡。訓練誤差達到要求后,再用測試集計算測試誤差,若測試誤差太大,表明樣本數不夠,這時,需將測試集納入訓練集中,以加大訓練集的容量。
4 優化結果的處理
利用遺傳算法對上述優化問題求解。遺傳算法初始群體規模取為60,交叉率Pc=0.7,變異率PM=0.01經200次進化迭代后[8],獲得最優解。
初始設計點為:
從上面結果可以看出,經遺傳算法優化后,目標函數有所下降。降幅不大主要是原始設計已比較接近優化結果的緣故,但優化方法避免了人工設計時的盲目試湊。另外,體積的下降是以犧牲中心距為代價的。在本優化設計中,中心距未加任何約束,其結果不是薦用系列值。若要取為薦用值,因跨度太大會影響優化結果,故本文圓整為172,通過微調螺旋角實現。
5 結 論
關鍵詞 神經網絡;最短路徑;matlab;ArcGIS
中圖分類號:TP183 文獻標識碼:A 文章編號:1671—7597(2013)041-194-01
擁堵問題對城市交通的干擾是巨大的,甚至對道路公共交通設施(公交車)也產生了巨大的干擾,從而對其它的社會生產活動又產生間接干擾。在實際的交通出行中,擁堵在交通網絡中向相鄰的路段和節點進行傳播,這類似與病毒在復雜網絡中的傳播,把復雜網絡解決擁堵的理論應用到實際的公交網絡中,就可以解決公交網絡的擁塞問題,對擁塞的傳播進行有效地控制。本文針對城市擁堵背景下的公交線路選優問題結合上述模型思想分別從公交路線選優模型的構建與運用,軟件設計和方案生成比較兩個層次方向進行深入研究。
1 模型的構建與形成
1.1 交通流量超標擁堵與公交路線選優模型的關系
交通擁堵的形成與發展是一個隨時間和空間不斷發生演變的動態過程,所以在研究擁堵分布的過程中,在充分考慮時間維的基礎上,將擁堵形成的過程分為“點”、“線”、“面”三個空間層次進行分析研討,同時在考慮完這三種空間層次后,結合最短路徑算法,并將擁堵節點的擁堵程度過高的點作為避開點從而進行路線規劃。
1.2 點-線-面擁堵空間分布模型
1.2.1 “擁堵點”——路段交通擁堵加權系數
“交通點”的判斷即從交通信息系統中收集擁堵發生的路段信息,從而確定擁堵發生地點,一般情況下,取路段交通流量V與路段通行能力C的比值來判定交通流的狀態,則“擁堵點”加權系數為:
1.2.2 “擁堵線”——線路交通擁堵加權系數
“擁堵線”用以判斷擁堵點所在路段是否相連,如果路段的起點與終點有重合則表示路段相連,則點貫穿成線,構成“擁堵線”;如若無重合點,則表示“擁堵點”所在路段為相對獨立的擁堵路段,故“擁堵線”反映出的道路擁堵情況更為直觀和方便決策。
1.3 人工神經網絡模型——ARIMA-ANN模型
ARIMA模型的基本思想是:將預測對象隨時間推移而形成的數據序列視為一個隨機序列,提出的這種組合系統包含兩步。第一步,建立一個多層人工神經網模型來分析交通流時序序列中得非線性部分;第二步,從多層人工神經網的殘余部分提出一個差分自回歸移動平均模型。
本文模型中采用的指標包括相關路段周邊人口分布,路段高峰小時路網容量和交通流量,交通流平移速度(采用歸一化處理不同的離散坐標點),機動車數量,紅綠燈數量等,模型通過對指標的分類學習實現綜合考慮各指標合理權重的條件下對于線路相關擁堵系數的預測。
通過上述模型預測到研究路段的指標分類結果和相關擁堵加權系數以及人口分布加權系數后,下面我們結合最短路徑算法實現考慮加入人口分布加權系數和擁堵加權系數后的公交線路方案生成的算法模型。
1.4 加入人口分布加權系數和擁堵加權系數后的加權最短徑路算法
在所有向量的權值基礎上乘以擁堵系數和人口分布系數(包括擁堵點對應路段的擁堵系數和擁堵線對應擁堵路線的擁堵系數和路段周邊人口分布系數)后得到每段徑路弧度所對應的人口分布-擁堵加權值。
2 模型的軟件實現與運用
在得到上述的綜合加權路線選優模型后,我們以C#語言為主框架語言,以MATLAB語言和C++編寫模型算法并封裝動態鏈接庫(dll),C#通過外部調用dll,結合數據庫技術和ArcGIS技術編寫了一套基于本算法模型的公交路線免擁堵路線計算設計軟件。
筆者編寫了一套關于路線設計規劃的軟件,在錄入關于神經網絡的閥值與各節點人口分布-擁堵加權系數后,系統自動生成了一套線路走行方案,算法原理采用本文上述算法思想。筆者實現所在學校到成都市火車站的公交路線的選優生成,并與原路線進行了方案比較。在下面的附圖中,筆者通過后臺數據庫錄入部分地理坐標點的擁堵值用以檢測軟件在路線方案自動生成時是否會盡可能的避開擁堵系數大的“擁堵點”和“擁堵線”。經過測試和比較,軟件系統生成后的新的路線方案避開了擁堵系數較大的“擁堵點”和“擁堵線”,生成后的新的路線方案雖然走行徑路比原有公交路線略長,但是從時間的角度和舒適度的角度綜合考慮可以發現是大大優化的
3 結論
本文模型以成都市相關路段歷史統計數據為依據,在ArcGIS地理信息系統軟件中依據神經網絡相關預測模型為基底,通過對可能引起交通擁堵的相關指標和可能引起居民與公共交通設施占有率低下等指標進行了訓練學習,實現了對于城市交通“擁堵點”和“擁堵線”的預測,并結合最短路徑算法實現對于各中轉節點向量邊的擁堵系數量值的加權折算,使得算法模型在生成公交路線方案時盡可能考慮到靠近人口分布系數較高的地帶并且避開擁堵系數過高的“擁堵點”和“擁堵線”,從而在整體上生成實現公交線路最優方案。在后續研究中,筆者將加強對于復雜網絡中網絡間彼此影響的研究,從而力爭得出更為合理高效的路線選擇方法。
參考文獻
關鍵詞:BP人工神經網絡;RBF人工神經網絡;經濟增長預測
中圖分類號:TP183文獻標識碼:A文章編號:1009-3044(2011)10-2345-03
The Study of Forecast of Zhejiang Province's Economic Growth Using BP and RBF Artificial Neural Network
BAI Xue-bing
(Zhengjiang University of Technology, Hangzhou 310014, China)
Abstract: Based on existing studies of economic forecasting methods, the article studies the Zhejiang province'sEconomic Growth Forecastusing BP and RBF Artificial Neural Network.Thedata research shows Artificial Neural Network hasgood precision, but different Artificial Neural Network have different behavior, some have big error. Artificial Neural Network can provide good reference for the making policy of sector of economy.
Key words: BP artificial neural network; RBF artificial neural network; economic growth forecast
1 經濟預測概論
經濟預測是與未來有關的旨在減少不確定性對經濟活動影響的一種經濟分析。它是對將來經濟發展的科學認識活動。經濟預測不是靠經驗、憑直覺的預言或猜測,而是以科學的理論和方法、可靠的資料、精密的計算及對客觀規律性的認識所作出的分析和判斷。
2 人工神經網絡經濟預測技術
由于人工神經網絡具有大規模并行處理、容錯性、自適應和聯想功能強等特點,作為非線性智能預測方法的人工神經網絡預測方法成為國內外經濟預測研究的一個熱點。
人工神經網絡不斷應用于證券預測分析、企業經濟戰略預測、經濟理論創新、經濟預測預警等研究中,都得到了一定的效果。
3 BP與RBF神經網絡預測模型分析
3.1 經濟增長神經網絡設計模型
3.1.1 宏觀經濟預測指標
經濟增長率是判斷宏觀經濟運行狀況的一個主要指標。經濟增長率指的就是不變價國內生產總值增長率(簡稱國內生產總值增長率。因此,判斷宏觀經濟運行狀況要落腳到對國內生產總值的核算上。在本文中我們采用GDP的增長率來作為預測目標。
3.1.2 神經網絡設計模型經濟模型的設計
本論文采用兩種模型對經濟進行預測。
1) 第一種 GDP預測模型:第n年的一、二、三產業的增長率作為輸入,第n+1年GDP增長率作為輸出。
2) 第二種預測模型。第n-3、n-2、n-1、n年的經濟增長率作為輸入,第n-1、n、n+1年經濟增長率作為輸出。
這里還要說明兩個問題。第一我們用到的數據來自2009年 浙江省統計年鑒,它的網址是 。
3.1.3 神經網絡模型結構
設計經濟預測神經網絡模型前,首先需要確定神經網絡的結構,主要包括如下內容:網絡的層數,每層的神經元數和激活函數等。采用的神經網絡結構如圖1。
3.2 使用BP在以浙江省過去的每年的GDP增長指數的基礎上進行BP神經網絡預測
3.2.1 學習樣本的選擇
本次實驗使用Matlab 軟件采用3層BP神經網絡建立浙江省經濟發展的的預測模型。輸入層節點數為n=4,輸出層節點m=3.而隱含層節點數的選擇是人工神經網絡最為關鍵的一步,它直接影響網絡隊復雜問題的映射能力,實驗中我們采用試湊法來確定最佳節點數。現設置較少的隱節點訓練網絡,然后逐漸增加網絡節點數,用同一樣本進行訓練,從中確定網絡誤差最小時對應的節點數,隱層、輸出層神經元的轉移函數,隱含層和輸出層轉移函數分別采用tansig和logsig,訓練函數選擇traindx。
3.2.2 數值歸一化處理
對于浙江省經濟增長序列Q=(Q1,Q2…,Qt)。設序列的最大值、最小值分別為Qmax、Qmin。對時間序列的值作歸一化處理。
令xi=(Qi-Qmin)/(Qmax-Qmin)
3.2.3 樣本數據訓練和數據預測
采用1978~2003年的數據樣本在MatLab7.0軟件中對輸入網絡進行訓練.隱層節點數先從4開始訓練,逐步增加到12時,當數值 為10時預測結果較好。允許誤差為0.001,訓練3217次達到訓練要求。
采用1978~2004年的數據作為第一組訓練數據,2005-年數據作為仿真預測數據,通過神經網絡預測GDP。采用1978~2005年的數據作為第一組訓練數據,2006年數據作為仿真預測數據,通過神經網絡預測GDP, 采用1978~2006年的數據作為第一組訓練數據,2007-年數據作為仿真預測數據,通過神經網絡預測GDP,依次類推,產生結果如表1所示。
3.2.4 數據分析
從2000-2004的擬合數據來看,相對誤差比較小,BP網絡對整個模擬數據的擬合程度還是比較好的,但是從2005-2009的預測數據來看預測數據的誤差還是比較大的,這也說明對未來的預測是很難的。各種不確定的因素在起作用。
3.3 三種產業增加率BP確定法預測GDP
3.3.1 樣本數據訓練
將1978-2004年數據對輸入網絡進行訓練。然后把需要預測的樣本2000-2004年的樣本數據輸入網絡,得到結果,然后用反歸一化公式獲得結果。在Matlab7.0中調用newff函數,建立一個3個輸入節點、18個隱含層節點、一個輸出結點的BP神經網絡,隱含層和輸出層轉移函數分別采用tansig和logsig,訓練函數選擇traindx,允許誤差為0.001,訓練1748次達到訓練要求。
采用1978~2004年的數據作為第一組訓練數據,2005年數據作為仿真預測數據,通過神經網絡預測GDP。采用1978~2005年的數據作為第一組訓練數據,2006年數據作為仿真預測數據,通過神經網絡預測GDP, 采用1978~2006年的數據作為第一組訓練數據,2007年數據作為仿真預測數據,通過神經網絡預測GDP,依次類推,產生結果如表2所示。
3.3.2 數據分析
從預測數據來看預測數據的誤差盡管比上一種類型的數據要好,但是誤差還是比較大的,但是考慮到預測的能力 ,數據還是可以接受的 。但是數據誤差還是比較大的,這也說明對未來的預測是很難的,不是十分確定的,有些文章的數據精確度挺高的,但我想應該是不太可能的,也許有故意湊數據的嫌疑。如果預測一年的話,可以通過調整參數獲得近似結果,但是很多年就很困難。
3.4 使用RBF在以浙江省過去的每年的GDP增長指數的基礎上進行RBF神經網絡預測.
3.4.1 RBF 神經網絡模型設計
該種方式與第一種BP神經網絡預測方法類似, 以以前四年的GDP增長率作為輸入,后兩年加以預測的年作為輸出。輸入層節點數為n=4,輸出層節點m=3.而隱含層節點數的選擇是采用matlab的newrbe自動來設置.然后用同一樣本進行訓練。
3.4.2 樣本數據訓練和數據預測
1) 采用1978~2004年的數據作為第一組訓練數據,2005年數據作為仿真預測數據,通過神經網絡預測GDP。采用1978~2005年的數據作為第一組訓練數據,2006年數據作為仿真預測數據,通過神經網絡預測GDP,依次類推,產生結果如表3所示。這兒采用newrbe函數,spread參數為0.25。這是因為通過測試采用0.25獲得的數據結果較好。
3.4.3 數據分析
從實驗數據看,RBF對整個模擬數據的曲線擬合程度是相當完美,但是從2005-2009的預測數據來看預測數據的誤差還是比較大的,這也說明RBF神經網絡盡管曲線的擬合程度比BP網絡好 ,但是從預測的能力來講,并不比BP網絡好,反而通過試驗顯得更差一些。這仍然表明對未來的預測是很難的。各種不確定的因素在起作用。神經網絡的預測也只能作為參考之用,不能對各種的突發事件進行預測。
3.5 使用RBF三種產業增加率確定法預測GDP
3.5.1 RBF神經網絡模型設計
該種方式與對應的BP神經網絡預測方法類似, 以一年的三種產業增長率作為輸入,后一年的GDP增長率預測作為輸出。本次實驗采用RBF神經網絡建立浙江省經濟發展的的預測模型。輸入層節點數為n=3,輸出層節點m=1.而隱含層節點數的選擇采用RBF自動的newrbe方法實現。
3.5.2 數據處理
1) 采用1978~2004年的數據作為第一組訓練數據,2005年數據作為仿真預測數據,通過神經網絡預測GDP。采用1978~2005年的數據作為第一組訓練數據,2006年數據作為仿真預測數據,通過神經網絡預測GDP, 采用1978~2006年的數據作為第一組訓練數據,2007-年數據作為仿真預測數據,通過神經網絡預測GDP,依次類推,產生結果如表4所示。
3.5.3 數據分析
但是從2005-2009的預測數據來看預測數據的誤差比上一組得RBF的誤差還要大,幾乎有點難以接受。這也說明RBF神經網絡盡管曲線的擬合程度比BP網絡好,但是從預測的能力來講,并不比BP網絡好,反而我通過試驗更差一些。2009年的數據變得極為不合理,從而導致數據的偏差性很高。,從測試數據可看出,但是由于經濟運行的復雜性,以及不可預知性,特別是由于2008的美國金融導致的世界范圍的經濟危機,導致經濟數據的不可靠性大大增加,歷史數據變得用處不太大。2009年的數據變得極為不合理,從而導致數據的偏差性很高。
4 總結與歸納
從我們的試驗來看,各種神經網絡的確可以對未來進行預測,但是精度多高卻有一些問題,從我們的試驗來看BP神經網絡的數據要比RBF神經網絡的數據要好,但是也只在一定范圍內 ,四種檢測方法,只有一種數據還略微能夠接受。神經網絡預測仍然需要不斷的完善。
參考文獻:
[1] 張德豐.Matlab神經網絡應用設計[M].北京:機械工業出版社,2009.
[2] 高雋.人工神經網絡原理及仿真實例[M].2版.北京:機械工業出版社,2007.
[3] 韓力群.人工神經網絡理論、設計與應用[M].2版.北京:化學工業出版社,2007.
關鍵詞: 神經網絡知識庫 多神經網絡集成 方法研究
隨著我國科學技術的不斷發展,神經網絡技術已經獲得廣泛的應用,在我國的多個領域中使用,且已經小有成就。但是在使用的過程中還不成熟,仍存在很大的不足和問題,這就需要工作人員進行反復的試驗和計算,以獲得有關于神經網絡的模型。神經網絡模型在使用的過程中,會受到操作人員的影響,因此結果表現出來的也就不同。神經網絡在實際使用的過程中,操作人員多是缺乏專業知識水平的普通工作人員,這就導致神經網絡模型的使用效果得不到保障,因此需要系統的、可靠的神經網絡模型操作的應用體系。
一、多神經網絡集成方法
1.在神經網絡知識庫基礎上發展而來的神經網絡集成應用體系
在神經網絡技術應用的過程中,要對工作人員所具備的神經網絡方面的知識和經驗進行培訓,可以通過多元化的神經網絡來學習和積累與神經網絡有關的知識,神經網絡所具備的實用性將獲得大幅度的提高。現階段,我國與神經網絡技術有關的工程都較為復雜,大多數的工程都具備獨立性較強的子系統、功能單元及部件等,將原本復雜的系統分解成多個簡單的小系統。因此工作人員在遇到復雜的系統問題時,可以將復雜的問題分解成多個相對獨立的部件、功能單元或者是子系統,進行信息資料的輸出或者是輸入。使用神經網絡技術得到相關子系統的特點信息之后,就能夠以此為基礎面對系統復雜的問題,例如系統中的辨識度問題、同一個系統中包括多個子系統的神經網絡問題等。
在上述想法的基礎上,對神經網絡知識庫進行構建,并逐漸完善神經網絡集成體系的框架。是按照將復雜的神經網絡問題分解成多個子系統的神經網絡問題,而不是針對一個相對較復雜的問題進行的。將復雜問題分解成多個子系統,能夠充分體現復雜的神經網絡技術所具備功能,并為神經網絡問題的分類提供便利,不僅可以提高解決問題的工作效率,而且可以積累神經網絡方面的經驗。在神經網絡問題的實際解決過程中,如果子系統所具備的屬性是對數據資料的輸出和輸入是固定的話,就需要子系統記住這些匹配。也可以是將神經網絡子系統中存在的知識庫與神經網絡中的儀器設備相匹配,那么在進行相關信息的輸入時,就可以對神經網絡知識庫中的連接權、閾值等相關參數進行調用,而不進行反復性質的神經網絡學習,這時神經網絡所具備的功能就是對函數進行傳遞。如果在子系統的神經網絡知識庫中存在與子系統屬性相匹配的網絡部分,就需要在神經網絡知識庫中找到與初始值和缺省值相匹配的經驗值,將其作為基礎就可以對神經網絡的子系統的連接權、閾值等相關參數進行訓練;如果神經網絡的知識庫中不存在與子系統屬性相匹配的網絡部分,就要對神經網絡的樣本進行訓練,并在神經網絡問題求解的過程中對網絡結構的設計和計算方法等進行學習和訓練,以求真正與神經網絡的知識庫相融合。在神經網絡知識庫基礎上發展而來的多神經網絡集成體系如下圖所示:
圖 在神經網絡知識庫基礎上發展而來的多神經網絡集成體系
2.多神經網絡集成的方法與流程
從神經網絡的有關資料可以看出,多神經的網絡集成體系中存在多個子系統且屬于多層并聯或者串聯的結構體系。從資料明顯可以看出,子神經網絡系統的結構較為簡單,為神經網絡進行計算和訓練等操作提供了便利。在對復雜的網絡問題進行分解的過程中,要進行反復的摸索和計算,以求得到最優化的結果,并把結果存儲在神經網絡的知識庫中,為下一次的操作提供經驗和學習的基礎。在神經網絡系統中存在多個層次,可以將位于下一層的輸出當做是上一層的輸入使用,位于同一層次的神經網絡都可以被上一層的神經網絡使用,直到到達神經網絡的頂層為止。
二、在BP網絡集成的基礎上進行非線性的研究案例
本文通過復雜的非線性函數案例對神經網絡的集成方法進行驗證,以有效證明神經網絡集成方法所具備的有效性、穩定性、可靠性和可行性。在神經網絡函數的研究過程中,人們一直都比較注重對神經網絡函數逼近原理進行研究,但是沒有更為明確的說明。
1.非線性函數逼近原理的舉例描述
通過神經網絡進行函數的非線性映射的描述,函數F■(x■,x■)中的x■,x■要符合以下要求:x■,x■∈[-1,1]。函數表示為:
F■(x■,x■)=sin■∈(πx■)+cos■(πx■)+2sin(πx■)cos(πx■)
在函數中根據x■=x■=0.05的原則進行取點的操作,并對函數進行神經網絡的輸入和輸出操作的訓練,以求得出函數公式最理想的輸出結果。
2.函數問題的解題方法
(1)在函數公式求解的過程中,需要用到神經網絡知識庫中的逼近原理。
(2)在函數公式求解的過程中,需要進行反復的摸索和拼湊,以實現對神經網絡拓撲結構的設計,通過BP算法的使用,實現對函數公式求解的目的。
(3)在函數公式的求解過程中,如果使用多神經網絡集成方法的話,就要對神經網絡的結構進行設計,以為函數公式的求解提供便利。
F■(x■,x■)=sin■(πx■)+cos■(πx■)+2sin(πx■)cos(πx■)
=(sin(πx■)+cos(πx■))■
根據神經網絡中可以將復雜的問題進行分解成多個子系統的原則,將函數公式分解成以下四個簡單的函數問題:
f■(x■)=sin(πx■)
f■(x■)=cos(πx■)
f■(f■,f■)=sin(πx■)+cos(πx■)=f■f■
F■(f■)=f■■
對分解之后的函數公式進行求解,通過BP算法的求解,從而達到對函數公式求解的目的。
3.函數求解過程中所使用的方法對比
在使用神經網絡進行求解的過程中,神經網絡的結構呈現出較為復雜的特點,由于缺少經驗作為基礎,因此只能進行多次的嘗試和摸索,比較花費人力,浪費時間,得到的結果還不理想,存在一系列的問題,例如速度慢、規律復雜等。本文介紹的案例就進行了反復的嘗試,得到的輸出三維圖與最理想的三維圖之間還存在差異。
把原來較為復雜的函數公式分解成多個簡單的函數公式之后,在通過多神經網絡集成方法進行求解的過程中,每個函數公式都很簡單,在訓練的過程中,也不存在大量的拼湊和嘗試,能夠在短時間內就確定函數公式結構的參數。將與函數公式有關的閾值和訓練值等都存儲在神經網絡的知識庫中,在遇到同類型的函數公式求解時,就可以從神經網絡知識庫中直接調用即可,不僅計算的速度快,輸出結果的精確度也很高。通過神經網絡集成方法找到的函數公式的輸出三維圖,與最優的三維圖之間非常的相似,差異不大,可以忽略不計。
三、結語
在神經網絡知識庫的基礎上使用多神經網絡集成方法進行問題的求解時,不僅可以大大節省求解所用的時間,而且可以大大提高輸出結果的精確度。可以將復雜的問題分解成多個簡單的問題,以提高神經網絡的工作效率,對計算方法進行創新和發展。
參考文獻:
[1]林民龍.基于神經網絡集成的增量式學習[D].中國科學技術大學,2012.
[2]唐東波.基于神經網絡集成的電信客戶流失預測建模及應用[J].大眾商務,2010(06).
[3]李明愛,王蕊,郝冬梅.基于神經網絡集成技術的運動想象腦電識別方法[J].北京工業大學學報,2011(03).
[4]劉大有,張冬威,李妮婭,劉杰,金弟.基于網絡聚類選擇的神經網絡集成方法及應用[J].吉林大學學報,2011(04).
[5]潘遠.粗集約簡的神經網絡集成在遙感影像分類中的應用[D].遼寧工程技術大學,2012.
關鍵詞:仿生算法;神經網絡;遺傳算法
中圖分類號:TP183文獻標識碼:Adoi: 10.3969/j.issn.1003-6970.2011.03.017
An Improved Algorithm of Bionic Research and Analysis
Yue Tong-sen, Wang Da-hai
(XinXiang Vocational and Technical Collage, Xinxiang 453000,Henan,China)
【Abstract】In this paper the bionic algorithm of neural network and genetic algorithm were analyzed and summarized, aimed at slow speed of neural network training, recognition efficiency low, and genetic algorithm the optimum choice premature convergence problem, combined with neural network method and genetic algorithms of their respective characteristics, puts forward the improved algorithm.Without the destruction of single neurons based on input weights, adopt data pretreatment methods to reduce the number of input layers, so as to improve the ability of evolutionary learning.
【Key words】Bionic algorithm; Neural network; Genetic algorithm
0引言
人工神經網絡[1]和遺傳算法[2]是仿生算法[3]的典型方法,它們的優化問題一直是眾多研究者所倍為關注的研究熱點之一。在人工神經網絡和遺傳算法結構的研究中發現,人工神經網絡具有很好的模式分類的特性,遺傳算法有很好的動態變更權值的特性,基于此,本文提出了一種改進的基于人工神經網絡和遺傳算法的算法。本章的改進算法,就是對人工神經網絡和遺傳算法進行了變換,增強了對輸入權值的變化速度,并提出用減少輸入層個數的方法是加快神經網絡學習的有效方法,取得了良好的實驗效果。
1神經網絡和遺傳算法的特究點
1.1神經網絡和遺傳算法的不同點
1.神經網絡是多層感知機,而遺傳算法是單層感知機。神經網絡是由輸入層,隱含層和輸出層夠成,但遺傳算法的基因組是一個數組,不管基因的長度有多長,其結構仍然是一個單層感知機。
2. 神經網絡的隱含神經元個數是不確定的,而輸出層和輸入層的個數是可以確定的。我們希望輸入層的個數用新的方法得到降低,這樣神經網絡的訓練速度就可以提高。同時對于隱含層的層數,一般情況設為1。每層的神經元個數也并不是越多越好,是要根據問題的情況而變動的。但神經網絡的隱含層是不確定的,而且隱含層的個數也是不確定的。對于遺傳算法,它的二進制的長度是可以確定的,但是交叉和變異的比例是變動的。對于單點交叉比例,我們可以設定為黃金分割點。雖然設定為黃金分割點作為單點交叉比例沒有用數學方法嚴格的證明,但是,大量的實驗表明,選擇黃金分割點往往可以得到較好的結果。對于變異比例,沒有交好的方法確定,只能設計交互式的實驗來調試決定。
3.權值的更新方式不一樣。神經網絡的權值的更新方式是時時的,而遺傳算法權值的更新方式是批量的。
4.兩者應用的范圍不一樣。神經網絡主要應用于模式匹配,錯誤診斷,監視病人的狀態,特征提取,數據過濾。而遺傳算法主要應用在計算機輔助設計,日程安排,經濟學的投資研究等。
1.2神經網絡和遺傳算法的相同點
1.有教師的學習。神經網絡的輸出是有目標的,當然是確定的。同時對于遺傳算法的目標也是確定的。所以兩者都是有目標的,也就是有教師的學習。
2.隨機近似優化過程。神經網絡中,如果把網絡的權值初始化為接近于0的值,那么在早期的梯度下降步驟中,網絡將表現為一個非常平滑的函數,近似為輸入的線性函數,這是因為sigmoid函數本身在權值靠近0時接近線性。同樣,遺傳算法的初始個體都是隨機產生的,它的交叉和變異都是一個不斷近似的過程。
3.并行化。神經網絡的每個神經元是獨立的,如果把每個神經元分配一個處理器,那么就可以采用并行的方式。同樣,遺傳算法很自然地適合并行實現,有粗粒度并行方法和細粒度并行方法。有粗粒度并行方法就是把群體細分成相對獨立的個體群,稱為類屬,然后為每個類屬分配一個不同的計算節點,在每個節點進行標準的GA搜索。細粒度并行方法就是給每個個體分配一個處理器,然后相鄰的個體間發生重組。
2算法的研究及改進
結合人工神經網絡和遺傳算法的研究的本質,通過兩種算法結合的研究及改進,提高算法的收斂速度,從大量的數據中模擬生物的特性來完成特定的任務和解決問題的方法和方向。由于遺傳算法是單層感知機,而神經網絡是多層感知機,所以可以從多層感知機的多層性,我們想象為遺傳算法是單層感知機作為神經網絡是多層感知機的輸入層。這樣,我們就可以采用遺傳算法的動態變更權值的特性來對神經網絡輸入層有效性的遺傳和變異。這種算法適合與沒有輸入,只有輸出的應用,就像無人駕駛技術中控制行駛的速度和方向的控制一樣。基本的框架如圖1:
圖1結合人工神經網絡和遺傳算法的框圖
Fig.1 Combined with artificial neural network and genetic algorithm diagram
最上面的是智能體,神經網絡的輸出來控制智能體,控制中心將神經網絡的權值用遺傳算法的初始體來提供。
2.1遺傳算法的基因作為神經網絡的權值變量
遺傳算法的基因的初始化必須要滿足神經網絡的輸入要求,一般遺傳算法的基因都是0,1編碼。但是為了達到神經網絡的輸入要求,是要在(-1,+1)之間隨機產生。
2.2遺傳傳算法中雜交點選擇
遺傳算法中,一般都是采用隨機平均變異[4][5]的方式,但是如果輸入是由遺傳算法的基因提供的話,為了保證在變異的時候,采用標記變異的方法。我們可以首先根據圖2的神經網絡來考慮:
圖2遺傳算法作為人工神經網絡和的權值圖
Fig.2 Genetic algorithm as artificial neural network and the weights of figure
很顯然,(0.3,-0.8,-0.2)是神經元1的權值 ;(0.6,0.1,-0.1)是神經元2的的權值;(0.4,0.5) 神經元3的權值。為了在遺傳算法中的雜交過程中,不破壞每個神經元的權值個數,特意標記(3,6)所在的箭頭。
2.3引入神經網絡輸入層的數據預處理
神經網絡的計算問題是神經網絡應用中最為關鍵的問題。如何提高網絡的訓練速度是算法研究的重點。我們在思考問題的時候,總是希望問題越簡單越容易解決。同樣,我們也可以通過對數據的預處理,來降低問題的難度。
為了減少輸入層的個數,我們可以先對數據進行預處理。預處理的方法為如下流程:
(1).計算機器人前進方向Position(x,y)和目標的所在的位置Location(x,y)。
(2).歸一化Position(x,y) 和Location(x,y)。
(3).用點乘的計算公式計算兩者點乘。
(4).用符號重載的方式計算是順時針還是相反。
(5).計算角度=第3步的結果*第4步的結果。
3實驗結果及分析
3.1實驗框架
將本算法應用于掃雪機器人的智能控制中,設計的主要模塊:
3.1.1神經網絡部分的設計
神經網絡的輸入由四個變量組成:掃雪機器人方向向量(由兩個變量組成,即在X和Y的分量),發現目標,即雪的向量(由兩個變量組成,即在X和Y的分量)。神經網絡的隱含層由一層組成,而且由10個神經元。神經網絡的輸出由兩個變量組成,V1和V2,分別作用在機器人的左輪和右輪上。神經網絡的響應函數采用SIGMOD。
3.1.2遺傳算法部分的設計
遺傳算法的初始化是為神經網絡提供權值,所以是由[-1,1]隨機數產生。遺傳算法的變異是采用隨機變量的變異,選擇采用輪轉法。
3.1.3掃雪機器人
掃雪機器人用神經網絡來控制,當找到目標后,它的適值就加一。這樣就隨著發現目標越多,它的適值就越大。學習能力是通過不斷的學習后,它的適值就會加強。如果直接采用機器人前進方向和目標的所在的位置,那么神經網絡的輸入為四個變量。
3.2結果與分析
如果直接采用機器人前進方向和目標的所在的位置,那么神經網絡的輸入為四個變量。通過對掃雪機器人的學習過程,沒有進行預處理的數據,即四個變量輸入神經網絡后的參數設定:神經網絡的輸入為4,神經元為6個,輸出個數為2個,如圖3所示:
圖3網絡的參數設定圖
Fig.3 Network parameters set figure
我們設定初始的適值為0,如果發現一個目標后,它所對應的適值就加上1,這樣經過50次的進化后,沒有進行數據預處理的最大值是25,平均值是10.1333。如表1所示:
將50次的統計結果用柱狀圖進行對比,如圖4所示。
圖4進化50代后的加入數據預處理和沒有加入預處理的對比圖
Fig.4 After 50 generation data preprocessing and did not join joined the pretreatment of contrast diagram
為了減少輸入層的個數,我們可以先對數據進行預處理下面,用統計的方法對數據進行的結果分析,如表2所示。
將進化100代后,對比兩者的對比柱狀圖如圖5所示。
圖5進化50代后的加入數據預處理和沒有加入預處理的對比圖
Fig.5 After 50 generation data preprocessing and did not join joined the pretreatment of contrast diagram
實驗結果表明,為了減少輸入層的個數,先對數據進行預處理。通過對掃雪機器人的過程的數據分析進行分析,數據預處理后的智能進化學習能力相對于原始數據的智能進化學習能力有明顯的提高。
4結束語
本文提出了基于神經網絡和遺傳算法結合的改進算法,對于遺傳算法的變異操作進行改進,不會破壞單個神經元的輸入權值的基礎上,采用數據預處理的方法來減少輸入層的個數,從而提高進化學習的能力。從實驗數據中可以看到,本章提出的改進算法加快了學習速度,達到了提高智能學習的預期
目的。
參考文獻
[1] 喬俊飛,韓桂紅.神經網絡結構動態優化設計的分析與展望[J].控制理論與應用,2010,3(13):350-357.
[2] 葛繼科,邱玉輝,吳春明,等.遺傳算法研究綜述[J].計算機應用研究,2008,10(9):2911-2916.
[3] 丁建立,陳增強,袁著祉.智能仿生算法及其網絡優化中的應用研究進展[J].計算機工程與應用,2003,12(3):10-15
[4] 鞏敦衛,等.交互式遺傳算法原來及其應用[M].北京:國防工業出版社,2007.
關鍵詞:電氣設備;故障診斷;神經網絡;學習算法
中圖分類號:TP183
近年來,隨著電氣設備復雜度的增加,其發生故障的概率也逐漸上升。即使是熟練工程師,面對日趨復雜的設備內部電氣結構,也難以迅速分析及判別其故障原因。與此同時,涌現出的各種智能算法、專家系統等,為設備診斷問題提供了可行的方案。其中,神經網絡以其特有優勢在電氣設備故障診斷中發揮了重要作用。神經網絡理論是人工智能、認知學、腦神經學、信息學等諸多學科融合發展的結果,它是由大量簡單的處理單元(稱為神經元),通過廣泛的互相連接而形成的復雜網絡系統。神經網絡具有學習能力,可以根據電氣設備的正常歷史數據訓練,將訓練結果信息與當前測量數據進行比較,以確定故障。同時它具有濾除噪聲的能力,這使其能在噪聲環境中有效地在線監測及診斷。其具有的分辯故障原因及類型的能力,為未來實現故障智能診斷奠定了基礎。本文介紹神經網絡結構及其學習算法,提出一種基于BP網絡的電氣設備故障診斷方法,通過網絡訓練及結果測試表明,該方法具有良好的故障診斷能力。[JP]
1 BP神經網絡模型
神經網絡有很多模型,例如BP網絡、Kohonen,Hopfield及ART等。其中,反向傳播網絡(Back[CD*2]Propagation Network)在神經網絡的實際應用中有著十分重要的影響,工程應用中的絕大多數網絡模型都采用BP模型或其變形,可以說BP模型體現了神經網絡中的精華。
1.1 BP神經網絡模型
以三層前向BP網絡為例,對神經網絡結構進行分析,其組成包括輸入層、隱含層和輸出層。如圖1所示,圖中圓圈表示神經元,Wir表示輸入層第i個神經元與隱含層第r個神經元的連接權值;Vrj表示隱含層第r個神經元與輸出層第j個神經元的連接權值;其間的連線表示神經元之間的相互作用強度。И
從圖1的結構中可以得到,隱含層節點的輸出函數和輸出層節點的輸出函數分別為:
式中:Tr和θr分別為隱含層和輸出層的單元閾值。在本文設計的BP神經網絡結構中,式(1)中的f(•)采用sigmoid函數,即f(x)=(1+e-x)-1。И
1.2 BP學習算法
BP模型的成功得益于BP算法的應用,即誤差反向傳播算法。BP算法屬于梯度下降算法,是一種監督式的學習算法。用網絡的實際輸出與目標矢量之間的誤差來修正網絡權值,使輸出與期望盡可能接近(網絡輸出層的誤差平方和達到最小);通過反復在誤差函數梯度下降方向上調整網絡權值的變化,逐漸逼近目標。每次權值和偏差的變化都與網絡輸出誤差的影響成正比,并以反向傳播的方式傳遞到每一層。BP網絡是由兩部分組成:信息的正向傳遞和誤差的反向傳播。
設神經元的輸入矢量為[WTHX]X[WTBX]=\[x1,x2,…,xn\],其中n是輸入層的神經元數。對應于輸入[WTHX]X的輸出矢量是Y[WTBX]=\[y1,y2,…,ym\],其中m 是輸出層的神經元數。如果要求網絡的期望輸出是[WTHX]T[WTBX]=\[t1,t2,…,tm\],г蛭蟛詈數可以定義為:
BP算法采用梯度下降法來調整網絡的權值,以使上述誤差函數減小,即:
Иw(n+1)=w(n)-η(E/w)[JY](3)И
式中:常數Е鞘僑ㄖ檔髡速率,通常取值0.01≤η≤1。權值WУ牡髡方法采用以下公式:
式中:ИΔwpq表示某層第p個節點到下一層第q個節點的權值修正量;xp表示節點p的輸出;δq表示節點qУ畝說愕燃畚蟛,由輸出層的等效誤差反傳而來:
式中:對應BP模型網絡結構(見圖1);節點q位于輸出層;節點h位于隱層。
2 電氣設備故障檢測實例
在電氣設備中發動機是故障率比較高的設備之一,其在故障診斷中比較具有代表性。在此,以發動機為例,分析BP神經網絡在電氣設備故障診斷過程中的一般模式及步驟。
2.1 網絡樣本選取及參數選擇
分析發動機的常見故障模式,首先選擇具有代表性的故障作為特征向量,取[WTHX]X[WTBX]=[x1,x2,x3,x4]作為神經網絡的輸入。其中:x1代表功率不足故障;x2代表聲音異常故障;x3代表排氣溫度高故障;x4代表消耗量過大故障。通過分析故障原因,取[WTHX]Y[WTBX]=[y1,y2,y3,y4,y5]作為目標輸出向量。其中:y1代表點火不正確;y2代表高壓線圈損壞;y3代表出現燃爆現象;y4代表進氣排氣管故障;y5代表增壓積炭過多故障。表1給出了輸入故障現象[WTHX]X和輸出原因分析Y[WTBX]е間的對應關系。
由此可知,在設計基于三層BP神經網絡的發動機故障診斷系統中,輸入層神經元節點數N=4,輸出層神經元節點數M=5。由公式h=(N+M)+σ可得隱含層神經元節點數h取3~6之間的數。И
2.2 訓練及測試
通過輸入樣本組對所設計的網絡進行訓練,選擇訓練誤差為10-6。例如,輸入樣本[WTHX]X[WTBX]=[0,0,1,0],調整網絡狀態,使其輸出接近目標[WTHX]Y[WTBX]=[1,0,0,1,0],即當發生排氣溫度過高故障時,可能原因是點火不正確以及進氣排氣管問題。訓練網絡的過程,實際上就是調整網絡參數的過程,具體來說,最主要的就是確定各個網絡權值。最終訓練好的網絡在測試過程中,能較為準確地診斷出故障問題的原因。在工程使用過程中,選擇故障檢測過程中各種儀器測量出來、有代表意義的測量數據,根據先驗知識及專家分析,組成輸入樣本和目標向量組,對設計的網絡結構訓練。在訓練過程中,可增加輸入樣本的數量。因為通過大量樣本訓練,神經網絡能具有更好的適應性和魯棒性,其故障診斷的準確性有所提高。采用C++builder及Matlab混合編程,前者負責做界面系統的開發,后者集中在神經網絡算法的設計上,據此進一步提高本工作的實際應用能力。
關鍵詞:刀具振動;MATLAB;BP神經網絡;RBF神經網絡
中圖分類號:TP311文獻標識碼:A文章編號:1009-3044(2012)04-0939-03
Research on Cutter Vibration Trend Forecast based on Neural Network
NIU Yu-sheng
(School of Mechanical Engineering&Automatization,North University of China,Taiyuan 030051, China)
Abstract: In the machine processing, cutter vibration usually have a negative effect on the workpiece. Therefore, the research on the trend of cutter vibration is particularly important. The forecast for vibration signals is consider as time -series forecasting. So The BP and RBF neural network were adopted to establish nonlinear models for predicting a time series. The results show that the RBF neural network has higher accuracy.
Key words: cutter vibration; MATLAB; BP neural network; RBF neural network
在機床加工中,刀具的振動會給工件及刀具本身帶來不小的負面影響[1]。若在加工過程中產生了振動現象,則會使刀具與工件間產生相對位移,在加工零件表面會產生振痕,導致零件的表面質量以及性能受到影響,尤其是在貴重零件的加工中,會帶來難以衡量的損失;其次,振動本身對刀具及刀架系統也會帶來磨損。因此,對刀具的振動信號進行預測就有不小的意義。刀具的振動信號以振幅來測量,可以看作是對時間序列的預測。由于人工神經網絡的具有高度的非線性映射能力和自適應能力等優點,使其在時間序列預測中得到廣泛的關注,此處,分別采用BP神經網絡和RBF神經網絡對振動信號進行預測。
1刀具振動信號采集
采用手持式測振儀(CZ9500A測振儀),將儀表探頭對準被測刀具的刀架上面,則加速度傳感器信號經濾波放大得到加速度信號,然后經一級積分得到速度信號,此信號再經一級積分便得到位移信號,這三種信號經測量選擇開關選擇出一種信號,進行交直流轉換和A/D轉換,最后送三位半液晶屏顯示。只選位移信號,測得數據如下圖1。
圖1刀具振動信號
由圖可看出刀具振動位移沒有什么規律,大部分振幅位于0.07-0.23*10-4米之間,且其中有幾個峰值過大,在預測時會帶來不小困難。
2 BP及RBF神經網絡的設計
人工神經網絡(Artificial Neural Networks, ANNs),也常稱為神經網絡(NNs),是模擬生物神經網絡進行信息處理的一種數學模型[2]。根據解決時間序列預測需要,故采用BP和RBF神經網絡。BP網絡是一種多層前饋型神經網絡,可以實現從輸入到輸出的任意非線性映射[3]。RBF網絡能以任意精度逼近任意連續函數[4]。網絡的設計及運行是在MATLAB語言中完成的。
2.1訓練及測試樣本集設計
在MATLAB中,刀具振動的時間序列信號data是1行42列的矩陣。為了能夠實現多步預測,需對時間序列做下變換。將時間序列步長設為p,運行MATLAB程序如下:
sampleXin=sampleYuan(data, p) data=data(:);
sampleXin=zeros(p+1, 42-p); for j=1:42-p
sampleXin(:,j)=data(j:j+p);
end
則時間序列data將由1行42列轉化為p+1行,42-p列的樣本集,如圖2示。
圖中4個部分Ptrain為訓練輸入向量,Ttrain是訓練目標向量,Ptest是測試輸入向量,Ttest是測試目標向量。樣本集得到后,設定比例ratio=0.8,規定訓練樣本集和測試樣本集比例為4:1.
2.2訓練測試
2.2.1對于BP網絡
輸入層有p個神經元,輸出層有1個元,BP網絡隱含層h則不確定,需要訓練取最佳值。網絡隱含層神經元變換函數采用logsig型函數,輸出層采用logsig型函數。網絡訓練函數采用trainlm。
經反復取p,h訓練得當p=5,h=6時,效果比較好。見圖3。
圖3 BP神經網絡的結果比較圖
2.2.2對于RBF網絡
輸入層有p個神經元,輸出層有1個神經元,隱含層不需要確定。用newrb()創建RBF網絡,反復訓練,當SPREAD=0.02 , p=6時效果最好。如圖4。
3結果比較
兩種網絡的預測結果如表1所示。
由表1可見,RBF神經網絡的預測精度明顯好于BP神經網絡,預測誤差較小,能夠滿足要求。同時,RBF神經網絡的訓練時間,次數也要短于和少于BP神經網絡。
4結束語
在預測刀具振動趨勢時,RBF網絡從訓練時間,次數以及預測效果上比BP網絡效果要好,并且網絡穩定。對于刀具的振動趨勢研究,具有一定的指導意義。
參考文獻:
[1]藍宗和.小議數控車削加工中刀具振動問題[J].廣東科技,2009.6(214):94-96 .
[2]周志華,曹存根.神經網絡及其應用[M].北京:清華大學出版社,2004.
1小波神經網絡學習算法
小波神經網絡的網絡結構和基本的BP神經網絡類似,一般采用輸入層、隱含層和輸出層三部分。小波神經網絡隱含層的轉移函數采用小波函數,但小波函數的選取目前還未有統一的理論。Szu構造的Morlet小波函數。
2工程應用
2.1工程概況北京地鐵6號線東延部分東部新城站至東小營站區間工程位于北京市通州區,起點為東部新城站,終點為東小營站。該區間由東部新城站向東,沿運河東大街北側設置,沿線穿越綠地、宋郎路路口,到達東小營站,其中在宋郎路路口和運河東大街東南有多處雨水、電力和電信管線。區間穿越的地層主要有粉細砂層、局部夾粉質粘土層、中粗砂層。工程采用直徑為6m的土壓平衡盾構機進行施工。
2.2網絡設計和數據采集小波神經網絡的結構設計對預測結果影響較大,應充分考慮與施工相關的各種因素,如地表沉降的成因、工程地質條件和施工工藝參數等。盾構施工引起的地表沉降易受到以下因素影響:盾構施工區間的水文地質條件對沉降量的影響較大;當盾構機由于某種原因停止推進時,千斤頂會漏油回縮導致盾構機后退,引起盾前土體壓力減小;盾尾脫空后,管片和土體之間存在空隙,由于注漿不及時,土體填充盾尾空隙引起土體局部塌落;盾殼移動引起土體的摩擦和剪切作用,在該作用力下土體產生變形;盾構改變開挖方向,往往會引起超挖現象,土體受到的擾動隨之加大,引起土體局部變形破壞;開挖面的土體靠土倉壓力來維持,但是在施工過程中,土倉壓力和開挖面壓力并不是出于完全平衡狀態,這種不平衡狀態容易引起土體的坍塌變形。綜合考慮各相關因素,確定在對于地表沉降較為敏感的土體參數和施工參數中選取覆土厚度(H)、壓縮模量(Es)、粘聚力(c)、天然密度(ρ)、內摩擦角(Ф)、千斤頂推力(F)和注漿壓力(P)共7個參數作為神經網絡的輸入參數。小波神經網絡的隱層節點數選擇目前還沒有成熟的理論依據,可參考BP神經網絡的隱層節點選取,通過經驗和實驗分析以輸入節點的2~4倍綜合確定,最終選擇為13。小波神經網絡預測模型的網絡結構為7-13-1。盾構施工引起的短期地表沉降對地表建筑和地下管線影響最大,且該施工區段地層變化較小,掘進速度基本不變,故可以選取盾構機通過該點50m后的穩定沉降數據。在施工單位提供的相關測量數據和地質資料中選取了51組數據,將其中36組作為訓練數據,如表1所示。選擇15組作為測試數據,如表2所示。
2.3地表沉降預測與分析根據選取的36組數據和已經確定的7-13-1的網絡結構,分別建立小波神經網絡和BP神經網絡的預測模型。設定訓練目標為0.001,BP神經網絡的初始權值、閾值和小波神經網絡的伸縮參數、平移參數分別在[-1,1]之間隨機賦值。得到訓練結果如圖1所示。結果顯示,經過1050次訓練后小波神經網絡的訓練誤差可以達到訓練目標,而BP神經網絡需要8500次訓練才能達到訓練目標。小波神經網絡的訓練速度相比于BP神經網絡有較大優勢。對于已經訓練好的兩種模型,使用相同的測試樣本進行預測分析,得到的預測結果如圖2所示,預測結果和實際測量值的誤差如表3所示。可以看出,BP神經網絡和小波神經網絡的最小、最大誤差分別為3.1%、27.3%,2.8%、14.5%,故小波神經網絡的預測精度要好于BP神經網絡,且預測結果均在工程允許范圍內,可以依據此預測結果對現場施工控制參數的制定提供科學的指導。
3結論
盾構施工引起的地表沉降對施工安全影響較大,對其進行有效地預測,并以此作為依據對施工參數進行優化,可達到降低施工風險的目的,對于提高施工效率、確保施工質量、增加經濟效益意義重大。本文選用小波神經網絡模型對盾構施工地表沉降進行預測,得到以下結論:(1)小波神經網絡的訓練速度較傳統BP神經網絡有較大優勢。(2)結合北京地鐵六號線實地數據驗證了小波神經網絡用于盾構施工地表沉降預測的可行性。(3)小波神經網絡的初始權值、伸縮參數和平移參數的選取還沒有成熟的理論依據,如果參數選取不合適可能使小波神經網絡陷入局部極小的情況,因此對于小波神經網絡參數的優化選取還有待深入研究。
作者:季雁鵬郝如江寧士亮單位:石家莊鐵道大學機械工程學院中國鐵建中鐵二十二局集團第一工程有限公司