NARMA-L2 controller design for nonlinear systems using online lssvr
Doğrusal olmayan sistemler için çevrimiçi en küçük kareler destek vektör regresyonu ile NARMA-L2 kontrolör tasarımı
- Tez No: 556917
- Danışmanlar: DOÇ. DR. GÜLAY ÖKE GÜNEL
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Elektrik ve Elektronik Mühendisliği, Computer Engineering and Computer Science and Control, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: İngilizce
- Üniversite: İstanbul Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Kontrol ve Otomasyon Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Kontrol ve Otomasyon Mühendisliği Bilim Dalı
- Sayfa Sayısı: 81
Özet
Gerçek dünyada sistemler son derece karmaşık ve doğrusal olmayan dinamiklere sahiptir. Bu karmaşık dinamikler sebebiyle doğrusal olmayan sistemlerin matematiksel olarak modellenmesi oldukça güçtür. Matematiksel modeldeki katsayıların kesin olarak saptanamama problemi vardır. Buna ek olarak sistemler çevredeki bozucu ve gürültülerden de etkilenirler. Tüm bu durumlar göz önüne alındığında doğrusal olmayan sistemlerin çevresel bozuculara ve parametre belirsizliklerine karşı dayanıklı olarak kontrol edilmesi zorlu bir süreçtir. Sabit parametreli kontrolör yapılarının bu değişken durumlu sistemlerin kontrolü için kullanılması pek efektif olmayacaktır. Çünkü her değişen durum için parametrelerinin yeniden ayarlanması gerekmektedir. Uyarlamalı kontrol yöntemleri bu gibi durumlarda daha etkili bir sonuç için tercih edilmesi gereken yöntemlerdir. Uyarlamalı kontrol yöntemleri model tabanlı veya modelden bağımsız olabilirler. Model tabanlı uyarlamalı kontrolörlerde modelin bir veya birkaç sonraki durum bilgisinin de kestirilmesi gerekmektedir. Bu kestirimlerin daha güvenilir bir şekilde yapılması için akıllı metotların kullanımı tercih edilebilir. Yapay sinir ağları (YSA), uyarlamalı sinirsel bulanık çıkarım sistemi (USBÇS) ve destek vektör regresyonu (DVR) yaygın olarak bilinen akıllı metotlardandır. YSA ve USBÇS literatürde sıklıkla ve başarıyla kullanılmış metotlardandır. Ancak bu yöntemlerin bir dezavantajı yerel uç noktalarda takılı kalıp, her zaman genel çözüme ulaşamamalarıdır. Bunun nedeni deneysel risk minimizasyonu ilkesiyle çalışmalarıdır. Bu yöntemlerde geri yayılım algoritması ile öğrenme sağlanır ve konveks olmayan amaç fonksiyonu kullanılır. Tüm bunlar genel çözüme ulaşmayı engelleyebilir. Destek vektör makineleri (DVM) Vapnik tarafından ortaya atılmış oldukça popüler makine öğrenmesi yöntemlerindendir. DVM, istatiksel öğrenme teorisi ve yapısal risk minimizasyonu ilkesi üstüne kurulmuştur. Bu sebeple YSA ve USBÇS'nin dezavantajı olan yerel uç noktalara takılma problemini ortadan kaldırmıştır. Konveks yapıda bir amaç ölçütüne sahip olduğundan genel çözüme ulaşmayı garantilemektedir. DVM, sınıflandırma ve regresyon problemlerinde kolayca uygulanabilir. Çekirdek fonksiyonu kullanılması özelliği sayesinde düşük boyutlu bir uzayda çözülmesi imkansız olan problemler daha yüksek boyutlu uzaylara taşınarak çözüm doğrusal olarak bulunabilir. Sistem tanıma problemleri regresyon problemi olarak düşünülebildiğinden, DVR sistem tanımada da kolaylıkla kullanılabilir. En çok bilinen DVR çeşitlerinden biri ε-DVR'dir. Bir fonksiyon kestirme problemi üzerinden düşünürsek ε-DVR'de amaç belli bir ε kadar hatayı aşmayacak şekilde fonksiyonun alacağı değeri tahmin etmeye çalışmaktır. Eğer ε kadar hata aşılırsa bu durum ne kadar aşıldığıyla orantılı olarak cezalandırılır, böylelikle en uygun ve genel çözüm bulunmuş olur. ε-DVR ile elde edilen problem karesel programlama problemidir. Suykens tarafından önerilmiş olan en küçük kareler destek vektör regresyonu (EKDVR), ε-DVR'nin geliştirilmiş bir versiyonu olan diğer bir SVR çeşididir. EKDVR'de hata terimi en küçük karelerle belirtilmiştir ve kısıt fonksiyonunda eşitsizlik yerine eşitlik kullanılmıştır. Bu yöntemin en önemli özelliği genel çözümü karesel programlama problemi çözümü yerine doğrusal denklemler kümesinin çözümüne çevirmesidir. Böylelikle ε-SVR'nin sahip olduğu hesaplama yükü azalmıştır. Ayrıca EKDVR kolayca çevrimiçi çalışacak şekilde düzenlenip kontrol sistemlerinde uygulanabilir. Model tabanlı kontrolörlerde diğer bir önemli konu sistemlerin basit modellerle ifade edilmesidir. Bu sayede kontrolör tasarımı kolaylaşacaktır. Türkçe'de doğrusal olmayan otoregresif hareketli ortalamalar modeli olarak ifade edilebilecek olan NARMA modeli sistem tanımada sık sık kullanılan zaman serisi kestirme yöntemlerinden biridir. Bilindiği üzere, belli şartlar altında denge noktasına yakın durumlarda NARMA modeli doğrusal olmayan sistemlerin giriş-çıkış ifadesini kesin olarak sağlamaktadır. Ancak kontrol işareti bu modele doğrusal olmayan bir şekilde bağımlıdır. Bu sebeple kontrol işaretini buradan elde etmek oldukça zordur. Narendra ve Mukhopadhyay bu zorluğu aşmak için NARMA-L2 modelini önermişlerdir. Bu modelde kontrol işareti sistem denklemlerinde doğrusal bir biçimde yer almaktadır. NARMA-L2 modeli iki alt fonksiyondan oluşmaktadır. Kontrol işareti bu modelin yeniden düzenlenmesiyle bulunmaktadır. Modelde sistem çıkışı yerine sistemin takip etmesi istenen referans bilgisi konularak gereken kontrol işareti yaklaşık olarak hesaplanır. Birçok avantajının yanında NARMA-L2 kontrolörün en büyük dezavantajı salınımlı kontrol işaretleri üretmesidir. Ancak bu da doğrusal bir geri beslemeyle ve filtreyle giderilebilmektedir. Bu yüksek lisans tezinde ilk olarak çevrimiçi EKDVR tabanlı NARMA-L2 kontrolörü tasarlanmıştır. Bu kontrol metodu daha önce Uçak ve Günel tarafından tek giriş tek çıkış sistemler için çevrimiçi ε-DVR kullanılarak tasarlanmıştır. Bu tezde bu yöntem iki giriş iki çıkış sistemlerde uygulanmak üzere geliştirilmiştir ve farklı bir yaklaşım olarak çevrimiçi EKDVR kullanılmıştır. NARMA-L2 kontrolörünün salınımının giderilmesi için de yine filtreye ek olarak doğrusal geri besleme yöntemi kullanılmıştır. Bu kontrolör tasarlanırken ilk olarak iki girişli ve iki çıkışlı bir sistemin iki çıkışı için de NARX modeli oluşturulmuştur. Bu model oluşturulurken çevrimiçi EKDVR kullanılmıştır. O anki mevcut giriş çıkış verisi kullanılarak sistem çıkışları kestirilmiştir. Daha sonra bu NARX modellerindeki sistem dinamiklerinin bilgisi NARMA-L2 alt modellerine ayrıştırılmıştır. Bu ayrıştırma sürecinde NARX modeller ve NARMA-L2 alt modeller arasında bir ilişkinin olduğu varsayılmıştır ve bu ilişki uyarlanabilir parametrelerle ifade edilmiştir. İki girişli iki çıkışlı bir sistem ele alındığı için sekiz tane parametreye ihtiyaç duyulmuştur. Bu uyarlanabilir parametreler, NARX ve NARMA-L2 alt modellerinin içindeki EKDVR parametrelerinin arasında bir ilişki kurar ve bu ilişki sayesinde sistem NARMA-L2 modeli bulunur. Uyarlanabilir parametreler her iterasyonda Levenberg Marquard Algoritmasıyla optimize edilir. Sistem çıkışlarının NARMA-L2 modellerinin eldesinden sonra NARMA-L2 kontrolörünün hesaplanması artık oldukça basittir. Geliştirilen bu kontrol metodu iki giriş iki çıkışlı bir üç tanklı sıvı seviye kontrol sistemine uygulanmıştır. Sisteme referans olarak basamak ve sinüzoidal girişler verilmiştir. Simülasyon sonuçlarında sistemin bu referansları başarılı bir şekilde takip ettiği görülmüştür. Sistemin dayanıklılığını test etmek için sisteme Gauss tabanlı ölçüm gürültüsü eklenmiştir ve sistemin referansı takip etmeye devam ettiği görülmüştür. Ayrıca sistem parametrelerinden biri belirsiz yapılarak sistemin belirsizliğe karşı tepkisi ölçülmüştür. Model tabanlı kontrolörlerden bir diğeri ise ters dinamik kontrolü veya diğer bir deyişle hesaplamalı tork kontrolüdür. Bu yöntemde de yine model dinamiklerinin kesin olarak bilinmesi önem taşımaktadır. Daha önce de bahsedildiği gibi, akıllı algoritmaların bu problem için kullanılması hemen akla gelmektedir. Literatürde yapay sinir ağları tabanlı hesaplamalı tork kontrolörlerine sıklıkla rastlanmaktadır. Ancak daha önce de bahsedildiği gibi sinir ağlarının yerel uç noktalara takılma problemi vardır. Daha çok robot manipülatörlerine uygulanan bu yöntemde, sistemin genel bir çözüme ulaşamaması büyük sıkıntılara yol açabilir. Bu nedenle burada da yine genelleştirme başarısı göz önüne alınarak DVR'nin kullanılması tercih edilecektir. İkinci olarak bu tezde çevrimiçi EKDVR tabanlı NARMA-L2 kontrolörü kullanılarak çevrimiçi hesaplamalı tork kontrolörü tasarlanmıştır. Abdessemed'in tasarladığı çevrimdışı DVR tabanlı hesaplamalı tork kontrolü metodu bu tezde çevrimiçi hale getirilmiştir. Bu metotta birincil ve ikincil olmak üzere iki tane kontrolör kullanılmıştır. Birincil kontrolör sistemin ters dinamiklerinden oluşan kontrolördür. Bunu yaparken öncelikle robotun ters dinamikleri NARMA-L2 model ile ifade edilmiştir. Daha sonra ilk anlatılan metotta olduğu gibi birincil kontrol işareti NARMA-L2 kontrolör kullanılarak hesaplanmıştır. İkincil kontrolör olarak oransal–türevsel (PD) kontrolör tasarlanmıştır. Bu kontrolörle birinci kontrolörle giderilemeyen model ve bozucu hatalarının giderilmesi amaçlanmıştır. Tasarlanan bu kontrol yapısı iki serbestlik dereceli doğrudan tahrikli bir robot koluna uygulanmıştır. Sistemin performansı sinüs biçimli referansla test edilmiştir. Sonuçlar sistemin yörünge takibini başarılı bir şekilde yerine getirdiğini göstermiştir.
Özet (Çeviri)
Mathematical modelling of the nonlinear systems is very challenging due to their complexity. Unknown parameters, changing conditions, environmental disturbances and noise make it almost impossible to model a nonlinear system precisely. Without a precise model, designing a controller is also difficult. In order to deal with this problem, adaptive control methods have been suggested. Adaptive control methods can be model free or model based. For the model based adaptive controllers, estimation of the model is very crucial to achieve a successful result. At this point, the utilization of the intelligent methods has been commonly considered. Three of these intelligent methods are artificial neural networks (ANN), adaptive neural-fuzzy inference systems (ANFIS) and support vector regression (SVR). In the literature, ANN and ANFIS have been popularly used for years. However, they are based on empirical risk minimization. As they learn with backpropagation algorithm and have nonconvex cost function, they have a problem of getting stuck at local extremum. Contrarily, SVR proposed by Vapnik, is based on structural risk minimization. Due to its convex cost function, it assures the global convergence. Support vectors can solve both classification and regression problems. For the regression problems, ε-SVR and LSSVR can be used. While estimating a function, ε-SVR ignores the errors as long as they are smaller than ε. If the error is larger than ε, it is punished. To solve an ε-SVR problem, it is needed to solve a quadratic programming problem. In LSSVR proposed by Suykens, squared error term is used and the constraints become equality constraints. To reach the global solution of LSSVR, it is required to solve a set of linear equations. Therefore, LSSVR is faster in terms of computation speed. LSSVR can also be reconstructed easily in the form of an online algorithm. Hence, it can be very useful for online system identification based methods. Another important issue in model based controllers is representing systems as simple models. In that way, design of a controller becomes easier. As a known fact, nonlinear autoregressive moving average (NARMA) model of nonlinear systems provide the accurate representation of the input-output data in the neighbourhood of the equilibrium state. However, computing the control signal from the NARMA model is very demanding as the control input depends on the model nonlinearly. To deal with this issue, Narendra and Mukhopadhyay proposed a model called as NARMA-L2 model where the control term is detached from the nonlinearities in the model. This model includes two nonlinear functions. By substituting the reference value instead of system output in the model, the control input can be computed easily as a ratio of two time functions. Besides its several advantages, one of the biggest disadvantage of NARMA-L2 controller is the oscillatory control input. To overcome this problem, it has been suggested to add a linear feedback and filter. In this thesis, a NARMA-L2 controller has been designed by using online LSSVR for two input two output (TITO) nonlinear systems. This method has been previously utilised by Uçak and Günel for single input single output (SISO) nonlinear systems. Here, the method is extended to TITO nonlinear systems and online LSSVR has been used instead of online ε-SVR. In this method, first of all, NARX models for both of the outputs of a TITO system are obtained by using online LSSVR. These models are achieved via current input-output data. Then, attained models are decomposed into NARMA-L2 submodels. The decomposition process is fulfilled by using adaptive parameters. These adaptive parameters are exploited to constitute a relation between LSSVR parameters of NARX models and NARMA-L2 submodels. Since there are two inputs and two outputs, eight parameters are required to accomplish the task. In every iteration, these eight parameters are optimised via Levenberg Marquard Algorithm. After acquiring NARMA-L2 submodels, it becomes straightforward to compute required control intputs for the next time step. The proposed control technique has been implemented to a three tank system. To get rid of the chattering in control signals, a linear feedback and a filter have been added. For the simulations, an asynchronous staircase reference and a sinusoidal reference have been applied to the system. The results show the success of the controller. Additionally, the robustness of the system has also been approved by adding a Gaussian measurement noise and by implementing uncertainty to a system parameter. Secondly, in this thesis an online computed torque control has been designed by using the previously explained online LSSVR based NARMA-L2 controller. Previously, an offline computed torque control based on SVR was designed by Abdessemed. In computed torque control, the designed controller comprises two parts. The primary control is the inverse controller and the secondary controller is proportional- derivative (PD) controller. In this thesis, primary controller has been designed by adopting online LSSVR based NARMA-L2 controller. Firstly, the inverse model of the robot manipulator is considered as the NARMA-L2 model. Then, it is obtained via the formerly defined technique. Accordingly, the NARMA-L2 controller which is the primary controller in this case, is directly calculated. The secondary controller is again a PD controller. The proposed controller has been tested on a 2-degree of freedom (2-DOF) robot arm. Distinct sinusoidal reference trajectories are applied to the system. The simulations demonstrate that the system provides a good trajectory tracking performance.
Benzer Tezler
- Adaptive inverse optimal controller design for non-affine nonlinear systems using machine learning techniques
makine öğrenmesi teknikleri kullanarak doğrusal ve afin olmayan sistemler için adaptif ters optimal kontrolör tasarımı
MUHAMMET EMRE SANCI
Doktora
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiMekatronik Mühendisliği Ana Bilim Dalı
PROF. DR. GÜLAY ÖKE GÜNEL
- Support vector regression based controller design methods for nonlinear systems
Lineer olmayan sistemler için destek vektör regresyon tabanlı kontrolör tasarım metodları
KEMAL UÇAK
Doktora
İngilizce
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiKontrol ve Otomasyon Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. GÜLAY ÖKE GÜNEL
- Tip 1 diyabet için doğrusal olmayan model öngormeli kontrol
Nonlinear model predictive control for Type 1 diabetes
EDA SEMIZER
Yüksek Lisans
Türkçe
2009
BiyomühendislikAnkara ÜniversitesiKimya Mühendisliği Ana Bilim Dalı
PROF. DR. RIDVAN BERBER
- Atık su arıtım tesislerinin model öngörmeli kontrolü
Model predictive control of wastewater treatment plants
EVRİM AKYÜREK
Yüksek Lisans
Türkçe
2009
Kimya MühendisliğiAnkara ÜniversitesiKimya Mühendisliği Ana Bilim Dalı
PROF. DR. RIDVAN BERBER
- Tepkimeli bir damıtma kolonunun dolaylı kontrolü
Inferential control of the reactive distillation column
ESRA ÖNDER YILDIRIM
Yüksek Lisans
Türkçe
2020
Kimya MühendisliğiAnkara ÜniversitesiKimya Mühendisliği Ana Bilim Dalı
PROF. DR. SÜLEYMAN KARACAN