A software tool for designing adaptive control systems based on reinforcement learning

Pekiştirmeli öğrenmeye dayalı denetlenebilen düzeneklerin tasarlanabilmesi için bir araç

Tez No: 155161
Yazar: MURAT BİŞİRGEN
Danışmanlar: Y.DOÇ.DR. BORAHAN TÜMER
Tez Türü: Yüksek Lisans
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2004
Dil: İngilizce
Üniversite: Marmara Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 141

Özet

ÖZET Pekiştirmeli Öğrenmeye Dayalı Denetlenebildi Düzeneklerin Tasarlanabilmesi İçin Bir Araç Pekiştirmeli öğrenmeye dayalı, denetlenebildi düzeneklerin tasarlanabilmesi için, çok az sayıda geliştirilmiş araç vardır ve bu araçlar, belli sorunların çözülmesine yönelik geliştirilmiş özel amaçlı araçlardır([3], [4]). Literatürde genel amaçlı bu tür bir araca rastlanmamıştır. Bu tür düzeneklerin tasanmlanabilmesi ve kullanılabilmesi, birçok ekonomik ve bilimsel sorunların daha hızlı ve daha güvenilir bir şekilde irdelenmesine ve çözülmesine yardımcı olacaktır. Bu tez çalışmasında, bu tür düzeneklerin geliştirilmesi için bir araç geliştirilmiş ve bir uygulama ve örnek çalışmalar ile bu aracın kullanımı sağlanmıştır. Bu aracın amacı; doğrusal olmayan, karmaşık düzeneklerin modellenmesini ve denetlenmesini sağlamak, öğrenen yöntemlerle irdelenmesine ve böylece, bu düzeneklerle ilgili olası sorunlara, daha nitelikli çözümler bulunmasına yardımcı olmaktır. Bu araç, değişken ve sabit yapılı otomatlarla, karmaşık düzeneklerin modellenmeleri ve irdelenmeleri için kullanılabilir. Ayrıca bu tezde iki uygulama ve örnek çalışmalar, araç kullanılarak gerçekleştirilmiştir. Birinci uygulama, çalışanların işlerle ilgili becerilerinin sabit kaldığı ortamdaki iş dağıtımıdır. Bu, iş dağıtımının uygun şekilde yapılmasını ve kişilere uygun işlerin verilmesini sağlayan bir uygulamadır. Bu uygulamadaki bilinen yöntem, iş dağılımını, değişmez sıra ile çalışanlara dağıtma yaklaşımıdır. İkinci uygulama ise bir arabaya, sadece öne veya arkaya hareket edebilecek şekilde bir ucundan bağlanmış bir sopayı, arabayı ileri geri hareket ettirerek dengede tutmayı, düşürmemeyi öğrenmeye çalışan bir uygulamadır. Değişken yapılı otomatların, pekiştirmeli öğrenme ve parametrelerdeki çeşitlilik ile kolayca uyum sağlayabilmesi, bu aracı, doğrusal olmayan düzeneklerde yeterli derecede esnek ve güçlü bir şekilde uygulanabilirliğini sağlar. Bu araçla oluşturulmuş örnek çalışmalar, III.4 bölümünde gösterilmiştir. Şubat, 2004 iv Murat BİŞİRGEN

Özet (Çeviri)

ABSTRACT A Software Tool For Designing Adaptive Control Systems Based On Reinforcement Learning There are a few tools for designing adaptive control systems based on reinforcement learning. They are used to provide solutions to specific problems [3, 4]. Also, there is not a known tool for general use in literature. These tools incorporate powerful adaptive techniques, which help to solve problems of scientific or economic interest. In this study, a tool for designing adaptive control systems based on reinforcement learning is developed and used in an application and in several sample problems showing the details of the tool. The goal of this study is to provide a powerful set of adaptive analysis techniques applicable to a wide range of highly complicated systems displaying nonlinear characteristics. In this tool, variable and fixed structure automata may be used to model and examine the complicated systems. In addition, two applications and several sample problems are implemented on the tool. The first application is the Job Assignment problem. In the first application, in which the abilities of the workers about their jobs are assumed to be stable, is extended to take into account the action and penalty probabilities not considered in the classic method. The second application is pushing the cart either left or right with a force so that the pole, which is hinged on the cart that may move left or right on a horizontal track, remains balance. The adaptability of variable structured automata by reinforcement learning and the diverse set of parameters makes this tool sufficiently flexible and powerful that it may be applicable to a wide range of systems displaying non-linear characteristic. Results of several sample problems by using this tool is shown in Part III.4. February, 2004 v Murat BIŞIRGEN

Benzer Tezler

Tez No
268176
Web-tabanlı uyarlanır zeki öğretim sistemi tasarımı ve uygulaması
Designing and application of web-based adaptive intelligent education system
HAMDİ TOLGA KAHRAMAN
Doktora
Türkçe
2009
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Gazi Üniversitesi
Elektrik Eğitimi Ana Bilim Dalı
PROF. DR. İLHAMİ ÇOLAK
Tez No
405774
ECG signal processing techniques by using asp.net application based on gui in Matlab
Matlab'da grafik kullanıcı arayüzü bazlı asp.net uygulaması kullanılarak EKG sinyal işleme teknikleri
HUSSAIN A. JABER ALZIARJAWEY
Yüksek Lisans
İngilizce
2015
Elektrik ve Elektronik Mühendisliği Yıldırım Beyazıt Üniversitesi
Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. İLYAS ÇANKAYA
Tez No
526611
Computational investigation of peptide binding affinity and complex stability of major histocompatibility complex (MHC)
Major hıstokompatibilite kompleksinin peptit bağlanma afinitesinin ve kompleks stabilitesinin hesaplamalı araştırılması
ASUMAN BUNSUZ
Yüksek Lisans
İngilizce
2018
Biyofizik Marmara Üniversitesi
Biyomühendislik Ana Bilim Dalı
DR. ÖĞR. ÜYESİ PEMRA ÖZBEK SARICA
Tez No
741111
Model tabanlı adaptif LMS hüzmeleme tasarımı ve FPGAüzerinde gerçeklenmesi
Model-based design and FPGA implementation of adaptive LMS beamforming
EŞREF TEMEL
Yüksek Lisans
Türkçe
2022
Elektrik ve Elektronik Mühendisliği İstanbul Teknik Üniversitesi
Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
DOÇ. DR. TUFAN COŞKUN KARALAR
Tez No
400117
A compilation tool for automated mapping of algorithms onto FPGA custom computing machines
Başlık çevirisi yok
İBRAHİM ŞAHİN
Doktora
İngilizce
2002
Elektrik ve Elektronik Mühendisliği North Carolina State University
DR. CLAY S. GLOSTER
DR. WİNSER E. ALEXANDER

Geri Dön