Geri Dön

A software tool for designing adaptive control systems based on reinforcement learning

Pekiştirmeli öğrenmeye dayalı denetlenebilen düzeneklerin tasarlanabilmesi için bir araç

  1. Tez No: 155161
  2. Yazar: MURAT BİŞİRGEN
  3. Danışmanlar: Y.DOÇ.DR. BORAHAN TÜMER
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2004
  8. Dil: İngilizce
  9. Üniversite: Marmara Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 141

Özet

ÖZET Pekiştirmeli Öğrenmeye Dayalı Denetlenebildi Düzeneklerin Tasarlanabilmesi İçin Bir Araç Pekiştirmeli öğrenmeye dayalı, denetlenebildi düzeneklerin tasarlanabilmesi için, çok az sayıda geliştirilmiş araç vardır ve bu araçlar, belli sorunların çözülmesine yönelik geliştirilmiş özel amaçlı araçlardır([3], [4]). Literatürde genel amaçlı bu tür bir araca rastlanmamıştır. Bu tür düzeneklerin tasanmlanabilmesi ve kullanılabilmesi, birçok ekonomik ve bilimsel sorunların daha hızlı ve daha güvenilir bir şekilde irdelenmesine ve çözülmesine yardımcı olacaktır. Bu tez çalışmasında, bu tür düzeneklerin geliştirilmesi için bir araç geliştirilmiş ve bir uygulama ve örnek çalışmalar ile bu aracın kullanımı sağlanmıştır. Bu aracın amacı; doğrusal olmayan, karmaşık düzeneklerin modellenmesini ve denetlenmesini sağlamak, öğrenen yöntemlerle irdelenmesine ve böylece, bu düzeneklerle ilgili olası sorunlara, daha nitelikli çözümler bulunmasına yardımcı olmaktır. Bu araç, değişken ve sabit yapılı otomatlarla, karmaşık düzeneklerin modellenmeleri ve irdelenmeleri için kullanılabilir. Ayrıca bu tezde iki uygulama ve örnek çalışmalar, araç kullanılarak gerçekleştirilmiştir. Birinci uygulama, çalışanların işlerle ilgili becerilerinin sabit kaldığı ortamdaki iş dağıtımıdır. Bu, iş dağıtımının uygun şekilde yapılmasını ve kişilere uygun işlerin verilmesini sağlayan bir uygulamadır. Bu uygulamadaki bilinen yöntem, iş dağılımını, değişmez sıra ile çalışanlara dağıtma yaklaşımıdır. İkinci uygulama ise bir arabaya, sadece öne veya arkaya hareket edebilecek şekilde bir ucundan bağlanmış bir sopayı, arabayı ileri geri hareket ettirerek dengede tutmayı, düşürmemeyi öğrenmeye çalışan bir uygulamadır. Değişken yapılı otomatların, pekiştirmeli öğrenme ve parametrelerdeki çeşitlilik ile kolayca uyum sağlayabilmesi, bu aracı, doğrusal olmayan düzeneklerde yeterli derecede esnek ve güçlü bir şekilde uygulanabilirliğini sağlar. Bu araçla oluşturulmuş örnek çalışmalar, III.4 bölümünde gösterilmiştir. Şubat, 2004 iv Murat BİŞİRGEN

Özet (Çeviri)

ABSTRACT A Software Tool For Designing Adaptive Control Systems Based On Reinforcement Learning There are a few tools for designing adaptive control systems based on reinforcement learning. They are used to provide solutions to specific problems [3, 4]. Also, there is not a known tool for general use in literature. These tools incorporate powerful adaptive techniques, which help to solve problems of scientific or economic interest. In this study, a tool for designing adaptive control systems based on reinforcement learning is developed and used in an application and in several sample problems showing the details of the tool. The goal of this study is to provide a powerful set of adaptive analysis techniques applicable to a wide range of highly complicated systems displaying nonlinear characteristics. In this tool, variable and fixed structure automata may be used to model and examine the complicated systems. In addition, two applications and several sample problems are implemented on the tool. The first application is the Job Assignment problem. In the first application, in which the abilities of the workers about their jobs are assumed to be stable, is extended to take into account the action and penalty probabilities not considered in the classic method. The second application is pushing the cart either left or right with a force so that the pole, which is hinged on the cart that may move left or right on a horizontal track, remains balance. The adaptability of variable structured automata by reinforcement learning and the diverse set of parameters makes this tool sufficiently flexible and powerful that it may be applicable to a wide range of systems displaying non-linear characteristic. Results of several sample problems by using this tool is shown in Part III.4. February, 2004 v Murat BIŞIRGEN

Benzer Tezler

  1. Web-tabanlı uyarlanır zeki öğretim sistemi tasarımı ve uygulaması

    Designing and application of web-based adaptive intelligent education system

    HAMDİ TOLGA KAHRAMAN

    Doktora

    Türkçe

    Türkçe

    2009

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Elektrik Eğitimi Ana Bilim Dalı

    PROF. DR. İLHAMİ ÇOLAK

  2. ECG signal processing techniques by using asp.net application based on gui in Matlab

    Matlab'da grafik kullanıcı arayüzü bazlı asp.net uygulaması kullanılarak EKG sinyal işleme teknikleri

    HUSSAIN A. JABER ALZIARJAWEY

    Yüksek Lisans

    İngilizce

    İngilizce

    2015

    Elektrik ve Elektronik MühendisliğiYıldırım Beyazıt Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. İLYAS ÇANKAYA

  3. Computational investigation of peptide binding affinity and complex stability of major histocompatibility complex (MHC)

    Major hıstokompatibilite kompleksinin peptit bağlanma afinitesinin ve kompleks stabilitesinin hesaplamalı araştırılması

    ASUMAN BUNSUZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    BiyofizikMarmara Üniversitesi

    Biyomühendislik Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ PEMRA ÖZBEK SARICA

  4. Model tabanlı adaptif LMS hüzmeleme tasarımı ve FPGAüzerinde gerçeklenmesi

    Model-based design and FPGA implementation of adaptive LMS beamforming

    EŞREF TEMEL

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    DOÇ. DR. TUFAN COŞKUN KARALAR