Improving reinforcement learning using distinctive clues of the environment
Çevreden gelen belirgin ipuçlarını kullanarak pekiştirmeli öğrenmeyi geliştirme
- Tez No: 603471
- Danışmanlar: PROF. DR. FARUK POLAT, DR. ERKİN ÇİLDEN
- Tez Türü: Doktora
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 140
Özet
Etkili ayrıştırma ve soyutlamanın Pekiştirmeli Öğrenme performansını arttırdığı birçok çalışmada gösterilmiştir. Bir etmen, çevrenin ipuçlarını ya sorunu alt sorunlara bölmek ya da verilen bir görevdeki ilerleyişi hakkında bilgilenmek için kullanabilir. Tamamen gözlenebilir bir ortamda bu tür ipuçları, alt hedeflerden gelebilirken, kısmen gözlenebilir bir ortamda ender gözlenen tecrübeler ile sağlanabilir. Bu tezde iki aşamalı bir katkı sunulmuştur; tamamen gözlemlenebilir ortamlarda otomatik alt hedef tanımlama ve seçenek oluşturma konusunda iyileştirmeler önerilirken, otomatik olarak bir yer işareti tanımlaması ve kısmen gözlenebilir ortamlardaki destek noktalarına dayanan bir yönlendirme mekanizması da tanıtılmıştır. Ayrıca, her iki model türü için de tez, birkaç ölçüt problemdeki temel öğrenme algoritmalarından daha iyi performans gösteren genel bir çerçeve önermektedir.
Özet (Çeviri)
Effective decomposition and abstraction has been shown to improve the performance of Reinforcement Learning. An agent can use the clues from the environment to either partition the problem into sub-problems or get informed about its progress in a given task. In a fully observable environment such clues may come from subgoals while in a partially observable environment they may be provided by unique experiences. The contribution of this thesis is two fold; first improvements over automatic subgoal identification and option generation in fully observable environments is proposed, then an automatic landmark identification and an anchor based guiding mechanism in partially observable environments is introduced. Moreover, for both type of problems, the thesis proposes an overall framework that is shown to outperform baseline learning algorithms on several benchmark domains.
Benzer Tezler
- Zeki etmenlerde öğrenme kabiliyetinin geliştirilmesi ve dinamik bir atölye tipi çizelgeleme uygulaması
Başlık çevirisi yok
MEHMET EMİN AYDIN
Doktora
Türkçe
1997
Endüstri ve Endüstri MühendisliğiSakarya ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ.DR. ERCAN ÖZTEMEL
- Model reference adaptive controller design with augmented error method for lane tracking
Serit takibi kontrolü için artıtılmış hata yöntemi ile model referans uyarlanabilir kontrolör tasarımı
MEHMET NURİ DİYİCİ
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiMekatronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. YAPRAK YALÇIN
- Improving sample efficiency in reinforcement learning control using autoencoders
Pekiştirmeli öğrenme kontrolde otokodlayıcılar ile örnekleme verimliliğini arttırma
BURAK ER
Yüksek Lisans
İngilizce
2023
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiKontrol ve Otomasyon Mühendisliği Ana Bilim Dalı
PROF. DR. MUSTAFA DOĞAN
- Anomaly detection using machine learning techniques: A comparative study on first payment default prediction in retail loans
Yapay öğrenme yöntemleriyle anomali saptanması: Bireysel kredilerde ilk ödemede batma tahmini üzerine karşılaştırmalı bir çalışma
AHMET TALHA YİĞİT
Yüksek Lisans
İngilizce
2022
Bankacılıkİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. ALP ÜSTÜNDAĞ
- Kablosuz algılayıcı ağlarda makine öğrenmeye dayalı enerji verimliliği ve güvenlik teknikleri
Machine learning based energy efficiency and securitytechniques for wireless sensor networks
ANEEQA MUMREZ
Yüksek Lisans
İngilizce
2021
Elektrik ve Elektronik Mühendisliğiİstanbul Üniversitesi-CerrahpaşaElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TARIK VELİ MUMCU