Comparison of deep reinforcement learning algorithms in computer network traffic congestion control
Başlık çevirisi mevcut değil.
- Tez No: 701232
- Danışmanlar: DR. ÖĞR. ÜYESİ HÜSEYİN OKTAY ALTUN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: İngilizce
- Üniversite: KTO Karatay Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik ve Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 96
Özet
Teknolojik cihazların uretimindeki gelismeler ve günümüzde Internet kullanımındaki ciddi artıs¸lar nedeniyle, elde ettigimiz bilgilerin neredeyse tamamının haberlerden ˘ c¸evrimic¸i olarak toplanması gerektiginden, ˘˙Internet ve diger k ˘ uc¸¨ uk a ¨ g ba ˘ glantıları ˘yas¸amda temel bir ihtiyac¸ haline geldi. Ancak, ˙Internet kullanıcılarının sayısı arttıkc¸a,aglardaki veri trafi ˘ gi tıkanıklı ˘ gının bir sonucu olarak ˘˙Internet agları yavas¸lamaktadır. ˘Bu sorunu duzeltmek, gecikmeleri ve veri kaybını ortadan kaldırmak ic¸in a ¨ g ic¸indeki ˘veri paketlerinin gonderme ve alma oranlarını ayarlamak ic¸in TCP-Reno ve TCP-Vegas ¨gibi onceden belirlenmis¸ birkac¸ algoritma kullanılagelmis¸tir. Ancak bu algoritmalar, ¨dinamik olarak degis¸en ve d ˘ us¸¨ uk verimlili ¨ ge yol ac¸an tıkanıklık sorunu ic¸in esnek ˘ bir c¸oz¨ um olmaktan c¸ok uzaktır. Bu tezde, bilgisayar a ¨ glarındaki tıkanıklı ˘ gı azaltmak ic¸in uyarlanan derin pekis¸tirmeli o¨grenme (DRL) algoritmalarını verimlilikleri ˘ac¸ısından kars¸ılas¸tırdık. Bu tur senaryolarda uygulanabilecek birc¸ok DRL algoritması ¨ve simulat ¨ or¨ u vardır, ancak bu c¸alıs¸ma derin deterministik politika gradyanı (DDPG), ikiz gecikmeli derin deterministik (TD3) ve proksimal politika optimizasyonu (PPO) uzerine odaklanmakta ve daha sonra DRL olmayan metodlar ile kars¸ılas¸tırılmaktadır. ¨Sonuc¸lar, DDPG'nin diger ikisinden ˘ onemli bir farkla daha iyi performans g ¨ osterdi ¨ gini, ˘ardından TD3'un ve son olarak PPO'nun geldi ¨ gini g ˘ osterdi. DRL olmayan algoritmalardan biri DRL'lerin ikisinden daha yuksek puan almasına ra ¨ gmen, DDPG t ˘ um bu denenen metodlar ic¸inde en ust ¨ un performansı sergilemis¸tir.
Özet (Çeviri)
Due to high advances in production of technological devices and a sharp increase in the Internet usage in contemporary decades, the Internet and other small network connections have become a basic need in life as nearly almost all the daily consumed information has to be gathered online from news, movies, books etc. However, as the number of the Internet users escalate, the momentum of the Internet decelerates as a result of data traffic congestion within the networks. To regulate this issue, a couple of predestined algorithms such as TCP-Reno and TCP-Vegas are employed to counterbalance the sending and receiving rates of data packets within the network to eliminate delays and data loss but come with limitations such rigidity in dynamically changing congestion environment which has led to low efficiency. This thesis introduces the comparison in efficiency of deep reinforcement learning (DRL) algorithms developed to diminish congestion in computer networks. There are many DRL algorithms and simulators that can be deployed in such scenarios but this work focuses on deep deterministic policy gradient (DDPG), twin delayed deep deterministic (TD3), and proximal policy optimization (PPO) and later weighed with the existing non-DRL ones. The results showed that DDPG outperformed the other two by a considerable margin, succeeded by TD3 and finally by PPO. Even though one of the non-DRL algorithms scored higher than two of the DRL algorithms, DDPG still showed remarkable results.
Benzer Tezler
- Order dispatching via deep reinforcement learning
Başlık çevirisi yok
ERAY MERT KAVUK
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ AYŞE TOSUN KÜHN
- Derin öğrenme modellerinin hücre veri seti üzerinde eğitilerek kıyaslanması ve mobil ortama uyarlanması
Comparision and mobile application of deep learning models trained on blood cell dataset
MEHMET YAVUZ
Yüksek Lisans
Türkçe
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya Uygulamalı Bilimler ÜniversitesiBiyomedikal Mühendisliği Ana Bilim Dalı
DOÇ. DR. MUSTAFA ZAHİD YILDIZ
- Investigating deep reinforcement learningfor static optimization in optical networks
Başlık çevirisi yok
EMRE FURKAN MERCAN
Yüksek Lisans
İngilizce
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolPolitecnico di MilanoPROF. MASSİMO TORNATORE
PROF. FRANCESCO MUSUMECİ
- Data efficient offline reinforcement learning & reinforcement learning with imitation learning applications to autonomous driving and robotics
Veri verimli çevrimdışı pekiştirmeli öğrenme & taklit öğrenmeyle pekiştirmeli öğrenme otonom sürüş ve robotik uygulamaları
FEYZA NUR EKSEN
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. NAZIM KEMAL ÜRE
- İmalat sistemlerinin tasarlanması ve öncelik kurallarının belirlenmesinde yapay sinir ağlarının kullanılması
Başlık çevirisi yok
TARIK ÇAKAR
Doktora
Türkçe
1997
Mühendislik Bilimleriİstanbul Teknik Üniversitesiİşletme Mühendisliği Ana Bilim Dalı
PROF. DR. AYHAN TORAMAN