Riskten kaçınan çok kollu haydut problem
Risk-averse multi-armed bandit problem
- Tez No: 687007
- Danışmanlar: YRD. DOÇ. DR. ÖZLEM ÇAVUŞ İYİGÜN
- Tez Türü: Doktora
- Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: İngilizce
- Üniversite: İhsan Doğramacı Bilkent Üniversitesi
- Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 119
Özet
Klasik çok kollu haydut probleminde amaç, karar vericinin dolaylı olarak riske duyarsız olduğu varsayımıyla, beklenen ödülü maksimize eden bir politika bulmaktır. Öte yandan, karar vericiler bazı gerçek yaşam uygulamalarında riskten kaçınırlar. Bu çalışmada, koşullu dinamik risk ölçütlerini kullanarak klasik çok kollu haydut problemleri (ÇKH) için, amacın riske göre ayarlanmış en iyi indirimli toplam çıktıyı veren bir politika bulmak olduğu, yeni bir yaklaşım öneriyoruz. Bu yeni yaklaşıma göre ÇKH'nın teorik analizini yapıyoruz ve Gittins endeksine benzer yapılara sahip riskten kaçınan tahsis endeksleri veren iki farklı öncelik endeksi öneriyoruz. Önerilen ilk yöntem, Lagrange çifteşliğine dayanmakta ve endeksler aktivasyon kısıtına karşılık gelen Lagrange çarpanı olarak ifade edilmektedir. İkinci bölümde, Whittle'ın emeklilik sorununa dayanan teorik bir analiz sunuyoruz ve önerilen riskten kaçınan tahsis endekslerini hesaplamak için Gittins endeksinin başlangıç durumundan yeniden başlatma formulasyonunun genelleştirilmiş bir versiyonunu öneriyoruz. Son olarak, önerilen yöntemlerin pratik bir uygulaması olarak, klinik deneylerin optimal tasarımına odaklanıyoruz ve Bayesian Bernoulli modeline dayalı olarak riskten kaçınan tedavi tahsisini gerçekleştirmek için riskten kaçınan ÇKH yaklaşımımızı uyguluyoruz. Yaklaşımımızın performansını, sabit rastgeleleştirme dahil olmak üzere diğer tah- sis kurallarına göre değerlendiriyoruz.
Özet (Çeviri)
In classical multi-armed bandit problem, the aim is to find a policy maximizing the expected total reward, implicitly assuming that the decision maker is risk-neutral. On the other hand, the decision makers are risk-averse in some real life applications. In this study, we design a new setting for the classical multi-armed bandit problem (MAB) based on the concept of dynamic risk measures, where the aim is to find a policy with the best risk adjusted total discounted outcome. We provide theoretical analysis of MAB with respect to this novel setting, and propose two different priority-index heuristics giving risk-averse allocation indices with structures similar to Gittins index. The first proposed heuristic is based on Lagrangian duality and the indices are expressed as the Lagrangian multiplier corresponding to the activation constraint. In the second part, we present a theoretical analysis based on Whittle's retirement problem and propose a generalized version of restart-in-state formulation of the Gittins index to compute the proposed risk-averse allocation indices. Finally, as a practical application of the proposed methods, we focus on optimal design of clinical trials and we apply our risk-averse MAB approach to perform risk-averse treatment allocation based on a Bayesian Bernoulli model. We evaluate the performance of our approach against other allocation rules, including fixed randomization.
Benzer Tezler
- Adaptive ambulance redeployment via multi-armed bandits
Çok kollu haydutlar ile uyarlanabilir ambulans konumlandırma
ÜMİTCAN ŞAHİN
Yüksek Lisans
İngilizce
2019
Elektrik ve Elektronik Mühendisliğiİhsan Doğramacı Bilkent ÜniversitesiMühendislik Bilimleri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ CEM TEKİN
- Risk-averse multi-stage mixed-integer stochastic programming problems
Riskten kaçınan çok aşamalı karma tam sayılı rassal programlama problemleri
ALİ İRFAN MAHMUTOĞULLARI
Doktora
İngilizce
2019
Endüstri ve Endüstri Mühendisliğiİhsan Doğramacı Bilkent ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ÖZLEM ÇAVUŞ İYİGÜN
PROF. DR. MEHMET SELİM AKTÜRK
- Risk-averse multi-class support vector machines
Riskten kaçınan çok sınıflı destek vektör makineleri
AYŞENUR KARAGÖZ
Yüksek Lisans
İngilizce
2018
Endüstri ve Endüstri Mühendisliğiİhsan Doğramacı Bilkent ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ÖZLEM ÇAVUŞ İYİGÜN
- Risk-averse optimization for managing inventory in closed-loop supply chains
Kapalı devre tedarik zincirlerinde riskten kaçınan envanter yönetimi optimizasyonu
MELİS BEREN ÖZER
Yüksek Lisans
İngilizce
2016
Endüstri ve Endüstri Mühendisliğiİhsan Doğramacı Bilkent ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
YRD. DOÇ. EMRE NADAR
YRD. DOÇ. ÖZLEM ÇAVUŞ
- A risk-averse approach for the planning of a hybrid renewable energy system
Yenilenebilir hibrit enerji sistemi planlamasına riskten kaçınan bir yaklaşım
ÖZLEM YILMAZ
Yüksek Lisans
İngilizce
2017
Endüstri ve Endüstri Mühendisliğiİhsan Doğramacı Bilkent ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ÖZLEM ÇAVUŞ İYİGÜN
YRD. DOÇ. DR. AYŞE SELİN KOCAMAN