Riskten kaçınan çok kollu haydut problem

Risk-averse multi-armed bandit problem

PDF İndir

Tez No: 687007
Yazar: MILAD MALEKIPIRBAZARI
Danışmanlar: YRD. DOÇ. DR. ÖZLEM ÇAVUŞ İYİGÜN
Tez Türü: Doktora
Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2021
Dil: İngilizce
Üniversite: İhsan Doğramacı Bilkent Üniversitesi
Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 119

Özet

Klasik çok kollu haydut probleminde amaç, karar vericinin dolaylı olarak riske duyarsız olduğu varsayımıyla, beklenen ödülü maksimize eden bir politika bulmaktır. Öte yandan, karar vericiler bazı gerçek yaşam uygulamalarında riskten kaçınırlar. Bu çalışmada, koşullu dinamik risk ölçütlerini kullanarak klasik çok kollu haydut problemleri (ÇKH) için, amacın riske göre ayarlanmış en iyi indirimli toplam çıktıyı veren bir politika bulmak olduğu, yeni bir yaklaşım öneriyoruz. Bu yeni yaklaşıma göre ÇKH'nın teorik analizini yapıyoruz ve Gittins endeksine benzer yapılara sahip riskten kaçınan tahsis endeksleri veren iki farklı öncelik endeksi öneriyoruz. Önerilen ilk yöntem, Lagrange çifteşliğine dayanmakta ve endeksler aktivasyon kısıtına karşılık gelen Lagrange çarpanı olarak ifade edilmektedir. İkinci bölümde, Whittle'ın emeklilik sorununa dayanan teorik bir analiz sunuyoruz ve önerilen riskten kaçınan tahsis endekslerini hesaplamak için Gittins endeksinin başlangıç durumundan yeniden başlatma formulasyonunun genelleştirilmiş bir versiyonunu öneriyoruz. Son olarak, önerilen yöntemlerin pratik bir uygulaması olarak, klinik deneylerin optimal tasarımına odaklanıyoruz ve Bayesian Bernoulli modeline dayalı olarak riskten kaçınan tedavi tahsisini gerçekleştirmek için riskten kaçınan ÇKH yaklaşımımızı uyguluyoruz. Yaklaşımımızın performansını, sabit rastgeleleştirme dahil olmak üzere diğer tah- sis kurallarına göre değerlendiriyoruz.

Özet (Çeviri)

In classical multi-armed bandit problem, the aim is to find a policy maximizing the expected total reward, implicitly assuming that the decision maker is risk-neutral. On the other hand, the decision makers are risk-averse in some real life applications. In this study, we design a new setting for the classical multi-armed bandit problem (MAB) based on the concept of dynamic risk measures, where the aim is to find a policy with the best risk adjusted total discounted outcome. We provide theoretical analysis of MAB with respect to this novel setting, and propose two different priority-index heuristics giving risk-averse allocation indices with structures similar to Gittins index. The first proposed heuristic is based on Lagrangian duality and the indices are expressed as the Lagrangian multiplier corresponding to the activation constraint. In the second part, we present a theoretical analysis based on Whittle's retirement problem and propose a generalized version of restart-in-state formulation of the Gittins index to compute the proposed risk-averse allocation indices. Finally, as a practical application of the proposed methods, we focus on optimal design of clinical trials and we apply our risk-averse MAB approach to perform risk-averse treatment allocation based on a Bayesian Bernoulli model. We evaluate the performance of our approach against other allocation rules, including fixed randomization.

Benzer Tezler

Tez No
579931
Adaptive ambulance redeployment via multi-armed bandits
Çok kollu haydutlar ile uyarlanabilir ambulans konumlandırma
ÜMİTCAN ŞAHİN
Yüksek Lisans
İngilizce
2019
Elektrik ve Elektronik Mühendisliği İhsan Doğramacı Bilkent Üniversitesi
Mühendislik Bilimleri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ CEM TEKİN
Tez No
534808
Risk-averse multi-stage mixed-integer stochastic programming problems
Riskten kaçınan çok aşamalı karma tam sayılı rassal programlama problemleri
ALİ İRFAN MAHMUTOĞULLARI
Doktora
İngilizce
2019
Endüstri ve Endüstri Mühendisliği İhsan Doğramacı Bilkent Üniversitesi
Endüstri Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ÖZLEM ÇAVUŞ İYİGÜN
PROF. DR. MEHMET SELİM AKTÜRK
Tez No
534893
Risk-averse multi-class support vector machines
Riskten kaçınan çok sınıflı destek vektör makineleri
AYŞENUR KARAGÖZ
Yüksek Lisans
İngilizce
2018
Endüstri ve Endüstri Mühendisliği İhsan Doğramacı Bilkent Üniversitesi
Endüstri Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ÖZLEM ÇAVUŞ İYİGÜN
Tez No
434204
Risk-averse optimization for managing inventory in closed-loop supply chains
Kapalı devre tedarik zincirlerinde riskten kaçınan envanter yönetimi optimizasyonu
MELİS BEREN ÖZER
Yüksek Lisans
İngilizce
2016
Endüstri ve Endüstri Mühendisliği İhsan Doğramacı Bilkent Üniversitesi
Endüstri Mühendisliği Ana Bilim Dalı
YRD. DOÇ. EMRE NADAR
YRD. DOÇ. ÖZLEM ÇAVUŞ
Tez No
470051
A risk-averse approach for the planning of a hybrid renewable energy system
Yenilenebilir hibrit enerji sistemi planlamasına riskten kaçınan bir yaklaşım
ÖZLEM YILMAZ
Yüksek Lisans
İngilizce
2017
Endüstri ve Endüstri Mühendisliği İhsan Doğramacı Bilkent Üniversitesi
Endüstri Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ÖZLEM ÇAVUŞ İYİGÜN
YRD. DOÇ. DR. AYŞE SELİN KOCAMAN

Geri Dön