Geri Dön

Riskten kaçınan çok kollu haydut problem

Risk-averse multi-armed bandit problem

  1. Tez No: 687007
  2. Yazar: MILAD MALEKIPIRBAZARI
  3. Danışmanlar: YRD. DOÇ. DR. ÖZLEM ÇAVUŞ İYİGÜN
  4. Tez Türü: Doktora
  5. Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: İngilizce
  9. Üniversite: İhsan Doğramacı Bilkent Üniversitesi
  10. Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 119

Özet

Klasik çok kollu haydut probleminde amaç, karar vericinin dolaylı olarak riske duyarsız olduğu varsayımıyla, beklenen ödülü maksimize eden bir politika bulmaktır. Öte yandan, karar vericiler bazı gerçek yaşam uygulamalarında riskten kaçınırlar. Bu çalışmada, koşullu dinamik risk ölçütlerini kullanarak klasik çok kollu haydut problemleri (ÇKH) için, amacın riske göre ayarlanmış en iyi indirimli toplam çıktıyı veren bir politika bulmak olduğu, yeni bir yaklaşım öneriyoruz. Bu yeni yaklaşıma göre ÇKH'nın teorik analizini yapıyoruz ve Gittins endeksine benzer yapılara sahip riskten kaçınan tahsis endeksleri veren iki farklı öncelik endeksi öneriyoruz. Önerilen ilk yöntem, Lagrange çifteşliğine dayanmakta ve endeksler aktivasyon kısıtına karşılık gelen Lagrange çarpanı olarak ifade edilmektedir. İkinci bölümde, Whittle'ın emeklilik sorununa dayanan teorik bir analiz sunuyoruz ve önerilen riskten kaçınan tahsis endekslerini hesaplamak için Gittins endeksinin başlangıç durumundan yeniden başlatma formulasyonunun genelleştirilmiş bir versiyonunu öneriyoruz. Son olarak, önerilen yöntemlerin pratik bir uygulaması olarak, klinik deneylerin optimal tasarımına odaklanıyoruz ve Bayesian Bernoulli modeline dayalı olarak riskten kaçınan tedavi tahsisini gerçekleştirmek için riskten kaçınan ÇKH yaklaşımımızı uyguluyoruz. Yaklaşımımızın performansını, sabit rastgeleleştirme dahil olmak üzere diğer tah- sis kurallarına göre değerlendiriyoruz.

Özet (Çeviri)

In classical multi-armed bandit problem, the aim is to find a policy maximizing the expected total reward, implicitly assuming that the decision maker is risk-neutral. On the other hand, the decision makers are risk-averse in some real life applications. In this study, we design a new setting for the classical multi-armed bandit problem (MAB) based on the concept of dynamic risk measures, where the aim is to find a policy with the best risk adjusted total discounted outcome. We provide theoretical analysis of MAB with respect to this novel setting, and propose two different priority-index heuristics giving risk-averse allocation indices with structures similar to Gittins index. The first proposed heuristic is based on Lagrangian duality and the indices are expressed as the Lagrangian multiplier corresponding to the activation constraint. In the second part, we present a theoretical analysis based on Whittle's retirement problem and propose a generalized version of restart-in-state formulation of the Gittins index to compute the proposed risk-averse allocation indices. Finally, as a practical application of the proposed methods, we focus on optimal design of clinical trials and we apply our risk-averse MAB approach to perform risk-averse treatment allocation based on a Bayesian Bernoulli model. We evaluate the performance of our approach against other allocation rules, including fixed randomization.

Benzer Tezler

  1. Adaptive ambulance redeployment via multi-armed bandits

    Çok kollu haydutlar ile uyarlanabilir ambulans konumlandırma

    ÜMİTCAN ŞAHİN

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Elektrik ve Elektronik Mühendisliğiİhsan Doğramacı Bilkent Üniversitesi

    Mühendislik Bilimleri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ CEM TEKİN

  2. Risk-averse multi-stage mixed-integer stochastic programming problems

    Riskten kaçınan çok aşamalı karma tam sayılı rassal programlama problemleri

    ALİ İRFAN MAHMUTOĞULLARI

    Doktora

    İngilizce

    İngilizce

    2019

    Endüstri ve Endüstri Mühendisliğiİhsan Doğramacı Bilkent Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ÖZLEM ÇAVUŞ İYİGÜN

    PROF. DR. MEHMET SELİM AKTÜRK

  3. Risk-averse multi-class support vector machines

    Riskten kaçınan çok sınıflı destek vektör makineleri

    AYŞENUR KARAGÖZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Endüstri ve Endüstri Mühendisliğiİhsan Doğramacı Bilkent Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. ÖZLEM ÇAVUŞ İYİGÜN

  4. Risk-averse optimization for managing inventory in closed-loop supply chains

    Kapalı devre tedarik zincirlerinde riskten kaçınan envanter yönetimi optimizasyonu

    MELİS BEREN ÖZER

    Yüksek Lisans

    İngilizce

    İngilizce

    2016

    Endüstri ve Endüstri Mühendisliğiİhsan Doğramacı Bilkent Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. EMRE NADAR

    YRD. DOÇ. ÖZLEM ÇAVUŞ

  5. A risk-averse approach for the planning of a hybrid renewable energy system

    Yenilenebilir hibrit enerji sistemi planlamasına riskten kaçınan bir yaklaşım

    ÖZLEM YILMAZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2017

    Endüstri ve Endüstri Mühendisliğiİhsan Doğramacı Bilkent Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. ÖZLEM ÇAVUŞ İYİGÜN

    YRD. DOÇ. DR. AYŞE SELİN KOCAMAN