Geri Dön

Prediction with expert advice: on the role of contexts, bandit feedback and risk-awareness

Uzman önerileriyle tahmin: bağlamların, haydut geribildirimin ve risk farkındalığının rolü üzerine

  1. Tez No: 540729
  2. Yazar: KUBİLAY EKŞİOĞLU
  3. Danışmanlar: DR. CEM TEKİN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2018
  8. Dil: İngilizce
  9. Üniversite: İhsan Doğramacı Bilkent Üniversitesi
  10. Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 70

Özet

Günlük olarak üretilen ve toplanan verinin büyüklüğü arttıkça, uzun bir eğitim süreci gerektirmeden çevrimiçi olarak çalışabilen tahmin algoritmalarına olan ihtiyaç da artmıştır. Bu tezde uzman önerisiyle tahmin problemi çevrimiçi öğrenme çerçevesinde ele alınmıştır. Daha detaylı olarak, bu sorun uzmanların örnek uzay hakkında asimetrik bilgiye sahip olduğu bir senaryoda ele alınmıştır. Bu senaryo için önce, uzmanların bir alt kümesini seçen ve bu alt kümenin önerilerine göre tahmin yapan bir algoritma önerilmiştir. Ardından, örnekleri çevrimiçi bir şekilde kümeleyen ve bu kümelerdeki seçimlerin ve gözlemlerin tarihçesini kullanarak tahmin yapmayı sağlayan bir algoritma önerilmiştir. Sonrasında, riskli bir kolun seçilme sayısını en aza indirgemeyi amaçlayan, Riske Duyarlı Çok Kollu Haydut probleminin bir çeşidi olan Safe Bandit (Güvenli Haydut) problemi ele alınmıştır. Risk kavramı olarak ortalama-varyans seçilmiş ve ortalama-varyansı belirli bir eşikten yüksek olan kollar riskli olarak tanımlanmıştır. Riskli kolların toplam seçilme sayısı Risk İhlal Pişmanlığı (Risk Violation Regret, RVR) adında yeni bir pişmanlık kavramı olarak tanımlanmıştır. Ardından, Risk Eşikleriyle Keşif ve Faydalanma (Exploration and Exploitation with Risk Thresholds, EXERT) olarak adlandırılan bir öğrenme algoritması önerilmiş ve bu algoritmanın yüksek olasılıkla O(1) RVR elde ettiği kanıtlanmıştır. EXERT algoritmasının performansı, tüm uzmanların reddetme opsiyonlu yapay sinir ağları olduğu bir uzman seçimi probleminde incelenmiş ve bu uzmanları eğitmek için bir yöntem önerilmiştir.

Özet (Çeviri)

Along with the rapid growth in the size of data generated and collected over time, the need for developing online algorithms that can provide answers without any offline training has considerably increased. In this thesis, we consider the prediction with expert advice problem under the online learning framework. Specifically, we consider problems where experts have asymmetric information about the sample space. First, we propose an algorithm that selects a subset of the experts and makes predictions based on the advices of this subset. Then, we propose another algorithm that clusters samples in an online manner and makes predictions based on the history of observations and decisions within each cluster. Next, we consider the Safe Bandit, a variant of the Risk Aware Multi Armed Bandit, where the goal is to minimize the number of rounds in which a risky arm is chosen. Adopting mean-variance as the risk notion, we define an arm as risky if its mean-variance is higher than a given threshold. Using this, we define a new regret measure called Risk Violation Regret (RVR), which depends on the number of times risky arms are selected. Then, we propose a learning algorithm called Exploration and Exploitation with Risk Thresholds (EXERT), and prove that it achieves O(1) RVR with high probability. Afterwards, we use EXERT in an expert selection problem, where each expert corresponds to a neural network with reject option. For this, we propose a method to train these neural networks and use them to evaluate the performance of EXERT in real-world datasets.

Benzer Tezler

  1. Kamu özel işbirliği projeleri ön değerlendirme süreci için etüd kanvası

    Etude canvas for the public private partnership projects' preliminary assessment period

    KADİR KURU

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    İnşaat Mühendisliğiİstanbul Teknik Üniversitesi

    İnşaat Mühendisliği Ana Bilim Dalı

    DOÇ. DR. DENİZ ARTAN İLTER

  2. Online learning under adverse settings

    Karşıt koşullar altında çevrimiçi öğrenme

    HÜSEYİN ÖZKAN

    Doktora

    İngilizce

    İngilizce

    2015

    Elektrik ve Elektronik Mühendisliğiİhsan Doğramacı Bilkent Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. SÜLEYMAN SERDAR KOZAT

  3. Bulanık uzman sistem kullanarak tıkayıcı uyku apne hipopne sendromunun ciddiyet seviyesinin tahmini

    Severity degree prediction of obstructive sleep apnea hypopnea syndrome using fuzzy expert system

    CAN ZOROĞLU

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Kulak Burun ve Boğazİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    ÖĞR. GÖR. SERKAN TÜRKELİ

  4. Saf ses odyogram bulgularının makine öğrenmesi metotları ile değerlendirilerek muhtemel ön tanı ve öneri tahmininde bulunulması

    Predicting possible preliminary diagnosis and recommendations by evaluating pure tone audiogram findings with machine learning methods

    AÇELYA AYNACI

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Medeniyet Üniversitesi

    Biyolojik Veri Bilimi Ana Bilim Dalı

    PROF. DR. HANDAN ANKARALI

  5. Multivariate analysis of school principals' technology leadership competencies, learning school environment and schools' social network structures

    Okul müdürlerinin teknoloji liderliği yeterlikleri, okullardaki örgütsel öğrenme ortamı ve örgüt-içi sosyal ağ yapıları arasındaki ilişkinin çok yönlü analizi

    KÖKSAL BANOĞLU

    Doktora

    İngilizce

    İngilizce

    2019

    Eğitim ve ÖğretimMarmara Üniversitesi

    Eğitim Bilimleri Ana Bilim Dalı

    PROF. DR. MÜNEVVER ÇETİN