Prediction with expert advice: on the role of contexts, bandit feedback and risk-awareness

Uzman önerileriyle tahmin: bağlamların, haydut geribildirimin ve risk farkındalığının rolü üzerine

PDF İndir

Tez No: 540729
Yazar: KUBİLAY EKŞİOĞLU
Danışmanlar: DR. CEM TEKİN
Tez Türü: Yüksek Lisans
Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2018
Dil: İngilizce
Üniversite: İhsan Doğramacı Bilkent Üniversitesi
Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 70

Özet

Günlük olarak üretilen ve toplanan verinin büyüklüğü arttıkça, uzun bir eğitim süreci gerektirmeden çevrimiçi olarak çalışabilen tahmin algoritmalarına olan ihtiyaç da artmıştır. Bu tezde uzman önerisiyle tahmin problemi çevrimiçi öğrenme çerçevesinde ele alınmıştır. Daha detaylı olarak, bu sorun uzmanların örnek uzay hakkında asimetrik bilgiye sahip olduğu bir senaryoda ele alınmıştır. Bu senaryo için önce, uzmanların bir alt kümesini seçen ve bu alt kümenin önerilerine göre tahmin yapan bir algoritma önerilmiştir. Ardından, örnekleri çevrimiçi bir şekilde kümeleyen ve bu kümelerdeki seçimlerin ve gözlemlerin tarihçesini kullanarak tahmin yapmayı sağlayan bir algoritma önerilmiştir. Sonrasında, riskli bir kolun seçilme sayısını en aza indirgemeyi amaçlayan, Riske Duyarlı Çok Kollu Haydut probleminin bir çeşidi olan Safe Bandit (Güvenli Haydut) problemi ele alınmıştır. Risk kavramı olarak ortalama-varyans seçilmiş ve ortalama-varyansı belirli bir eşikten yüksek olan kollar riskli olarak tanımlanmıştır. Riskli kolların toplam seçilme sayısı Risk İhlal Pişmanlığı (Risk Violation Regret, RVR) adında yeni bir pişmanlık kavramı olarak tanımlanmıştır. Ardından, Risk Eşikleriyle Keşif ve Faydalanma (Exploration and Exploitation with Risk Thresholds, EXERT) olarak adlandırılan bir öğrenme algoritması önerilmiş ve bu algoritmanın yüksek olasılıkla O(1) RVR elde ettiği kanıtlanmıştır. EXERT algoritmasının performansı, tüm uzmanların reddetme opsiyonlu yapay sinir ağları olduğu bir uzman seçimi probleminde incelenmiş ve bu uzmanları eğitmek için bir yöntem önerilmiştir.

Özet (Çeviri)

Along with the rapid growth in the size of data generated and collected over time, the need for developing online algorithms that can provide answers without any offline training has considerably increased. In this thesis, we consider the prediction with expert advice problem under the online learning framework. Specifically, we consider problems where experts have asymmetric information about the sample space. First, we propose an algorithm that selects a subset of the experts and makes predictions based on the advices of this subset. Then, we propose another algorithm that clusters samples in an online manner and makes predictions based on the history of observations and decisions within each cluster. Next, we consider the Safe Bandit, a variant of the Risk Aware Multi Armed Bandit, where the goal is to minimize the number of rounds in which a risky arm is chosen. Adopting mean-variance as the risk notion, we define an arm as risky if its mean-variance is higher than a given threshold. Using this, we define a new regret measure called Risk Violation Regret (RVR), which depends on the number of times risky arms are selected. Then, we propose a learning algorithm called Exploration and Exploitation with Risk Thresholds (EXERT), and prove that it achieves O(1) RVR with high probability. Afterwards, we use EXERT in an expert selection problem, where each expert corresponds to a neural network with reject option. For this, we propose a method to train these neural networks and use them to evaluate the performance of EXERT in real-world datasets.

Benzer Tezler

Tez No
510705
Kamu özel işbirliği projeleri ön değerlendirme süreci için etüd kanvası
Etude canvas for the public private partnership projects' preliminary assessment period
KADİR KURU
Yüksek Lisans
Türkçe
2018
İnşaat Mühendisliği İstanbul Teknik Üniversitesi
İnşaat Mühendisliği Ana Bilim Dalı
DOÇ. DR. DENİZ ARTAN İLTER
Tez No
392500
Online learning under adverse settings
Karşıt koşullar altında çevrimiçi öğrenme
HÜSEYİN ÖZKAN
Doktora
İngilizce
2015
Elektrik ve Elektronik Mühendisliği İhsan Doğramacı Bilkent Üniversitesi
Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. SÜLEYMAN SERDAR KOZAT
Tez No
398095
Bulanık uzman sistem kullanarak tıkayıcı uyku apne hipopne sendromunun ciddiyet seviyesinin tahmini
Severity degree prediction of obstructive sleep apnea hypopnea syndrome using fuzzy expert system
CAN ZOROĞLU
Yüksek Lisans
Türkçe
2015
Kulak Burun ve Boğaz İstanbul Teknik Üniversitesi
Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
ÖĞR. GÖR. SERKAN TÜRKELİ
Tez No
896762
Saf ses odyogram bulgularının makine öğrenmesi metotları ile değerlendirilerek muhtemel ön tanı ve öneri tahmininde bulunulması
Predicting possible preliminary diagnosis and recommendations by evaluating pure tone audiogram findings with machine learning methods
AÇELYA AYNACI
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol İstanbul Medeniyet Üniversitesi
Biyolojik Veri Bilimi Ana Bilim Dalı
PROF. DR. HANDAN ANKARALI
Tez No
619815
Multivariate analysis of school principals' technology leadership competencies, learning school environment and schools' social network structures
Okul müdürlerinin teknoloji liderliği yeterlikleri, okullardaki örgütsel öğrenme ortamı ve örgüt-içi sosyal ağ yapıları arasındaki ilişkinin çok yönlü analizi
KÖKSAL BANOĞLU
Doktora
İngilizce
2019
Eğitim ve Öğretim Marmara Üniversitesi
Eğitim Bilimleri Ana Bilim Dalı
PROF. DR. MÜNEVVER ÇETİN

Geri Dön