Geri Dön

Online learning under adverse settings

Karşıt koşullar altında çevrimiçi öğrenme

  1. Tez No: 392500
  2. Yazar: HÜSEYİN ÖZKAN
  3. Danışmanlar: DOÇ. DR. SÜLEYMAN SERDAR KOZAT
  4. Tez Türü: Doktora
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2015
  8. Dil: İngilizce
  9. Üniversite: İhsan Doğramacı Bilkent Üniversitesi
  10. Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 180

Özet

İstatistiki açıdan durağan olmama ve veri bozulmaları ile kayıp/karışık yüksek boyutlu veri tipleri içerme gibi tahmin edilmesi güç mahiyette ve daha evvel karşılaşılmamış derecede çok miktarlarda veri üreten günümüz uygulamaları için yenilikçi çözümler üretmekteyiz. Bu minval üzere, gözlemlerin bir bir yapıldığı ve depolanmadan sadece bir defa işlendiği¸ çevrimiçi öğrenme (İngilizce:“online learning”) için karşıt koşullar altında (İngilizce:“under adverse settings”) yenilikçi algoritmalar takdim etmekteyiz. Bahse konu bu karşıt koşullar öyledir ki, i) veri kaynağına istinaden ancak kısıtlı yani eser miktarda istatistiki varsayım yapılabilir, ii) gözlemler bozulmuş (İngilizce:“data corruptions”) olabilir ve iii) veri oldukça hızlı işlenmek durumundadır. Hesapsal açıdan son derece verimli olan ve aynı zamanda güçlü matematiksel teminatları haiz çevrimiçi algoritmalarımızın, karşıt koşullar altında rakip yöntemlerden epey üstün bir performans sergilediği sunduğumuz kapsamlı gerçek veri deneyleri ile gösterilmektedir. Veri kaynağı hakkında herhangi bir istatistiki varsayımda bulunmaksızın, yenilikçi ve olabildiğince dinamik bir“uzman-topluluk”/“uzman tavsiyeleriyle tahmin”(İngilizce:“expert ensemble”/“predicting with expert advice”) yöntemi geliştirmekteyiz. Yöntemimizin, topluluğun en iyi uzmanınki kadar bir sonuşur (İngilizce:“asymptotical”) performansı sergilediğini, yani en iyi uzmanla rekabetçi olduğunu, matematiksel olarak göstermekteyiz ki; burada, en iyi uzmanın kendisi dahi tamamen veriye uyarlanan bir yordamla zamanda sürekli gelişecek şekilde çalışmaktadır. İlaveten, bu çevrimiçi algoritmamızın tasarımında, sıradüzensel (İngilizce:“hierarchical”) ve veriye göre kendi kendini organize edebilen bir yaklaşım vasıtasıyla üstün bir modelleme gücü (dolayısıyla üstün bir tahmin performansı) elde ederken; fazladan eğitme (İngilizce:“over training”) sorunlarından da düşük karmaşıklı yöntemleri birleştirmek suretiyle kaçınıyoruz. Öte yandan, literatürdeki mevcut teknikler hem değişmeyen/sabit yani esnek olmayan hem de yapısal olarak (hesapsal açıdan) verimli bir temsile müsaade etmeyen uzman topluluklarına ciddi seviyede bağımlıdır. Bu sebeple ortaya çıkan veri kaynağı istatistiklerine aşırı duyarlılık ve modelleme gücü ile hesapsal yük/duyarlık arasındaki uyumsuzluk (istenmeyen veya ters orantı) gibi meseleleri sunduğumuz yöntemler ile açık bir biçimde çözmüş bulunmaktayız. Matematiksel olarak ispatladığımız performans garantileri muhtemel her girdi dizisi için durağan olabilen ya da olmayabilen veri istatistiklerinden bağımsız kesin (gerekirci) bir surette her zaman geçerlidir. Ayrıca, bozulma düzeltmede mahir algoritmalar geliştirerek veri bozulması problemleri için de doğrudan çözümler üretmekteyiz. Bu çözümleri geliştirirken etraflıca göstermekteyiz ki, anormallik tespiti -başlı başına önemli bir makine eğitimi problemi olmasının yanı sıra- bozulma tespiti/düzeltmesi maksadıyla etkili bir şekilde kullanılabilir. Bu bağlamda, süratli akan, kaynak istatistiği itibariyle durağan olan yahut olmayan zaman dizilerindeki anormal gözlemler için Neyman-Pearson karakterlendirmesinin çevrimiçi gerçeklemesini sağlayan bir algoritmayı literatürdeki ilk çalışma olarak sunmaktayız. Sunduğumuz algoritma, parametre ayarlamaları gerektirmeksizin, çevrimiçi bir şekilde, yanlış alarm oranını arzu edilen seviyede sabit tutabilirken anormallik tespit başarısını da en büyütmektedir. Takdim ettiğimiz çevrimiçi algoritmalarımız, herhangi bir veri dizisini kaynağı hakkında bir ön bilgi gerektirmeden eğitim aşamasız ve varsayımsız son derece hızlı bir şekilde işleyebilirken, tahmin başarısına ilişkin de matematiksel olarak ispatlanmış güçlü teminatlar sağlamaktadır. Algoritmalarımızın, durağan olmayan veri kaynağı istatistiklerine dikkate şayan bir uyarlanabilirlikle, literatürde hem rutin olarak kullanılan hem de henüz önerilmiş muadil yöntemlerden önemli ölçüde üstün bir performans sergilediğini gerçek yahut suni olabilen bilindik veri kümeleri üzerinde yaptığımız geniş kapsamlı deneylerle göstermekteyiz.

Özet (Çeviri)

We present novel solutions for contemporary real life applications that generate data at unforeseen rates in unpredictable forms including non-stationarity, corruptions, missing/mixed attributes and high dimensionality. In particular, we introduce novel algorithms for online learning, where the observations are received sequentially and processed only once without being stored, under adverse settings: i) no or limited assumptions can be made about the data source, ii) the observations can be corrupted and iii) the data is to be processed at extremely fast rates. The introduced algorithms are highly effective and efficient with strong mathematical guarantees; and are shown, through the presented comprehensive real life experiments, to significantly outperform the competitors under such adverse conditions. We develop a novel highly dynamical ensemble method without any stochastic assumptions on the data source. The presented method is asymptotically guaranteed to perform as well as, i.e., competitive against, the best expert in the ensemble, where the competitor, i.e., the best expert, itself is also specifically designed to continuously improve over time in a completely data adaptive manner. In addition, our algorithm achieves a significantly superior modeling power (hence, a significantly superior prediction performance) through a hierarchical and self-organizing approach while mitigating over training issues by combining (taking finite unions of) low-complexity methods. On the contrary, the state-of-the-art ensemble techniques are heavily dependent on static and unstructured expert ensembles. In this regard, we rigorously solve the resulting issues such as the over sensitivity to source statistics as well as the incompatibility between the modeling power and the computational load/precision. Our results uniformly hold for every possible input stream in the deterministic sense regardless of the stationary or non-stationary source statistics. Furthermore, we directly address the data corruptions by developing novel versatile imputation methods and thoroughly demonstrate that the anomaly detection -in addition to being stand alone an important learning problem- is extremely effective for corruption detection/imputation purposes. To that end, as the first time in the literature, we develop the online implementation of the Neyman-Pearson characterization for anomalies in stationary or non-stationary fast streaming temporal data. The introduced anomaly detection algorithm maximizes the detection power at a specified controllable constant false alarm rate with no parameter tuning in a truly online manner. Our algorithms can process any streaming data at extremely fast rates without requiring a training phase or a priori information while bearing strong performance guarantees. Through extensive experiments over real/synthetic benchmark data sets, we also show that our algorithms significantly outperform the state-of-the-art as well as the most recently proposed techniques in the literature with remarkable adaptation capabilities to non-stationarity.

Benzer Tezler

  1. Informal learning experiences of school counselors during the COVID-19 pandemic

    Okul psikolojik danışmanlarının COVID-19 döneminde yaşadıkları enformel öğrenme deneyimleri

    GÖZDE DEMİR ERTUĞRUL

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Eğitim ve ÖğretimBoğaziçi Üniversitesi

    Eğitim Bilimleri Ana Bilim Dalı

    DOÇ. DR. HAVVA AYŞE CANER

  2. Yapay zekâ ve demokrasi

    Artificial intelligence and democracy

    AYŞE NUR YAZICILAR

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    HukukGalatasaray Üniversitesi

    Kamu Hukuku Ana Bilim Dalı

    PROF. DR. ŞULE ÖZSOY BOYUNSUZ

  3. Oyunlaştırılmış bir öğrenme ortamının tasarlanması, uygulanması ve çeşitli değişkenlere göre incelenmesi

    Design and implementation of a gamified learning environment and examination of it in terms of various variables

    ŞEYMA ÇAĞLAR

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    Eğitim ve ÖğretimHacettepe Üniversitesi

    Bilgisayar ve Öğretim Teknolojileri Eğitimi Ana Bilim Dalı

    YRD. DOÇ. DR. SELAY ARKÜN KOCADERE

  4. Çevrimiçi işbirlikli öğrenme ortamında e - portfolyo uygulamasının akademik başarıya, tutumlara, motivasyona ve kalıcılığa etkisi

    The effects of the implementation of e - portfolios in online collaborative learning environment to academic achievement, attitudes, motivation and the retention

    PINAR ERTEN

    Doktora

    Türkçe

    Türkçe

    2015

    Eğitim ve ÖğretimFırat Üniversitesi

    Eğitim Programları ve Öğretimi Ana Bilim Dalı

    YRD. DOÇ. DR. İBRAHİM YAŞAR KAZU

    YRD. DOÇ. DR. OĞUZHAN ÖZDEMİR