Geri Dön

Sentetik veri örnekleme yöntemlerine matematiksel yaklaşımlar

Mathematical approachesto synthetic data sampling methods

  1. Tez No: 709908
  2. Yazar: ABDULLAH DAL
  3. Danışmanlar: DOÇ. DR. İBRAHİM HALİL GÜMÜŞ, DR. ÖĞR. ÜYESİ SERKAN GÜLDAL
  4. Tez Türü: Yüksek Lisans
  5. Konular: Matematik, Mathematics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: Türkçe
  9. Üniversite: Adıyaman Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Matematik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 35

Özet

Bu tez çalışmasında dengesiz dağılıma sahip veri kümelerinin makine öğrenimi algoritmalarında performans kayıplarını iyileştirmeye yönelik bir metot önerilmiştir. Veri kümelerindeki dengesizliği azaltmak veya tamamen kaldırmak için birçok çalışma yapılmıştır (RUS, ROS, SMOTE). Geliştirilen metotta benzer şekilde azınlık sınıfa ait mevcut örnekler, yeniden sentetik olarak çoğaltılmıştır ve veri kümeleri dengelenmiştir. Yeniden örnekleme işlemi için, azınlık sınıfa ait örnekler arasında, Öklid uzaklık metriğiyle tüm veri noktaları için en yakın komşular tespit edilmiştir. Bu komşular arasında yeterli sayıda en yakın komşular arasında olmak üzere, diğer yöntemlerden farklı olarak Ağırlıklı Geometrik Ortalama kullanılarak istenen sayıda yeni sentetik örnekler oluşturulmuştur. Bu şekilde dengelenen veri kümelerinin makine öğrenim performanslarında karşılaştırılan metotlara göre ciddi iyileştirmeler gözlemlenmiştir.

Özet (Çeviri)

In this thesis, a method is proposed to improve performance losses in machine learning algorithms of unevenly distributed datasets. Many studies have been done to reduce or completely remove the imbalance in datasets (RUS, ROS, SMOTE). Similarly, in the developed method, existing samples belonging to the minority class were reproduced synthetically and the datasets were balanced. For the resampling process, the nearest neighbors for all data points were determined using the Euclidean distance metric among the samples belonging to the minority class. Different from the other methods, a desired number of new synthetic samples were created using the Weighted Geometric Average, among these neighbors, in a sufficient number among the nearest neighbors. Significant improvements were observed in the machine learning performance of datasets balanced in this way, compared to the methods compared.

Benzer Tezler

  1. Matematik bölümü öğrencilerinin ispat algıları

    Mathematics undergraduates' perceptions of proof

    GÖKÇE TUNCER

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    Eğitim ve ÖğretimDokuz Eylül Üniversitesi

    Ortaöğretim Fen ve Matematik Alanları Eğitimi Ana Bilim Dalı

    DOÇ. DR. IŞIKHAN UĞUREL

  2. Experimental investigation of singular sources method for microwave imaging

    Tekil kaynaklar yöntemiyle mikrodalga görüntülemenin deneysel olarak incelenmesi

    TUĞHAN ÇAĞLAYAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2016

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MEHMET ÇAYÖREN

  3. Non-parametric Coupled Shape Priors for Segmentation of Deformable Objects in Time-Series Images using Particle Filters

    Zaman serisi görüntülerindeki deforme olan nesnelerin parçacık süzgeci ve parametrik olmayan birleşik şekil önseli kullanılarak bölütlenmesi

    NAEIMEH ATABAKILACHINI

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Elektrik ve Elektronik MühendisliğiSabancı Üniversitesi

    DOÇ. DR. MÜJDAT ÇETİN

  4. Kara para aklamanın önlenmesi için derin öğrenme

    Deep learning for anti money laundering

    MERT YILMAZ ÇAKIR

    Doktora

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Sabahattin Zaim Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. YAHYA ŞİRİN

  5. Machine learning based augmentation of medical microwave imaging

    Medikal mikrodalga görüntülemenin makine öğrenmesiyle iyileştirilmesi

    MERVE KAPLAN ŞAFAK

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET ÇAYÖREN