Sentetik veri örnekleme yöntemlerine matematiksel yaklaşımlar
Mathematical approachesto synthetic data sampling methods
- Tez No: 709908
- Danışmanlar: DOÇ. DR. İBRAHİM HALİL GÜMÜŞ, DR. ÖĞR. ÜYESİ SERKAN GÜLDAL
- Tez Türü: Yüksek Lisans
- Konular: Matematik, Mathematics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: Türkçe
- Üniversite: Adıyaman Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Matematik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 35
Özet
Bu tez çalışmasında dengesiz dağılıma sahip veri kümelerinin makine öğrenimi algoritmalarında performans kayıplarını iyileştirmeye yönelik bir metot önerilmiştir. Veri kümelerindeki dengesizliği azaltmak veya tamamen kaldırmak için birçok çalışma yapılmıştır (RUS, ROS, SMOTE). Geliştirilen metotta benzer şekilde azınlık sınıfa ait mevcut örnekler, yeniden sentetik olarak çoğaltılmıştır ve veri kümeleri dengelenmiştir. Yeniden örnekleme işlemi için, azınlık sınıfa ait örnekler arasında, Öklid uzaklık metriğiyle tüm veri noktaları için en yakın komşular tespit edilmiştir. Bu komşular arasında yeterli sayıda en yakın komşular arasında olmak üzere, diğer yöntemlerden farklı olarak Ağırlıklı Geometrik Ortalama kullanılarak istenen sayıda yeni sentetik örnekler oluşturulmuştur. Bu şekilde dengelenen veri kümelerinin makine öğrenim performanslarında karşılaştırılan metotlara göre ciddi iyileştirmeler gözlemlenmiştir.
Özet (Çeviri)
In this thesis, a method is proposed to improve performance losses in machine learning algorithms of unevenly distributed datasets. Many studies have been done to reduce or completely remove the imbalance in datasets (RUS, ROS, SMOTE). Similarly, in the developed method, existing samples belonging to the minority class were reproduced synthetically and the datasets were balanced. For the resampling process, the nearest neighbors for all data points were determined using the Euclidean distance metric among the samples belonging to the minority class. Different from the other methods, a desired number of new synthetic samples were created using the Weighted Geometric Average, among these neighbors, in a sufficient number among the nearest neighbors. Significant improvements were observed in the machine learning performance of datasets balanced in this way, compared to the methods compared.
Benzer Tezler
- Matematik bölümü öğrencilerinin ispat algıları
Mathematics undergraduates' perceptions of proof
GÖKÇE TUNCER
Yüksek Lisans
Türkçe
2014
Eğitim ve ÖğretimDokuz Eylül ÜniversitesiOrtaöğretim Fen ve Matematik Alanları Eğitimi Ana Bilim Dalı
DOÇ. DR. IŞIKHAN UĞUREL
- Experimental investigation of singular sources method for microwave imaging
Tekil kaynaklar yöntemiyle mikrodalga görüntülemenin deneysel olarak incelenmesi
TUĞHAN ÇAĞLAYAN
Yüksek Lisans
İngilizce
2016
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
DOÇ. DR. MEHMET ÇAYÖREN
- Non-parametric Coupled Shape Priors for Segmentation of Deformable Objects in Time-Series Images using Particle Filters
Zaman serisi görüntülerindeki deforme olan nesnelerin parçacık süzgeci ve parametrik olmayan birleşik şekil önseli kullanılarak bölütlenmesi
NAEIMEH ATABAKILACHINI
Yüksek Lisans
İngilizce
2018
Elektrik ve Elektronik MühendisliğiSabancı ÜniversitesiDOÇ. DR. MÜJDAT ÇETİN
- Kara para aklamanın önlenmesi için derin öğrenme
Deep learning for anti money laundering
MERT YILMAZ ÇAKIR
Doktora
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Sabahattin Zaim ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. YAHYA ŞİRİN
- Machine learning based augmentation of medical microwave imaging
Medikal mikrodalga görüntülemenin makine öğrenmesiyle iyileştirilmesi
MERVE KAPLAN ŞAFAK
Yüksek Lisans
İngilizce
2022
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. MEHMET ÇAYÖREN