Kolektif öğrenmede sınıf dengesizliği problemi: Hastalık tanısı sınıflandırma
The class imbalance problem in ensemble learning: Disease diagnosis classification
- Tez No: 565503
- Danışmanlar: DOÇ. DR. ERALP DOĞU
- Tez Türü: Yüksek Lisans
- Konular: Biyoistatistik, Biostatistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: Türkçe
- Üniversite: Muğla Sıtkı Koçman Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 100
Özet
Klinik karar verme, yanlış bir teşhis konulması sonucunda hastanın yaşamını olumsuz yönde etkileyebilmesi nedeniyle oldukça önemli bir süreçtir. Günümüzde teknolojinin hızla ilerlemesi ile birlikte sağlık alanında çok büyük veri setleri oluşmuştur. Oluşan bu veri setlerinden anlamlı ve yorumlanabilir bilgi elde edebilmek için makine öğrenmesi yöntemlerinden yararlanılmaktadır. Fakat makine öğrenmesi günümüz gerçek dünya verilerinde çoğu zaman verilerin yorumlanmasını, verilerden oluşturulan modelleri ve verilere dayanarak verilen kararları etkileyebilecek problemlere sahiptir. Bu problemlerden olan sınıf dengesizliği problemi tanısal hataya yol açabileceği ve öğrenme performansını doğrudan etkileyebileceği belirtilmektedir. Sınıf dengesizliği problemi, belirli bir sınıfın diğer sınıflara oranla daha az temsil edildiği durum olarak tanımlanmaktadır. Bu sebeple bir sınıflandırma modelinde, sınıf dengesizliği problemi varlığında veri setindeki azınlık sınıfı üzerine daha yüksek tanımlama oranları elde edebilmesi çok önemlidir. Bu ise özellikle tanının güvenilirliğinin arttırılmasında yararlanılan kolektif öğrenme ve yeniden örnekleme yöntemleri ile mümkündür. Kolektif öğrenme, çoklu sınıflandırıcı sistemlerinin kullanıldığı yöntemlerdir. Ancak sınıf dengesizliğinin çok fazla olduğu durumlarda bu yöntemlerin performansı da olumsuz etkilenmektedir. Bu nedenle sınıf dengesizliği problemi varlığında ek bir prosedür olarak yeniden örnekleme yöntemleri önerilmektedir. Yeniden örnekleme yöntemleri dengesiz veri setlerinin sınıf dağılımını dengelemek ve sınıflandırma üzerindeki etkisinin ortadan kaldırılmak için yaygın olarak kullanılan yöntemler olarak tanıtılmaktadır. Bu tez, sınıf dengesizliği probleminin önemini ve bu problemin çözümünü ele almaktadır. Çalışmada sınıf dengesizliği problemi olan veri setlerinde yeniden örnekleme yöntemleri dengesizlik probleminin giderilmesinde kullanılmış ve kolektif öğrenme algoritmalarına entegre edilerek sınıflandırma performansları karşılaştırılmıştır
Özet (Çeviri)
Clinical decision making is a very important process since it may adversely affect the patient's life as a result of an incorrect diagnosis. Today, with the rapid advancement of technology, very large data sets have emerged in the field of health. In order to obtain meaningful and interpretable information from these data sets, machine learning methods are used. However, machine learning often has problems that can affect the interpretation of data, models generated from data, and decisions based on data. It is stated that the class imbalance problem, which is one of these problems, can lead to diagnostic error and directly affect learning performance. The problem of class imbalance is defined as the situation where a particular class is less represented than other classes. Therefore, in a classification model, it is very important that in the presence of a class imbalance problem, higher definition rates on the minority class in the data set can be obtained. This is especially possible with ensemble learning and resampling methods used to increase the reliability of diagnosis. Ensemble learning is the method of using multiple classifier systems. However, the performance of these methods is also negatively affected in cases where the class imbalance is very high. Therefore, resampling methods are proposed as an additional procedure in the presence of class imbalance problem. Resampling methods are introduced as commonly used methods to balance the class distribution of unbalanced data sets and eliminate the effect on classification. This thesis deals with the importance of class imbalance problem and its solution of this problem. In the study, resampling methods were used to eliminate the imbalance problem and their classification performances were compared by integrating them into ensemble learning algorithms.
Benzer Tezler
- Çoklu adaptif hibrit sinir ağları
Multi adaptive hybrid network
MAHMUT ÇAKAR
Yüksek Lisans
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMarmara ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. KAZIM YILDIZ
DR. ÖĞR. ÜYESİ YAKUP GENÇ
- Dengesiz veri setlerinde aşırı örnekleme teknikleri ile makine öğrenmesi yaklaşımlarının karşılaştırılması
Comparison of machine learning approaches by using oversampling techniques on imbalanced datasets
ÜMİT DİLBAZ
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBursa Teknik ÜniversitesiAkıllı Mühendislik Sistemleri Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MUSTAFA ÖZGÜR CİNGİZ
- Sınıftaki öğretime ve öğrenci öğrenmelerine okul müdürü liderliğinin etkisi: Öğrenmede aracı yolların incelenmesi
Effect of school manager leadership in classroom teaching and student learning: Investigation of learning tool ways
MAHMUT KARAKAYA
Doktora
Türkçe
2018
Eğitim ve ÖğretimGazi ÜniversitesiEğitim Bilimleri Ana Bilim Dalı
PROF. DR. MEHMET KORKMAZ
- Implementation of deep learning based approaches in the diagnosis of diabetes and diabetic retinopathy
Diyabet ve diyabetik retinopati teşhisinde derin öğrenmeye dayalı yaklaşımların uygulanması
ÖZGE NUR ERGÜN
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ HAMZA OSMAN İLHAN
- Integrating fuzzy logic into deep autoencoders for interpretability and clustering
Yorumlanabilirlik ve öbekleme için bulanık mantığın derin özkodlayıcılara entegre edilmesi
KUTAY BÖLAT
Yüksek Lisans
İngilizce
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiKontrol ve Otomasyon Mühendisliği Ana Bilim Dalı
DOÇ. DR. TUFAN KUMBASAR