Geri Dön

Kolektif öğrenmede sınıf dengesizliği problemi: Hastalık tanısı sınıflandırma

The class imbalance problem in ensemble learning: Disease diagnosis classification

  1. Tez No: 565503
  2. Yazar: SULTAN TURHAN
  3. Danışmanlar: DOÇ. DR. ERALP DOĞU
  4. Tez Türü: Yüksek Lisans
  5. Konular: Biyoistatistik, Biostatistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2019
  8. Dil: Türkçe
  9. Üniversite: Muğla Sıtkı Koçman Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 100

Özet

Klinik karar verme, yanlış bir teşhis konulması sonucunda hastanın yaşamını olumsuz yönde etkileyebilmesi nedeniyle oldukça önemli bir süreçtir. Günümüzde teknolojinin hızla ilerlemesi ile birlikte sağlık alanında çok büyük veri setleri oluşmuştur. Oluşan bu veri setlerinden anlamlı ve yorumlanabilir bilgi elde edebilmek için makine öğrenmesi yöntemlerinden yararlanılmaktadır. Fakat makine öğrenmesi günümüz gerçek dünya verilerinde çoğu zaman verilerin yorumlanmasını, verilerden oluşturulan modelleri ve verilere dayanarak verilen kararları etkileyebilecek problemlere sahiptir. Bu problemlerden olan sınıf dengesizliği problemi tanısal hataya yol açabileceği ve öğrenme performansını doğrudan etkileyebileceği belirtilmektedir. Sınıf dengesizliği problemi, belirli bir sınıfın diğer sınıflara oranla daha az temsil edildiği durum olarak tanımlanmaktadır. Bu sebeple bir sınıflandırma modelinde, sınıf dengesizliği problemi varlığında veri setindeki azınlık sınıfı üzerine daha yüksek tanımlama oranları elde edebilmesi çok önemlidir. Bu ise özellikle tanının güvenilirliğinin arttırılmasında yararlanılan kolektif öğrenme ve yeniden örnekleme yöntemleri ile mümkündür. Kolektif öğrenme, çoklu sınıflandırıcı sistemlerinin kullanıldığı yöntemlerdir. Ancak sınıf dengesizliğinin çok fazla olduğu durumlarda bu yöntemlerin performansı da olumsuz etkilenmektedir. Bu nedenle sınıf dengesizliği problemi varlığında ek bir prosedür olarak yeniden örnekleme yöntemleri önerilmektedir. Yeniden örnekleme yöntemleri dengesiz veri setlerinin sınıf dağılımını dengelemek ve sınıflandırma üzerindeki etkisinin ortadan kaldırılmak için yaygın olarak kullanılan yöntemler olarak tanıtılmaktadır. Bu tez, sınıf dengesizliği probleminin önemini ve bu problemin çözümünü ele almaktadır. Çalışmada sınıf dengesizliği problemi olan veri setlerinde yeniden örnekleme yöntemleri dengesizlik probleminin giderilmesinde kullanılmış ve kolektif öğrenme algoritmalarına entegre edilerek sınıflandırma performansları karşılaştırılmıştır

Özet (Çeviri)

Clinical decision making is a very important process since it may adversely affect the patient's life as a result of an incorrect diagnosis. Today, with the rapid advancement of technology, very large data sets have emerged in the field of health. In order to obtain meaningful and interpretable information from these data sets, machine learning methods are used. However, machine learning often has problems that can affect the interpretation of data, models generated from data, and decisions based on data. It is stated that the class imbalance problem, which is one of these problems, can lead to diagnostic error and directly affect learning performance. The problem of class imbalance is defined as the situation where a particular class is less represented than other classes. Therefore, in a classification model, it is very important that in the presence of a class imbalance problem, higher definition rates on the minority class in the data set can be obtained. This is especially possible with ensemble learning and resampling methods used to increase the reliability of diagnosis. Ensemble learning is the method of using multiple classifier systems. However, the performance of these methods is also negatively affected in cases where the class imbalance is very high. Therefore, resampling methods are proposed as an additional procedure in the presence of class imbalance problem. Resampling methods are introduced as commonly used methods to balance the class distribution of unbalanced data sets and eliminate the effect on classification. This thesis deals with the importance of class imbalance problem and its solution of this problem. In the study, resampling methods were used to eliminate the imbalance problem and their classification performances were compared by integrating them into ensemble learning algorithms.

Benzer Tezler

  1. Çoklu adaptif hibrit sinir ağları

    Multi adaptive hybrid network

    MAHMUT ÇAKAR

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMarmara Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. KAZIM YILDIZ

    DR. ÖĞR. ÜYESİ YAKUP GENÇ

  2. Dengesiz veri setlerinde aşırı örnekleme teknikleri ile makine öğrenmesi yaklaşımlarının karşılaştırılması

    Comparison of machine learning approaches by using oversampling techniques on imbalanced datasets

    ÜMİT DİLBAZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBursa Teknik Üniversitesi

    Akıllı Mühendislik Sistemleri Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MUSTAFA ÖZGÜR CİNGİZ

  3. Sınıftaki öğretime ve öğrenci öğrenmelerine okul müdürü liderliğinin etkisi: Öğrenmede aracı yolların incelenmesi

    Effect of school manager leadership in classroom teaching and student learning: Investigation of learning tool ways

    MAHMUT KARAKAYA

    Doktora

    Türkçe

    Türkçe

    2018

    Eğitim ve ÖğretimGazi Üniversitesi

    Eğitim Bilimleri Ana Bilim Dalı

    PROF. DR. MEHMET KORKMAZ

  4. Implementation of deep learning based approaches in the diagnosis of diabetes and diabetic retinopathy

    Diyabet ve diyabetik retinopati teşhisinde derin öğrenmeye dayalı yaklaşımların uygulanması

    ÖZGE NUR ERGÜN

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ HAMZA OSMAN İLHAN

  5. Integrating fuzzy logic into deep autoencoders for interpretability and clustering

    Yorumlanabilirlik ve öbekleme için bulanık mantığın derin özkodlayıcılara entegre edilmesi

    KUTAY BÖLAT

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Kontrol ve Otomasyon Mühendisliği Ana Bilim Dalı

    DOÇ. DR. TUFAN KUMBASAR