Geri Dön

Yapay sinir ağlarının dengesiz veri setlerinin sınıflandırılmasının iyileştirilmesi

Improvement of classification of unbalanced datasets of neural networks

  1. Tez No: 792171
  2. Yazar: SİMAY UĞUR
  3. Danışmanlar: DOÇ. DR. SEDAT ÇAPAR
  4. Tez Türü: Yüksek Lisans
  5. Konular: Mühendislik Bilimleri, Engineering Sciences
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: Türkçe
  9. Üniversite: Dokuz Eylül Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Veri Bilimi Bilim Dalı
  13. Sayfa Sayısı: 85

Özet

Dengesiz veri seti sınıflandırma yaparken, sınıfların eşit dağılmadığı, sınıflar arası yaklaşık olarak aynı sayıda verinin olmadığı veri kümesidir. Makine öğrenmesi algoritmalarına dengesiz veri setleri gösterildiğinde, algoritmalar veri dağılım özelliklerini düzgün bir şekilde temsil edemez. Veri seti dengesizse, algoritmalar Azınlık sınıfının örneklerinden çok az şey öğrenmiş veya hiç öğrenmemiş olabilir. Bu ise veri setindeki hedef niteliğin sınıf değerleri arasında sakıncalı doğruluk değerlerinin elde edilmesine neden olmaktadır. Yapay Sinir Ağları özellikle sınıflandırma ve genelleme yapma durumlarında etkin çalışır. Yapay Sinir Ağlarında uygun parametre seçimi modelin iyi öğrenebilmesi için önemlidir. Yapay sinir ağlarında aktivasyon fonksiyonunun probleme göre uygun seçilmesi ağın performansını ve başarı oranını önemli derecede etkiler. Yapay Sinir Ağlarında ki doğrusal olmayan problemlerin çözümünde optimum değeri bulmak için optimizasyon yöntemleri kullanılmaktadır. Dengesiz verilere uygulanan yapay sinir ağları kullanılarak yapılan sınıflandırmanın optimizasyon çalışması ile modelin çıktısında ki azınlık sınıfının yanlış sınıflandırma oranının dengeli hale getirilmesi amaçlanır. Dengesiz veri setinde az sayıda olan sınıfın minör ve majör olasılık dağılımları incelenmiştir. Belirlenen yöntem uygulanmıştır. Karmaşıklık matrisinde kesinlik hassasiyet, mathew korelasyon katsayısı incelinip model çıktısında ki iyileşme görülmüştür.Yanlış negatif sınıfı azaltılıp Test veri setinde ki çıktı iyileştirilmiştir.

Özet (Çeviri)

An unbalanced data set is a data set in which the classes are not evenly distributed and there is approximately the same number of data between classes. When unbalanced datasets are presented to machine learning algorithms, the algorithms cannot properly represent data distribution features. If the dataset is unbalanced, the algorithms may have learned little or nothing from the examples of the Minority class. This causes inaccurate accuracy values to be obtained between the class values of the target attribute in the data set. Artificial Neural Networks work effectively especially in classification and generalization situations. Appropriate parameter selection in Artificial Neural Networks is important for the model to learn well. Appropriate selection of the activation function according to the problem in artificial neural networks significantly affects the performance and success rate of the network. Optimization methods are used to find the optimum value in the solution of nonlinear problems in Artificial Neural Networks. With the optimization study of the classification made using artificial neural networks applied to unbalanced data, it is aimed to stabilize the misclassification rate of the minority class in the output of the model. The minor and major probability distributions of the class, which are few in the unbalanced data set, were examined. The determined method was applied. In the complexity matrix, precision precision, mathew correlation coefficient were examined and the model output was improved. The false negative class was reduced and the output in the Test data set was improved.

Benzer Tezler

  1. Classification of abnormal respiratory sounds using deep learning techniques

    Solunum seslerinin derin öğrenme yöntemleri ile sınıflandırılması

    AHAMADI ABDALLAH IDRISSE

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    DOÇ. DR. OKTAY YILDIZ

  2. Combination of PCA with smote oversampling for classification of high-dimensional imbalanced data

    Yüksek boyutlu dengesiz verilerin sınıflandırılması için smote aşırı örnekleme ile PCA'nın kombinasyonu

    GUHDAR ABDULAZIZ AHMED MULLA

    Yüksek Lisans

    İngilizce

    İngilizce

    2021

    İstatistikVan Yüzüncü Yıl Üniversitesi

    İstatistik Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ YILDIRIM DEMİR

    DR. MASOUD MUHAMMED HASSAN

  3. Purchase prediction and item prediction with RNN using different user-item interactions

    Farklı kullanıcı-ürün etkileşim türlerini kullanarak özyineli sinir ağları ile ürün ve satış tahminlemesi

    FULYA ÇELEBİ SARIOĞLU

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ YUSUF YASLAN

  4. Predicting software vulnerabilities and vulnerability inducing code changes using deep neural networks

    Derin sinir ağlarını kullanarak yazılım güvenlik açıklarını ve güvenlik açığına sebep olan kod değişikliklerini tahmin etme

    SEFA EREN ŞAHİN

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ AYŞE TOSUN

  5. Tümörlü beyin hücreleri tespitinde öğrenme aktarımıyla derin sinir ağlarının uygulanması

    Application of deep neural networks with transfer learning in the detection of tumor brain cells

    BERKE YAĞMUR

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    İstatistikHacettepe Üniversitesi

    İstatistik Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ İBRAHİM ZOR