Yapay sinir ağlarının dengesiz veri setlerinin sınıflandırılmasının iyileştirilmesi
Improvement of classification of unbalanced datasets of neural networks
- Tez No: 792171
- Danışmanlar: DOÇ. DR. SEDAT ÇAPAR
- Tez Türü: Yüksek Lisans
- Konular: Mühendislik Bilimleri, Engineering Sciences
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: Türkçe
- Üniversite: Dokuz Eylül Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Veri Bilimi Bilim Dalı
- Sayfa Sayısı: 85
Özet
Dengesiz veri seti sınıflandırma yaparken, sınıfların eşit dağılmadığı, sınıflar arası yaklaşık olarak aynı sayıda verinin olmadığı veri kümesidir. Makine öğrenmesi algoritmalarına dengesiz veri setleri gösterildiğinde, algoritmalar veri dağılım özelliklerini düzgün bir şekilde temsil edemez. Veri seti dengesizse, algoritmalar Azınlık sınıfının örneklerinden çok az şey öğrenmiş veya hiç öğrenmemiş olabilir. Bu ise veri setindeki hedef niteliğin sınıf değerleri arasında sakıncalı doğruluk değerlerinin elde edilmesine neden olmaktadır. Yapay Sinir Ağları özellikle sınıflandırma ve genelleme yapma durumlarında etkin çalışır. Yapay Sinir Ağlarında uygun parametre seçimi modelin iyi öğrenebilmesi için önemlidir. Yapay sinir ağlarında aktivasyon fonksiyonunun probleme göre uygun seçilmesi ağın performansını ve başarı oranını önemli derecede etkiler. Yapay Sinir Ağlarında ki doğrusal olmayan problemlerin çözümünde optimum değeri bulmak için optimizasyon yöntemleri kullanılmaktadır. Dengesiz verilere uygulanan yapay sinir ağları kullanılarak yapılan sınıflandırmanın optimizasyon çalışması ile modelin çıktısında ki azınlık sınıfının yanlış sınıflandırma oranının dengeli hale getirilmesi amaçlanır. Dengesiz veri setinde az sayıda olan sınıfın minör ve majör olasılık dağılımları incelenmiştir. Belirlenen yöntem uygulanmıştır. Karmaşıklık matrisinde kesinlik hassasiyet, mathew korelasyon katsayısı incelinip model çıktısında ki iyileşme görülmüştür.Yanlış negatif sınıfı azaltılıp Test veri setinde ki çıktı iyileştirilmiştir.
Özet (Çeviri)
An unbalanced data set is a data set in which the classes are not evenly distributed and there is approximately the same number of data between classes. When unbalanced datasets are presented to machine learning algorithms, the algorithms cannot properly represent data distribution features. If the dataset is unbalanced, the algorithms may have learned little or nothing from the examples of the Minority class. This causes inaccurate accuracy values to be obtained between the class values of the target attribute in the data set. Artificial Neural Networks work effectively especially in classification and generalization situations. Appropriate parameter selection in Artificial Neural Networks is important for the model to learn well. Appropriate selection of the activation function according to the problem in artificial neural networks significantly affects the performance and success rate of the network. Optimization methods are used to find the optimum value in the solution of nonlinear problems in Artificial Neural Networks. With the optimization study of the classification made using artificial neural networks applied to unbalanced data, it is aimed to stabilize the misclassification rate of the minority class in the output of the model. The minor and major probability distributions of the class, which are few in the unbalanced data set, were examined. The determined method was applied. In the complexity matrix, precision precision, mathew correlation coefficient were examined and the model output was improved. The false negative class was reduced and the output in the Test data set was improved.
Benzer Tezler
- Classification of abnormal respiratory sounds using deep learning techniques
Solunum seslerinin derin öğrenme yöntemleri ile sınıflandırılması
AHAMADI ABDALLAH IDRISSE
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Bilimleri Ana Bilim Dalı
DOÇ. DR. OKTAY YILDIZ
- Combination of PCA with smote oversampling for classification of high-dimensional imbalanced data
Yüksek boyutlu dengesiz verilerin sınıflandırılması için smote aşırı örnekleme ile PCA'nın kombinasyonu
GUHDAR ABDULAZIZ AHMED MULLA
Yüksek Lisans
İngilizce
2021
İstatistikVan Yüzüncü Yıl Üniversitesiİstatistik Ana Bilim Dalı
DR. ÖĞR. ÜYESİ YILDIRIM DEMİR
DR. MASOUD MUHAMMED HASSAN
- Purchase prediction and item prediction with RNN using different user-item interactions
Farklı kullanıcı-ürün etkileşim türlerini kullanarak özyineli sinir ağları ile ürün ve satış tahminlemesi
FULYA ÇELEBİ SARIOĞLU
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ YUSUF YASLAN
- Predicting software vulnerabilities and vulnerability inducing code changes using deep neural networks
Derin sinir ağlarını kullanarak yazılım güvenlik açıklarını ve güvenlik açığına sebep olan kod değişikliklerini tahmin etme
SEFA EREN ŞAHİN
Yüksek Lisans
İngilizce
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ AYŞE TOSUN
- Tümörlü beyin hücreleri tespitinde öğrenme aktarımıyla derin sinir ağlarının uygulanması
Application of deep neural networks with transfer learning in the detection of tumor brain cells
BERKE YAĞMUR
Yüksek Lisans
Türkçe
2023
İstatistikHacettepe Üniversitesiİstatistik Ana Bilim Dalı
DR. ÖĞR. ÜYESİ İBRAHİM ZOR