Multi-class classification methods utilizing Mahalanobis Taguchi system and a re-sampling approach for imbalanced data sets
Mahalanobis Taguchi sistemi ile çoklu sınıflandırma yöntemleri ve dengeli olmayan veri setleri için bir yeniden örnekleme yaklaşımı
- Tez No: 238303
- Danışmanlar: PROF. DR. GÜLSER KÖKSAL
- Tez Türü: Yüksek Lisans
- Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
- Anahtar Kelimeler: Classification, Multi-class Classification, Re-sampling, Mahalanobis Taguchi System (MTS), Feature Weighted Mahalanobis Distance
- Yıl: 2009
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Endüstri Mühendisliği Bölümü
- Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
- Sayfa Sayısı: 99
Özet
Sınıflandırma yaklaşımları farklı gözlemlere ait sınıfları tahmin etmek ya da belirlemek için birçok alanda kullanılmaktadır. Bu çalışma kapsamında, Mahalanobis Taguchi Sistem (MTS) sınıflandırma yaklaşımı incelenmiş ve bu yöntem çok sınıflı problemler için geliştirilmiştir. MTS, önemli değişkenleri seçerek Mahalanobis uzaklığına (MU) göre yeni bir gözlemi sınıflandırmaya çalışır. Bu çalışmada, ilk olarak, MTS yönteminde çoklu bağlantı problemi ile küçük veri kümelerinde görülen örnek büyüklüğü sorunları incelenmiş ve çözüm olarak bir yeniden örnekleme yöntemi geliştirilmiştir. Geliştirilen örnekleme yöntemi iki sınıflı problemler için çalışmakta olup, veri çoğaltma ve azaltma yöntemlerini içermektedir. Veri çoğaltma yöntemi, az sayılı sınıfın gözlemlerine ait yakın komşuluklarda sentetik gözlemler oluşturan SMOTE yöntemine dayanmaktadır. Örnekleme yönteminde, duruma göre en uygun değerleri değişen birkaç yeniden örnekleme parametresinin başarımını test etmek için MTS kullanılmıştır. İkinci bölümde, MTS ile çok sınıflı problemleri çözen yeni sınıflandırma yöntemleri geliştirilmiştir. Ağırlıklı MU yaklaşımı kullanılarak, Değişken Ağırlıklı Çoklu MTS-I (FWMMTS-I) geliştirilmiştir. Bu yaklaşımda, MU'nun değişkenlere dayalı eşit ağırlıklı toplanması özelliği hafifletilmiştir. Gürültü değişkenlerin sıfıra yakın ağırlıklarla temsil edilmesi sağlanarak MU hesaplarken diğer değişkenleri gizlemesi engellenmiştir. İkinci olarak, iki sınıflı problemleri çözen MTS'nin çok sınıflı probleme uyarlanmasıyla, Çok Sınıflı MTS (MMTS) geliştirilmiştir. Ayrıca, Su ve Hsiao (2009) çalışmasında önerilen, diğer bir değişken ağırlıklı çoklu sınıflandırma yaklaşımında, MU hesaplaması değişikliği yapılarak, Değişken Ağırlıklı Çoklu MTS-II (FWMMTS-II) yöntemi olarak isimlendirilmiştir. Tüm yöntemler tabakalı çapraz doğrulama yaklaşımı kullanılarak sekiz farklı çok sınıflı veri kümelesinde karşılaştırılmıştır. Sonuçlara göre, FWMMTS-I yöntemi MMTS ile aynı başarımı göstermiş ve bunlar ise FWMMTS-II yönteminden daha iyi başarım göstermiştir. İlginç olarak, sınıflandırma modelinde tüm değişkenleri doğrudan kullanan MU Yaklaşımı (MDC) da, çalışılan veri kümelerinde aynı derecede başarım göstermiştir.
Özet (Çeviri)
Classification approaches are used in many areas in order to identify or estimate classes, which different observations belong to. The classification approach, Mahalanobis Taguchi System (MTS) is analyzed and further improved for multi-class classification problems under the scope of this thesis study. MTS tries to explore significant variables and classify a new observation based on its Mahalanobis distance (MD). In this study, first, sample size problems, which are encountered mostly in small data sets, and multicollinearity problems, which constitute some limitations of MTS, are analyzed and a re-sampling approach is explored as a solution. Our re-sampling approach, which only works for data sets with two classes, is a combination of over-sampling and under-sampling. Over-sampling is based on SMOTE, which generates the synthetic observations between the nearest neighbors of observations in the minority class. In addition, MTS models are used to test the performance of several re-sampling parameters, for which the most appropriate values are sought specific to each case. In the second part, multi-class classification methods with MTS are developed. An algorithm, namely Feature Weighted Multi-class MTS-I (FWMMTS-I), is inspired by the descent feature weighted MD. It relaxes adding up of the MDs for variables equally. This provides representations of noisy variables with weights close to zero so that they do not mask the other variables. As a second multi-class classification algorithm, the original MTS method is extended to multi-class problems, which is called Multi-class MTS (MMTS). In addition, a comparable approach to that of Su and Hsiao (2009), which also considers weights of variables, is studied with a modification in MD calculation. It is named as Feature Weighted Multi-class MTS-II (FWMMTS-II). The methods are compared on eight different multi-class data sets using a 5-fold stratified cross validation approach. Results show that FWMMTS-I is as accurate as MMTS, and they are better than FWMMTS-II. Interestingly, the Mahalanobis Distance Classifier (MDC) using all the variables directly in the classification model has performed equally well on the studied data sets.
Benzer Tezler
- Ensemble based feature selection with hybrid model
Hibrit modeli ile topluluk temelli öznitelik seçimi
CEYLAN DEMİR
Yüksek Lisans
İngilizce
2019
Matematikİstanbul Teknik ÜniversitesiMatematik Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ İZZET GÖKSEL
DOÇ. DR. SÜREYYA AKYÜZ
- Kalabalık gözetleme ortamlarında anomali tespiti
Anomaly detection in crowded surveillance scenes
EFSUN SEFA SEZER
Yüksek Lisans
Türkçe
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. AHMET BURAK CAN
- Deep learning and machine learning methods for detecting false data injection cyber-attacks on smart grid phasor measurement units
Akıllı şebeke fazör ölçüm ünitelerinde sahte veri enjeksiyonu siber saldırılarının tespiti için derin öğrenme ve makine öğrenmesi yöntemleri
KHALID GOUN
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBEYKOZ ÜNİVERSİTESİBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ÖZLEM FEYZA ERKAN
- Motor imagery based mobile brain computer interface design using machine learning techniques
Makine öğrenmesi yöntemleri ile motor hareket hayali tabanlı mobil beyin bilgisayar arayüzü tasarımı
HAKAN AŞIK
Yüksek Lisans
İngilizce
2017
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiMekatronik Mühendisliği Ana Bilim Dalı
PROF. DR. ZÜMRAY DOKUR
- Güç sistemlerinde geçici hal kararsızlığının ve gelişiminin derin öğrenme ve karar ağacı tabanlı yöntemler ile geniş alan ölçümlerine dayalı olarak erken kestirimi
Wide area measurement based early prediction of power system transient instability and its evolution using deep learning and decision tree based algorithms
MERT KESİCİ
Yüksek Lisans
Türkçe
2019
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektrik Mühendisliği Ana Bilim Dalı
PROF. DR. VEYSEL MURAT İSTEMİHAN GENÇ