Geri Dön

Makine öğrenmesi ile çevresel tutumların sınıflandırılması: Öznitelik seçimi temelli mühendislik yaklaşımı

Classification of environmental attitudes with machine learning algorithms: An engineering approach based on feature selection

  1. Tez No: 948441
  2. Yazar: FUAT ALKAN
  3. Danışmanlar: DOÇ. DR. RUKİYE UZUN ARSLAN, DR. ÖĞR. ÜYESİ İREM ŞENYER YAPICI
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: Türkçe
  9. Üniversite: Zonguldak Bülent Ecevit Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 123

Özet

Günümüzde veriye dayalı karar alma süreçlerinde makine öğrenmesi (MÖ) modellerinin başarımı, büyük ölçüde kullanılan verinin kalitesi ile anlamlı özniteliklerin seçimine bağlıdır. Özellikle yüksek boyutlu veri kümelerinde, gereksiz veya gürültülü değişkenlerin varlığı öğrenme sürecini yavaşlatmakta, aşırı öğrenmeye yol açmakta ve model çıktılarının yorumlanabilirliğini azaltmaktadır. Bu nedenle, öznitelik seçimi yalnızca hesaplama karmaşıklığını azaltmakla kalmayıp, aynı zamanda doğruluk ve genellenebilirlik gibi temel performans ölçütlerini de iyileştiren kritik bir ön işleme adımı olarak değerlendirilmektedir. Literatürde yapılan çalışmalar, uygun öznitelik alt kümelerinin belirlenmesinin sınıflandırma başarımını artırdığını ve eğitim süresini kısalttığını ortaya koymaktadır.Bu doğrultuda yürütülen tez çalışmasında, farklı özellik seçimi yöntemlerinin çeşitli MÖ algoritmalarının sınıflandırma performansı üzerindeki etkileri sistematik olarak incelenmiştir. Örnek uygulama olarak, çok değişkenli yapıya sahip bireylerin çevresel tutum düzeylerini içeren açık erişimli bir anket veri seti kullanılmıştır. Bu veri seti üzerinde en anlamlı özellikleri belirlemek amacıyla Varyans Analizi, Ki-kare testi, Rasgele Orman (RO), LASSO (En Küçük Mutlak Daralma ve Seçim Operatörü), Temel Bileşenler Analizi (TBA), Oylama, Özyinelemeli Özellik Eliminasyonu, Karşılıklı Bilgi, varyans eşiği gibi on farklı yöntem uygulanmıştır. Seçilen özellik kümeleriyle Naive Bayes, Gradyan Artırma, k-En Yakın Komşu, Destek Vektör Makineleri, Lojistik Regresyon, Çok Katmanlı Algılayıcılar (ÇKA), Torbalama ve Doğrusal Diskriminant Analizi gibi on farklı sınıflandırıcı model eğitilmiştir. Modelleme sürecinde veri kümesi %80 eğitim ve %20 test olacak şekilde ayrılmış; performans değerlendirmesi ise 5 katlı çapraz doğrulama yöntemi ile gerçekleştirilmiştir. Elde edilen bulgular, özellikle TBA ve RO tabanlı özellik seçimi yöntemlerinin, ÇKA algoritmasıyla birlikte kullanıldığında %98,7 doğruluk oranına ulaşarak en yüksek performansı sağladığını ortaya koymuştur. Ayrıca LASSO ve Voting tabanlı yaklaşımlar da dikkat çekici başarımlar sergilemiştir. Genel olarak, özellik seçimi ile sınıflandırma algoritmalarının uygun biçimde eşleştirilmesinin model başarımı üzerinde istatistiksel olarak anlamlı etkiler yarattığı gözlemlenmiştir.Sonuç olarak, bu tez çalışması, özellik seçimi tekniklerinin MÖ tabanlı sınıflandırma modelleri üzerindeki etkilerini çevresel tutum verileri özelinde kapsamlı biçimde incelemektedir. Elde edilen bulgular, yüksek boyutlu veri kümelerine yönelik sınıflandırma problemlerinde öznitelik seçiminin model başarımı açısından kritik bir rol oynadığını ortaya koymakta; bu doğrultuda çalışma, literatüre metodolojik ve uygulamalı düzeyde anlamlı katkılar sunmaktadır. Sayısal analizlerle desteklenen sonuçlar, model optimizasyon sürecinde öznitelik seçiminin önemini vurgulamakta ve farklı veri türleri ile problem alanlarında uygulanabilecek esnek bir çerçeve önermektedir.

Özet (Çeviri)

Nowadays, the performance of machine learning (ML) models in data-driven decision-making processes largely depends on the quality of the used data and the selection of meaningful features. Particularly in high-dimensional datasets, the presence of redundant or noisy feautres impedes the learning process, but also induces overfitting and diminishes the interpretability of model outputs. Therefore, feature selection is regarded as a critical preprocessing step that not only reduces computational complexity but also improves fundamental performance metrics, such as accuracy and generalizability. Studies in the literature show that identifying optimal feature subsets improves classification performance and reduces training duration.In this thesis, the effects of different feature selection methods on the classification performance of various ML algorithms are systematically examined. As a case study, an open-access survey dataset containing individuals' environmental attitude levels with a multivariate structure has been used. To identify the most significant features in this dataset, ten different methods have been applied, including Analysis of Variance, Chi-square test, Random Forest (RF), LASSO (Least Absolute Shrinkage and Selection Operator), Principal Component Analysis (PCA), Voting, Recursive Feature Elimination, Mutual Information, and Variance Threshold. Using the selected feature sets, ten different classification models have been trained, including Naive Bayes, Gradient Boosting, k-Nearest Neighbors, Support Vector Machines, Logistic Regression, Multilayer Perceptrons (MLP), Bagging, and Linear Discriminant Analysis. During the modelling process, the dataset has been divided into 80% training and 20% testing, and the performance evaluation has been conducted using 5-fold cross-validation method. The findings reveal that feature selection methods based on PCA and RF, when combined with MLP algorithm, has been achieved the highest performance with an accuracy rate of 98.7%. Additionally, LASSO- and Voting-based approaches have also demonstrated remarkable performance. Overall, it has been observed that the appropriate matching of feature selection methods with classification algorithms has statistically significant effects on model performance.In conclusion, this thesis extensively investigates the effects of feature selection techniques on ML based classification models for environmental attitude data. The findings reveal that feature selection plays a critical role in terms of model performance in classification problems for high-dimensional datasets; accordingly, the study makes significant contributions to the literature at methodological and practical levels. The results, supported by numerical analyses, emphasise the importance of feature selection in the model optimisation process and suggest a flexible framework that can be applied to different data types and problem domains.

Benzer Tezler

  1. Aptitudes and attitudes: Human-centred pedagogies in foundation design studios

    Yetenekler ve tutumlar: Temel tasarım stüdyosunda, insan-merkezli eğitim

    DESANTILA HYSA

    Doktora

    İngilizce

    İngilizce

    2021

    Mimarlıkİstanbul Teknik Üniversitesi

    Mimarlık Ana Bilim Dalı

    PROF. DR. MİNE ÖZKAR KABAKÇIOĞLU

  2. Exploring design based learning activities in 2nd grade science classrooms

    2. sınıf bilim sınıflarında tasarım tabanlı öğrenme aktivitelerinin keşfedilmesi

    ÖZLEM YAPRAK BOSTANCI

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Eğitim ve ÖğretimOrta Doğu Teknik Üniversitesi

    Eğitim Programları ve Öğretimi Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ELİF ÖZTÜRK

  3. 7-12 yaş gurubu çocuklarda ahlaki gelişim-Tanrı algısı ilişkisi

    The relationship of moral development-God perception in children aged 7-12

    LALE VERGİL

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    DinErciyes Üniversitesi

    Felsefe ve Din Bilimleri Ana Bilim Dalı

    DOÇ. DR. ALİ KUŞAT

  4. Görsel sanatlar etkinliklerinin öğrenme güçlüğü olan öğrencilerin duygusal durumlarına katkısının öğretmen görüşleriyle incelenmesi

    Investigation of the contribution of visual arts activities to the emotional status of students with learni̇ng di̇sabilities with teachers' opinions

    KEVNEY ENSAR BAHADIR

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Eğitim ve ÖğretimTrabzon Üniversitesi

    Güzel Sanatlar Eğitimi Ana Bilim Dalı

    DOÇ. DR. SEDA LİMAN TURAN

  5. Ortaöğretim öğrencilerinin düşünme stillerinin yaratıcılıklarına ve görsel sanatlar dersine yönelik tutumlarına etkisi

    The impact of high school students' thinking styles on their creativity and their attitudes towards the visual arts course

    GAMZE KAYA

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Eğitim ve ÖğretimAtatürk Üniversitesi

    Güzel Sanatlar Eğitimi Ana Bilim Dalı

    PROF. DR. ŞEYDA ERASLAN TAŞPINAR