Makine öğrenmesi yöntemleri ve performans analizi
Machine learning methods and performance analysis
- Tez No: 930807
- Danışmanlar: DOÇ. DR. FİLİZ KANBAY
- Tez Türü: Yüksek Lisans
- Konular: Matematik, Mathematics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: Türkçe
- Üniversite: Yıldız Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Matematik Ana Bilim Dalı
- Bilim Dalı: Matematik Bilim Dalı
- Sayfa Sayısı: 200
Özet
Günümüzde finans, sağlık, ticaret ve eğitim gibi birçok alanda makine öğrenmesi yöntemleri ve veri analizi ile birçok araştırma yapılmaktadır. Bu çalışma öğrencilerin eğitim başarısını etkileyen demografik bilgileri modellemeyi hedeflemektedir. Çalışmanın birinci bölümünde literatür taraması yapılmış ve bu alanda yapılmış önceki araştırmalara dayanarak çalışmanın temel amacı ve hedefleri belirlenmiştir. Bu süreçte elde edilen bilgiler, makine öğrenmesi algoritmalarını nasıl uygulayacağımıza dair yön gösterici bir rol oynamıştır. İkinci bölümde veri bilimi ile ilgili temel kavramlar tanımlanarak kullanılan makine öğrenmesi algoritmalarının açıklamaları verilmiştir. Ayrıca, analiz için kullanılan veri setinin yapısı detaylandırılmış, böylece çalışmanın altyapısı oluşturulmuştur. Çalışmanın üçüncü bölümünde Naive Bayes, lineer regresyon, K-En Yakın Komşu, Karar Ağaçları, Rastgele Orman, Destek Vektör Makineleri, Adaboost ve XGBoost algoritmaları ile sınıflandırma modelleri geliştirilmiştir. Bu modellerin başarı oranlarını yükseltmek için her bir algoritmanın hiperparametreleri ızgara taraması yöntemi ile optimize edilmiş ve çapraz doğrulama kullanılmıştır. Elde edilen sonuçlar doğruluk oranları açısından özetlenmiştir. Dördüncü bölümde ise veri boyutunu azaltarak analiz süresini ve maliyeti düşürmek amacıyla Temel Bileşen Analizi uygulanmıştır. TBA ile veri setindeki özniteliklerin boyutu azaltılarak daha yalın bir modelleme yapılmış, bu süreçte model doğruluğuna olumlu katkılar sağlanmıştır. Boyut azaltmanın etkilerini daha ayrıntılı incelemek adına beşinci bölümde öznitelikler gruplandırılmış ve her bir gruba TBA uygulanmış ve özniteliklerin kendi nitelikler doğrultusunda sınıflandırılması ve boyut azaltılmasının model doğruluğu üzerindeki etkisi analiz edilmiştir. Altıncı bölümde sınıflandırma doğruluğunu artırmak amacıyla Lineer Diskriminant Analizi (LDA) yöntemi kullanılarak makine öğrenmesi algoritmaları bir kez daha değerlendirilmiştir. Bu analizle, verinin farklı özellik gruplarına göre nasıl ayrıştığı gözlemlenmiş ve LDA'nın boyut azaltma etkisi makine öğrenmesi algoritmalarıyla incelenmiştir. Yedinci bölümde ise gruplandırılmış özniteliklere her bir grup için LDA uygulanarak gruplandırdıktan sonra boyut azaltmanın model başarısına olan etkisi makine öğrenmesi algoritmalarıyla incelenmiştir. Bu çalışma, eğitimde makine öğrenmesi kullanımını geniş bir çerçevede ele almakta ve öğrencilerin akademik başarılarını etkileyen faktörleri daha iyi anlamak adına detaylı bir modelleme sunmaktadır.
Özet (Çeviri)
Nowadays, many researches are being done with machine learning methods and data analysis in various fields such as finance, health, commerce, and education. This study aims to model the demographic information affecting students' success in education. In the first section, a literary review about the topic is presented, and the main objective of this study is determined based on previous research. All of the data obtained in this process played a guiding role in the implementation of machine learning algorithms. In the second section, fundamental concepts related to data science are defined, and explanations of the machine learning algorithms used are provided. Additionally, the structure of the dataset used for the analysis is detailed, establishing the foundation of the study. In the third section of the study, Naive Bayes, with linear regression, K-Nearest Neighbors, Decision Trees, Random Forest, Support Vector Machine, Adaboost, and XGBoost algorithms, classification models are developed. The hyperparameters of each algorithm are optimized by using raster, and cross-validation is used in order to increase the success rates of these models. The results obtained are outlined according to their accuracy ratio. In the fourth section, principal component analysis was applied to reduce analysis time and cost by reducing the data size. A simpler modelling was made by reducing features in PCA and data set size; in this process, positive contributions were made to model accuracy. In order to examine the effects of size reduction in more detail, the features are grouped in the fifth section, and PCA is applied for each group, and features were categorized according to their own qualities, and size reduction's impact on the model accuracy was analyzed. In the sixth section, the machine learning algorithms are again evaluated using the Linear Discriminant Analysis (LDA) method to improve classification accuracy. With this analysis, it is observed how the data is decomposed according to different feature groups, and the dimensionality reduction effect of LDA is analyzed with machine learning algorithms. In the seventh section, LDA is applied to the grouped features for each group, and the effect of dimension reduction on model success after grouping is analyzed using machine learning algorithms. This study addresses the use of machine learning in education in a broad framework and presents a detailed modelling to better understand the factors affecting students' academic achievement.
Benzer Tezler
- Elektrik dağıtım şirketlerinde makine öğrenmesi tabanlı enerji tüketimi tahmin modelleri ve performans analizi
Machine learning based energy consumption estimation models and performance analysis in electricity distribution companies
EBRU İPAR
Yüksek Lisans
Türkçe
2025
Endüstri ve Endüstri MühendisliğiHarran ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. GENCAY SARIIŞIK
- Android yazılımlarda yapay zeka destekli zararlı yazılım tespiti ve performans analizi
Ai-assisted malware detection and performance analysis in android software
FATİH BULDUR
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYalova ÜniversitesiDisiplinlerarası Adli Bilişim Ana Bilim Dalı
PROF. DR. MURAT GÖK
- Kod kusurlarının tespitinde makine öğrenmesi tekniklerinin kullanılması ve karşılaştırmalı performans analizi
Application and comparative performance analysis of machine learning techniques for code smell detection
ARMAN YAVUZ
Yüksek Lisans
Türkçe
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. OYA KALIPSIZ
- Yapay sinir ağları ve makine öğrenmesi ile otomobil satış tahmininin yapılması ve zaman serileri analizi ile karşılaştırılması
Forecasting automobile sales using artificial neural networks and machine learning and comparison with time series analysis
BEYZA KURTGERİ
Yüksek Lisans
Türkçe
2024
Endüstri ve Endüstri MühendisliğiSakarya ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. MERVE CENGİZ TOKLU
- A new nonlinear lifting line method for configuration aerodynamics and deep learning based aerodynamic surrogate models
Konfigürasyon aerodinamiği analizi ve derin öğrenme bazlı aerodinamik dijital model oluşturmak için yeni bir doğrusal olmayan taşıyıcı çizgi metodu
HASAN KARALİ
Yüksek Lisans
İngilizce
2020
Bilim ve Teknolojiİstanbul Teknik ÜniversitesiUçak ve Uzay Mühendisliği Ana Bilim Dalı
PROF. DR. MAHMUT ADİL YÜKSELEN
PROF. DR. GÖKHAN İNALHAN