Bagging ve Boosting tabanlı sınıflandırma yöntemlerinde hiperparametre optimizasyonu
Hyperparameter optimization in Bagging and Boosting based classification methods
- Tez No: 906213
- Danışmanlar: PROF. DR. FİKRİ GÖKPINAR
- Tez Türü: Yüksek Lisans
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: Türkçe
- Üniversite: Gazi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 107
Özet
Makine öğrenmesi, istatistiksel yöntemler kullanarak verilerden anlamlı desenler çıkararak, bilgisayarların deneyim yoluyla kendini geliştirebildiği bir yapay zeka dalıdır. Makine öğrenimi, günümüzde birçok alanda önemli sonuçlar elde etmiş ve teknolojik ilerlemenin temel unsurlarından biri haline gelmiştir. Bu kapsamda, bagging ve boosting gibi topluluk algoritmaları, büyük veri kümelerinde model performansını artırmak için yaygın olarak kullanılmaktadır. Bu durum, mevcut hiper parametrelerin sayısının artmasına yol açmıştır. Hiper parametreler, modelin davranışını belirleyen kritik unsurları şekillendirir ve bu parametrelerin uygun bir biçimde ayarlanması, tahmin performansı ile hesaplama verimliliğini doğrudan etkiler. Bu tez çalışmasında, bagging ve boosting topluluk öğrenme algoritmalarında çeşitli makine öğrenme yöntemlerinin adaptasyonu ve bu modellerin hiper parametre optimizasyonu incelenmiştir. Bu amaçla, UCI Machine Learning Repository'den alınan kuru üzüm veri seti, sınıflandırma problemi için kullanılmıştır. Veri seti, bilgisayarlı görü sistemleri (CVS) ile elde edilen ve Türkiye'den Keçimen ve Besni kuru üzüm çeşitlerine ait metrik verileri içermektedir. Modelleme aşamasında, Python programlama dili kullanılarak bagging entegrasyonu ile Lojistik Regresyon, Destek Vektör Makineleri ve Karar Ağaçları (bagging kullanımıyla Rastgele Orman) modelleri; boosting için ise Adaboost, Xgboost ve Catboost modelleri uygulanmıştır. Hiper parametre optimizasyonu, Optuna çerçevesi ve Bayes optimizasyonu kullanılarak gerçekleştirilmiş, çapraz doğrulama ve objektif performans ölçütleriyle değerlendirilmiştir. Sonuçlar, optimize edilen modellerin dengeli ve etkili olduğunu göstermiştir. Performans metrikleri olarak değerlendirilen doğruluk, kesinlik, F1 skoru ve duyarlılık oranları %85 ile %91 arasında değişiklik göstermiştir.
Özet (Çeviri)
Machine learning is a branch of artificial intelligence that enables computers to improve through experience by extracting meaningful patterns from data using statistical methods. Machine learning has achieved significant results in many fields today and has become one of the fundamental elements of technological advancement. In this context, ensemble algorithms such as bagging and boosting are widely used to enhance model performance in large datasets. This has led to an increase in the number of existing hyperparameters. Hyperparameters shape critical elements that determine the behavior of the model, and the proper tuning of these parameters directly impacts both prediction performance and computational efficiency. In this thesis, the adaptation of various machine learning methods in bagging and boosting ensemble learning algorithms and the hyperparameter optimization of these models were examined. For this purpose, the raisin dataset obtained from the UCI Machine Learning Repository was used for a classification problem. The dataset contains metric data of Keçimen and Besni raisin varieties from Türkiye, obtained through Computer Vision Systems (CVS). In the modeling phase, Logistic Regression, Support Vector Machines, and Decision Trees (Random Forest with bagging integration) were applied for bagging; and Adaboost, Xgboost, and Catboost models were applied for boosting. Hyperparameter optimization was performed using the Optuna framework and Bayesian optimization, evaluated through cross-validation and objective performance metrics. The results showed that the optimized models were balanced and effective. The performance metrics, evaluated as accuracy, precision, F1 score, and recall, ranged between 85% and 91%.
Benzer Tezler
- Topluluk öğrenme yöntemlerine dayalı bilgisayar destekli tanı sisteminin geliştirilmesi: genomik teknolojileri üzerine uygulaması
Development of computer-aided diagnosis system based on ensemble learning methods: Application on genomic technologies
ZEYNEP KÜÇÜKAKÇALI
Doktora
İngilizce
2023
Biyoistatistikİnönü ÜniversitesiBiyoistatistik ve Tıp Bilişimi Ana Bilim Dalı
DOÇ. HARİKA GÖZDE GÖZÜKARA BAĞ
- Purchase prediction and item prediction with RNN using different user-item interactions
Farklı kullanıcı-ürün etkileşim türlerini kullanarak özyineli sinir ağları ile ürün ve satış tahminlemesi
FULYA ÇELEBİ SARIOĞLU
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ YUSUF YASLAN
- Çok değişkenli kontrol diyagramında kontrol dışı duruma sebep olan değişkenlerin topluluk makine öğrenme algoritmaları ile tahmini
Prediction of variables that the cause of out of control condition on multivariate control chart by ensemble machine learning algorithm
DENİZ DEMİRCİOĞLU DİREN
Doktora
Türkçe
2020
Endüstri ve Endüstri MühendisliğiSakarya ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. SEMRA BORAN
- Classifier fusion for multimodal correlated classifiers and video annotation
Bağımlı sınıflandırıcılar ve video işaretleme için sınıflandırıcı birleştirme
ÜMİT EKMEKCİ
Yüksek Lisans
İngilizce
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. ZEHRA ÇATALTEPE
- Dizel makinanın makina öğrenmesi yöntemi kullanılarak modellenmesi ve karar-destek mekanizması oluşturulması
Machine learning method based marine diesel engine modelling and decision-support system setting
TOLGA ŞAHİN
Doktora
Türkçe
2022
Makine Mühendisliğiİstanbul Teknik ÜniversitesiMakine Mühendisliği Ana Bilim Dalı
PROF. DR. CEVAT ERDEM İMRAK