Otomatik makine öğrenmesi (AutoML) yöntemlerinin karşılaştırılması
Comparison of automatic machine learning (AutoML) methods
- Tez No: 781096
- Danışmanlar: DOÇ. DR. HÜSEYİN GÜRÜLER
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: Türkçe
- Üniversite: Muğla Sıtkı Koçman Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilişim Sistemleri Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 81
Özet
Makine öğrenmesi artık hayatımızın her alanında yer almaktadır. Hastalar için risk analizlerinden, alışveriş sitelerindeki kullanım ihtiyaç alışkanlıklarımıza, konuşma teknolojilerinden, finansal risklerin tespitine kadar birçok alanda görülebilmektedir. Günümüzde makine öğrenmesi teknolojisinin iki amacı vardır. Biri verileri geliştirilen modellere göre sınıflandırmak, diğeri bu modellere dayalı olarak gelecekteki sonuçlar için tahminlerde bulunmaktır. Makine öğrenmesi var olduğu alanlarda verimliliği artıran, işlem süresini kısaltan ve sistemi manuel ayarlardan kurtaran uygulamalar sunmaktadır. Aslen makine öğrenmesi uygulamalarında kısa sürede yüksek doğrulukta cevap veren modeller tercih edilir. Bu nedenle, model belirlenirken çok sayıda makine öğrenmesi algoritması çeşitli yönlerden kıyaslanıp en iyi sonuç veren algoritma ve bu algoritmanın parametreleri seçilir. Bu seçim işlemi bazen makine öğrenmesi uzmanları tarafından bile günlerce süren çalışmalar sonucunda yapılabilmektedir. Otomatik makine öğrenmesi (AutoML) yöntemleri optimal model belirleme çalışmalarının seyrini hızlandırma maksadıyla gündeme gelmiştir. Bu tez çalışmasında, en çok kullanımda olan AutoML yöntemlerinden TPOT, Hyperopt-Sklearn, Auto-Keras, Auto-Sklearn ve MLBox üzerinde durulmuş ve bu yöntemler deneysel testlere tabi tutulmuştur. Testlerde kullanılan 15 farklı veri seti UCI ve OpenML makine öğrenmesi deposu üzerinden seçilmiştir. Test işlemleri, TÜBİTAK ULAKBİM yüksek başarımlı hesaplama ve veri depolama alanı olan TRUBA altyapısında gerçekleştirilmiştir. Test edilen AutoML yöntemlerinden en iyi sınıflama sonuçlarına TPOT ile en kısa test sürelerine ise Hyperopt-Sklearn ile ulaşılmıştır. Tez çalışması sonucunda, makine öğrenmesi alanında çalışan araştırmacılara en iyi model seçiminde yol gösterilmiştir. AutoML yöntemleri ile en iyi model tespitinin hızlı bir şekilde gerçekleştirilmesi, bilişim sistemleri projelerinde doğruluğu ve hızlı tepki vermeyi artırma anlamında destek sağlayacaktır.
Özet (Çeviri)
Machine Learning is now a part of every aspect of our lives. It can be observed in many areas ranging from risk analyses for patients to our habit of consumption on shopping sites, from speech technologies to detection of financial risks. Nowadays however, machine learning has two main purposes. The first one is to classify data according to developed models and the other one is to make predictions on the possible future outcomes based on these models. This way, in the fields machine learning exists in, offers applications that increase efficiency, reduces processing time and saves the system from manual settings. To be true, models that give a high accuracy in a short time are preferred in machine learning applications. For that, when determining the model, many machine learning algorithms are compared in various aspects and the algorithm with the best results and the parameters of this algorithm are selected. This process of selecting can span to days of work, even when done by machine learning experts. Because of that, Automatic Machine Learning (hereinafter referred to as AutoML) methods to help accelerate this process of selecting the optimal model have been brought up to conversation. This thesis focuses on the most used AutoML methods such as TPOT, Hyperopt-Sklearn, Auto-Keras, Auto-Sklearn and MLBox and will subject them to tests. The 15 different datasets used in these tests were selected from the UCI and OpenML machine learning repositories and the tests were carried out on the TRUBA infrastructure, TUBITAK ULAKBIM's high-performance computing and data storage area. Among the tested AutoML methods, TPOT and Hyperopt-Sklearn had the best classification results and the shortest test times, respectively. As a result of this study, researchers are guided in choosing the best model. The AutoML methods will help with a fast detection of the best model and it will provide assistance in increasing accuracy and a fast reaction in information system projects.
Benzer Tezler
- Omik verilerinde otomatik makine öğrenimi algoritmalarının performansının değerlendirilmesi
Performance evaluation of automated machine learning algorithmsin omics data
MELTEM ÜNLÜSAVURAN
Yüksek Lisans
Türkçe
2019
BiyoistatistikErciyes ÜniversitesiBiyoistatistik Ana Bilim Dalı
DOÇ. DR. GÖKMEN ZARARSIZ
- Kestirimci bakım sistemlerinde veri artırma yöntemlerinin geliştirilmesi ve bir uygulaması
Development of data augmentation methods for predictive maintenance systems and an application
SENA KALAY
Yüksek Lisans
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEskişehir Osmangazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ EYÜP ÇİNAR
PROF. DR. İNCİ SARIÇİÇEK
- Fake news detection via automated deep learning
Başlık çevirisi yok
YASİR ABDULKAREEM JAMAL JAMAL
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAltınbaş ÜniversitesiBilişim Teknolojileri Ana Bilim Dalı
PROF. DR. OSMAN NURİ UÇAN
- Öğrencilerin akademik performanslarının veri madenciliği teknikleri ile analizi
Analysis of students' academic performance using data mining techniques
SEVDA AGHALAROVA
Yüksek Lisans
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEskişehir Osmangazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. ŞAHİN IŞIK
- Building outlier detection framework by using automated machine learning methods
Otomatik makine öğrenimi yöntemlerini kullanarak anomali tespit çerçevesi oluşturma
MUSTAFA KURTOĞLU
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGalatasaray ÜniversitesiAkıllı Sistemler Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ AHMET TEOMAN NASKALİ