Geri Dön

Otomatik makine öğrenmesi (AutoML) yöntemlerinin karşılaştırılması

Comparison of automatic machine learning (AutoML) methods

  1. Tez No: 781096
  2. Yazar: HABİBE ÇELİKTEN
  3. Danışmanlar: DOÇ. DR. HÜSEYİN GÜRÜLER
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: Türkçe
  9. Üniversite: Muğla Sıtkı Koçman Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilişim Sistemleri Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 81

Özet

Makine öğrenmesi artık hayatımızın her alanında yer almaktadır. Hastalar için risk analizlerinden, alışveriş sitelerindeki kullanım ihtiyaç alışkanlıklarımıza, konuşma teknolojilerinden, finansal risklerin tespitine kadar birçok alanda görülebilmektedir. Günümüzde makine öğrenmesi teknolojisinin iki amacı vardır. Biri verileri geliştirilen modellere göre sınıflandırmak, diğeri bu modellere dayalı olarak gelecekteki sonuçlar için tahminlerde bulunmaktır. Makine öğrenmesi var olduğu alanlarda verimliliği artıran, işlem süresini kısaltan ve sistemi manuel ayarlardan kurtaran uygulamalar sunmaktadır. Aslen makine öğrenmesi uygulamalarında kısa sürede yüksek doğrulukta cevap veren modeller tercih edilir. Bu nedenle, model belirlenirken çok sayıda makine öğrenmesi algoritması çeşitli yönlerden kıyaslanıp en iyi sonuç veren algoritma ve bu algoritmanın parametreleri seçilir. Bu seçim işlemi bazen makine öğrenmesi uzmanları tarafından bile günlerce süren çalışmalar sonucunda yapılabilmektedir. Otomatik makine öğrenmesi (AutoML) yöntemleri optimal model belirleme çalışmalarının seyrini hızlandırma maksadıyla gündeme gelmiştir. Bu tez çalışmasında, en çok kullanımda olan AutoML yöntemlerinden TPOT, Hyperopt-Sklearn, Auto-Keras, Auto-Sklearn ve MLBox üzerinde durulmuş ve bu yöntemler deneysel testlere tabi tutulmuştur. Testlerde kullanılan 15 farklı veri seti UCI ve OpenML makine öğrenmesi deposu üzerinden seçilmiştir. Test işlemleri, TÜBİTAK ULAKBİM yüksek başarımlı hesaplama ve veri depolama alanı olan TRUBA altyapısında gerçekleştirilmiştir. Test edilen AutoML yöntemlerinden en iyi sınıflama sonuçlarına TPOT ile en kısa test sürelerine ise Hyperopt-Sklearn ile ulaşılmıştır. Tez çalışması sonucunda, makine öğrenmesi alanında çalışan araştırmacılara en iyi model seçiminde yol gösterilmiştir. AutoML yöntemleri ile en iyi model tespitinin hızlı bir şekilde gerçekleştirilmesi, bilişim sistemleri projelerinde doğruluğu ve hızlı tepki vermeyi artırma anlamında destek sağlayacaktır.

Özet (Çeviri)

Machine Learning is now a part of every aspect of our lives. It can be observed in many areas ranging from risk analyses for patients to our habit of consumption on shopping sites, from speech technologies to detection of financial risks. Nowadays however, machine learning has two main purposes. The first one is to classify data according to developed models and the other one is to make predictions on the possible future outcomes based on these models. This way, in the fields machine learning exists in, offers applications that increase efficiency, reduces processing time and saves the system from manual settings. To be true, models that give a high accuracy in a short time are preferred in machine learning applications. For that, when determining the model, many machine learning algorithms are compared in various aspects and the algorithm with the best results and the parameters of this algorithm are selected. This process of selecting can span to days of work, even when done by machine learning experts. Because of that, Automatic Machine Learning (hereinafter referred to as AutoML) methods to help accelerate this process of selecting the optimal model have been brought up to conversation. This thesis focuses on the most used AutoML methods such as TPOT, Hyperopt-Sklearn, Auto-Keras, Auto-Sklearn and MLBox and will subject them to tests. The 15 different datasets used in these tests were selected from the UCI and OpenML machine learning repositories and the tests were carried out on the TRUBA infrastructure, TUBITAK ULAKBIM's high-performance computing and data storage area. Among the tested AutoML methods, TPOT and Hyperopt-Sklearn had the best classification results and the shortest test times, respectively. As a result of this study, researchers are guided in choosing the best model. The AutoML methods will help with a fast detection of the best model and it will provide assistance in increasing accuracy and a fast reaction in information system projects.

Benzer Tezler

  1. Omik verilerinde otomatik makine öğrenimi algoritmalarının performansının değerlendirilmesi

    Performance evaluation of automated machine learning algorithmsin omics data

    MELTEM ÜNLÜSAVURAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    BiyoistatistikErciyes Üniversitesi

    Biyoistatistik Ana Bilim Dalı

    DOÇ. DR. GÖKMEN ZARARSIZ

  2. Kestirimci bakım sistemlerinde veri artırma yöntemlerinin geliştirilmesi ve bir uygulaması

    Development of data augmentation methods for predictive maintenance systems and an application

    SENA KALAY

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEskişehir Osmangazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ EYÜP ÇİNAR

    PROF. DR. İNCİ SARIÇİÇEK

  3. Fake news detection via automated deep learning

    Başlık çevirisi yok

    YASİR ABDULKAREEM JAMAL JAMAL

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAltınbaş Üniversitesi

    Bilişim Teknolojileri Ana Bilim Dalı

    PROF. DR. OSMAN NURİ UÇAN

  4. Öğrencilerin akademik performanslarının veri madenciliği teknikleri ile analizi

    Analysis of students' academic performance using data mining techniques

    SEVDA AGHALAROVA

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEskişehir Osmangazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ŞAHİN IŞIK

  5. Building outlier detection framework by using automated machine learning methods

    Otomatik makine öğrenimi yöntemlerini kullanarak anomali tespit çerçevesi oluşturma

    MUSTAFA KURTOĞLU

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGalatasaray Üniversitesi

    Akıllı Sistemler Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ AHMET TEOMAN NASKALİ