Geri Dön

Veri odaklı karar almada makine öğrenmesi algoritmaları

Machine learning algorithms in data-driven decision making

  1. Tez No: 887110
  2. Yazar: MUHAMMED KARA
  3. Danışmanlar: PROF. DR. YÜKSEL TERZİ
  4. Tez Türü: Doktora
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: Ondokuz Mayıs Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 86

Özet

Bu tezde, makine öğrenmesi algoritmalarının temel prensipleri, uygulama alanları ve performans karşılaştırmaları ele alınmıştır. Makine öğrenmesi, veri setlerinden öğrenerek tahmin ve karar verme süreçlerini otomatikleştiren algoritmaların genel adıdır. Tezde; tahmin, sınıflandırma ve kümeleme olmak üzere üç ana kategoride makine öğrenmesi yöntemleri incelenmiştir. Tezin odak noktası, veri odaklı karar alırken makine öğrenme yöntemlerinin istatistiksel açıdan analiz edilmesi ve bu analizin metodolojileridir. Ayrıca, bu analiz metodolojilerinin bir uygulaması olarak müşteri terk modellemesi yapılmış ve elde edilen sonuçların istatistiksel olarak anlamlılığı belirtilmiştir.Tezin yöntemi karma bir yaklaşıma dayanmaktadır ve literatür taraması, içerik analizi ve nitel araştırma adımlarını içermektedir. Literatür taraması ve benzer çalışmaların incelenmesi, yapılan analizlerin ve uygulamaların temelini oluşturmuştur. Araç fiyatlarının tahmin edilmesi amacıyla“Automobile Price”veri seti kullanılmıştır. Veri seti, araçların çeşitli fiziksel, performans ve demografik özelliklerini içermektedir. Lineer Regresyon, Ridge Regresyon ve Lasso Regresyon algoritmalarıyla veri analiz edilmiştir. Orange programı kullanılarak yapılan analizlerde üç algoritma için de R-kare değeri 0,967 bulunmuş, Azure ML platformunda ise Lineer Regresyon için R-kare değeri 0,96 olarak elde edilmiştir. Bu sonuçlar, modellerin yüksek açıklayıcılık düzeyine sahip olduğunu göstermektedir. Diğer bir örnek, çalışmada kullanılan WACustomerChurn veri seti tanıtılmıştır. Bu veri seti, müşteri terk modellemesi için kullanılan 21 değişken ve 7043 kayıttan oluşmaktadır. Veri setinde yer alan değişkenlerin işlevleri belirtilmiştir. Ayrıca, müşteri terk modellemesi için Spark platformunda Büyük Veri analitiği yapılmıştır. Python programlama dili kullanılarak Spark Mlib kütüphanelerinde bulunan makine öğrenmesi algoritmaları uygulanmış ve müşterilerin bizi terk etme durumları modellemeye çalışılmıştır. Bu çalışma, Büyük Veri analitiği ve müşteri terk modellemesi alanında yapılan araştırmalara yeni bir bakış açısı sunmayı amaçlamaktadır. Son olarak, cilt kanseri lezyon görüntüleri makine öğrenimine hazır hale getirilmiştir. Inception V3 modellemeyle elde edilen sayısal veriler makine öğrenmesi algoritmalarıyla sınıflandırılmış ve kümelenmiştir. Bu iş için Orange programından yararlanılmıştır. Algoritmalardan elde edilen bulgular görsel olarak gösterilmiştir. Görseller açıklamalı olarak anlatılmıştır. Sonuç ve tartışma kısmında cilt kanseri görüntüleri teşhisinde algoritmaların başarısı belirtilip tartışılmıştır.

Özet (Çeviri)

In this thesis, the fundamental principles, application areas, and performance comparisons of machine learning algorithms are discussed. Machine learning is a general term for algorithms that automate prediction and decision-making processes by learning from datasets. The thesis examines three main categories of machine learning methods: prediction, classification, and clustering. The focus of the thesis is the statistical analysis of machine learning methods when making data-driven decisions and the methodologies of this analysis. Additionally, customer churn modeling was conducted as an application of these analysis methodologies, and the statistical significance of the results was noted. The methodology of the thesis is based on a mixed approach, including literature review, content analysis, and qualitative research steps. The review of literature and similar studies formed the foundation of the analyses and applications conducted. The“automobile price”data set was used to estimate vehicle prices. The dataset includes various physical, performance, and demographic features of cars. The data were analyzed using Linear Regression, Ridge Regression, and Lasso Regression algorithms. Analyses conducted with Orange software found an R-squared value of 0.967 for all three algorithms, while an R-squared value of 0.96 was obtained for Linear Regression on the Azure ML platform. These results indicate that the models have a high level of explanatory power. Additionally, Another example is the WACustomerChurn dataset used in the study was introduced. This dataset consists of 21 variables and 7043 records used for customer churn modeling. The functions of the variables in the dataset were specified. big data analytics was performed on the Spark platform for customer churn modeling. Machine learning algorithms from the Spark Mlib libraries were applied using the Python programming language to model the situations in which customers might leave us. This study aims to offer a new perspective on research in the fields of big data analytics and customer churn modeling. Finally, skin cancer lesion images were prepared for machine learning. Numerical data obtained through Inception V3 modeling were classified and clustered using machine learning algorithms. Orange software was utilized for this task. The findings from the algorithms were visually displayed, with explanations provided. In the results and discussion section, the success of the algorithms in diagnosing skin cancer images was discussed.

Benzer Tezler

  1. Origin and destination based demand of continuous pricing for airline revenue management

    Havayolu gelir yönetimi için sürekli fiyatlandırma yapısında başlangıç ve varış yerine dayalı talep tahmini

    MEHMET MELİH DEĞİRMENCİ

    Doktora

    İngilizce

    İngilizce

    2023

    Ekonomiİstanbul Teknik Üniversitesi

    İktisat Ana Bilim Dalı

    DOÇ. DR. RESUL AYDEMİR

  2. Prediction of COVID 19 disease using chest X-ray images based on deep learning

    Derin öğrenmeye dayalı göğüs röntgen görüntüleri kullanarak COVID 19 hastalığının tahmini

    ISMAEL ABDULLAH MOHAMMED AL-RAWE

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ADEM TEKEREK

  3. Evaluating the performance of CNN-based algorithms for building extraction in comparison with classical image processing methods

    CNN tabanlı algoritmaların klasik görüntü işleme yöntemleri ile kıyaslanarak bina çıkarımı performansının değerlendirilmesi

    ZEINAB BAYAT

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    İnşaat MühendisliğiHacettepe Üniversitesi

    İnşaat Mühendisliği Ana Bilim Dalı

    DOÇ. DR. BURCU GÜLDÜR ERKAL

  4. A psychological assessment model on the commercial maritime transport sector

    Ticari deniz taşımacılığı sektörüne ilişkin bir psikolojik değerlendirme modeli

    CENK AY

    Doktora

    İngilizce

    İngilizce

    2024

    Denizcilikİstanbul Teknik Üniversitesi

    Deniz Ulaştırma Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ELİF BAL BEŞİKÇİ

  5. A challenge to copyright: Text and data mining

    Telif hukukunda metin ve veri madenciliği

    ESMA MUHEYNE DOĞAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Hukukİstanbul Medeniyet Üniversitesi

    Özel Hukuk Ana Bilim Dalı

    DOÇ. DR. CAHİT SULUK