Geri Dön

Veri madenciliğinde lojistik regresyon modellerinin incelenmesi

Investigation of logistics regression models in data mining

  1. Tez No: 744738
  2. Yazar: RECEP ÖZSÜRÜNÇ
  3. Danışmanlar: PROF. DR. ÇİĞDEM ARICIGİL ÇİLAN
  4. Tez Türü: Doktora
  5. Konular: İşletme, Business Administration
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: Türkçe
  9. Üniversite: İstanbul Üniversitesi
  10. Enstitü: Sosyal Bilimler Enstitüsü
  11. Ana Bilim Dalı: İşletme Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 208

Özet

Veri madenciliğinde, değişkenler arasındaki neden-sonuç ilişkilerinin ortaya çıkarılması ve bu ilişkilerin modellenmesinde birçok yöntem kullanılmaktadır. Regresyon Modelleri, Veri Madenciliğinde kullanılan bu yöntemlerin önemli bir kısmını oluşturmaktadır. Lojistik regresyon modelleri ise bağımlı değişkenin iki veya ikiden fazla gruplu kategorik bir değişken olduğu durumlarda yaygın olarak kullanılan modellerdendir. Bu çalışmada Lojistik Regresyon Analizi; İkili, Multinominal ve Multiordinal Lojistik Regresyon Modelleri ele alınarak açık kaynak kodlu R programlama Dili ile tahmin edilmiş ve sonuçlar yorumlanmıştır. Model tahmini öncesinde; verilerin temizlenmesi, bütünleştirilmesi, indirgenmesi ve dönüştürülmesi ile temel“Veri Madenciliği Analiz Öncesi Hazırlık Süreci”tamamlanmıştır. Veri tipine göre belirlenen Lojistik Regresyon Modeli'nin varsayımları sağlayıp sağlamadığı test edilmiştir. İkili, Multinominal ve Multiordinal modeller; tek bağımsız değişkenli (sürekli, iki kategorili nitel ve ikiden fazla kategorili nitel) ve en az iki bağımsız değişkenli (sürekli, iki kategorili nitel ve ikiden fazla kategorili nitel) modeller yani tüm mümkün Lojistik Regresyon Modelleri tahmin edilmiş ve detaylı olarak yorumlanmıştır. Görselleştirilmesi mümkün sonuçlar görsel olarak sunulmuş ve böylece analiz sonuçlarının daha anlaşılır olması sağlanmıştır. Analiz sürecinde R paketlerinde yer alan kodlar ile ulaşılamayan bazı sonuçlar yeni kodlar yazılarak elde edilmiştir. Kısaca bu çalışmanın temel amacı; Lojistik Regresyon Analizi uygulamalarında veri tipine uygun modelin seçilmesi, seçilen modelin teorisi temel alınarak, Veri Madenciliği Analiz Öncesi Ön Hazırlık Süreçlerinin uygulanması, modelin R programlama dilinde tahmin edilmesi ve sonuçlarının yorumlanmasıdır.

Özet (Çeviri)

In data mining, many methods are used to reveal cause-effect relationships between variables and to model these relationships. Regression Models constitute an important part of these methods used in Data Mining. Logistic regression models, on the other hand, are widely used when the dependent variable is a categorical variable with two or more groups. In this study, Logistic Regression Analysis; By considering Binary, Multinomial, and Multiordinal Logistic Regression Models, were analyzed with open source R programming language and the results were interpreted. Before model estimation; The basic“Data Mining Pre-Analysis Preparation Process”was completed with the cleaning, integration, reduction, and transformation of the data. It was tested whether the Logistic Regression Model, which was determined according to the data type, provided the assumptions. Binary, Multinomial and Multiordinal models; Models with one independent variable (continuous, two-category qualitative, and more than two-category qualitative) and at least two independent variables (continuous, two-category qualitative, and more than two-categorical qualitative) models, that is, all possible Logistic Regression Models, were estimated and interpreted in detail. The results that can be visualized are presented visually, thus making the analysis results more understandable. During the analysis process, some results that could not be reached with the codes in the R packages were obtained by writing new codes. Briefly, the main purpose of this study is; In Logistic Regression Analysis applications, choose the suitable model for the data type, apply the Data Mining Pre-Analysis Preparation Processes based on the theory of the selected model, estimating the model in the R programming language and interpreting the results.

Benzer Tezler

  1. Destek vektör makineleri yardımıyla tüketici kredilerinin sınıflandırılması

    Classifying consumer loans by means of support vector machines

    KAYAHAN KAYA

    Yüksek Lisans

    Türkçe

    Türkçe

    2016

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    İşletme Mühendisliği Ana Bilim Dalı

    PROF. DR. FERHAN ÇEBİ

  2. Veri madenciliğinde sınıflandırma yöntemlerinin karşılaştırılması 'bankacılık müşteri veri tabanı üzerinde bir uygulama'

    Comparison of classification techniques in data mining 'an application in banking customer database'

    ÖZGÜR ÇAKIR

    Doktora

    Türkçe

    Türkçe

    2008

    İşletmeMarmara Üniversitesi

    İşletme Bölümü

    PROF. DR. İSMAİL HAKKI ARMUTLULU

  3. Veri madenciliği algoritmaları karşılaştırılması

    Comparison of data mining algorithms

    CENGİZ COŞKUN

    Yüksek Lisans

    Türkçe

    Türkçe

    2010

    MatematikDicle Üniversitesi

    Matematik Ana Bilim Dalı

    YRD. DOÇ. DR. ABDULLAH BAYKAL

  4. Müşteri kayıp analizi: Hava yolu sektöründe bir uygulama

    Customer churn analysis: An application in airline industry

    FATMA KAPTAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Sivil Havacılıkİstanbul Teknik Üniversitesi

    İşletme Mühendisliği Ana Bilim Dalı

    DOÇ. DR. NİHAN YILDIRIM

  5. Eksik değerleri en olası değer ile doldurmanın sınıflandırma algoritmaları üzerinden karşılaştırılması

    Comparison of filling missing values with the best fit over classification algorithms

    ÇAĞDAŞ KEKLİK

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBeykent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. CENGİZ ÖRENCİK