Veri madenciliğinde lojistik regresyon modellerinin incelenmesi
Investigation of logistics regression models in data mining
- Tez No: 744738
- Danışmanlar: PROF. DR. ÇİĞDEM ARICIGİL ÇİLAN
- Tez Türü: Doktora
- Konular: İşletme, Business Administration
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: Türkçe
- Üniversite: İstanbul Üniversitesi
- Enstitü: Sosyal Bilimler Enstitüsü
- Ana Bilim Dalı: İşletme Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 208
Özet
Veri madenciliğinde, değişkenler arasındaki neden-sonuç ilişkilerinin ortaya çıkarılması ve bu ilişkilerin modellenmesinde birçok yöntem kullanılmaktadır. Regresyon Modelleri, Veri Madenciliğinde kullanılan bu yöntemlerin önemli bir kısmını oluşturmaktadır. Lojistik regresyon modelleri ise bağımlı değişkenin iki veya ikiden fazla gruplu kategorik bir değişken olduğu durumlarda yaygın olarak kullanılan modellerdendir. Bu çalışmada Lojistik Regresyon Analizi; İkili, Multinominal ve Multiordinal Lojistik Regresyon Modelleri ele alınarak açık kaynak kodlu R programlama Dili ile tahmin edilmiş ve sonuçlar yorumlanmıştır. Model tahmini öncesinde; verilerin temizlenmesi, bütünleştirilmesi, indirgenmesi ve dönüştürülmesi ile temel“Veri Madenciliği Analiz Öncesi Hazırlık Süreci”tamamlanmıştır. Veri tipine göre belirlenen Lojistik Regresyon Modeli'nin varsayımları sağlayıp sağlamadığı test edilmiştir. İkili, Multinominal ve Multiordinal modeller; tek bağımsız değişkenli (sürekli, iki kategorili nitel ve ikiden fazla kategorili nitel) ve en az iki bağımsız değişkenli (sürekli, iki kategorili nitel ve ikiden fazla kategorili nitel) modeller yani tüm mümkün Lojistik Regresyon Modelleri tahmin edilmiş ve detaylı olarak yorumlanmıştır. Görselleştirilmesi mümkün sonuçlar görsel olarak sunulmuş ve böylece analiz sonuçlarının daha anlaşılır olması sağlanmıştır. Analiz sürecinde R paketlerinde yer alan kodlar ile ulaşılamayan bazı sonuçlar yeni kodlar yazılarak elde edilmiştir. Kısaca bu çalışmanın temel amacı; Lojistik Regresyon Analizi uygulamalarında veri tipine uygun modelin seçilmesi, seçilen modelin teorisi temel alınarak, Veri Madenciliği Analiz Öncesi Ön Hazırlık Süreçlerinin uygulanması, modelin R programlama dilinde tahmin edilmesi ve sonuçlarının yorumlanmasıdır.
Özet (Çeviri)
In data mining, many methods are used to reveal cause-effect relationships between variables and to model these relationships. Regression Models constitute an important part of these methods used in Data Mining. Logistic regression models, on the other hand, are widely used when the dependent variable is a categorical variable with two or more groups. In this study, Logistic Regression Analysis; By considering Binary, Multinomial, and Multiordinal Logistic Regression Models, were analyzed with open source R programming language and the results were interpreted. Before model estimation; The basic“Data Mining Pre-Analysis Preparation Process”was completed with the cleaning, integration, reduction, and transformation of the data. It was tested whether the Logistic Regression Model, which was determined according to the data type, provided the assumptions. Binary, Multinomial and Multiordinal models; Models with one independent variable (continuous, two-category qualitative, and more than two-category qualitative) and at least two independent variables (continuous, two-category qualitative, and more than two-categorical qualitative) models, that is, all possible Logistic Regression Models, were estimated and interpreted in detail. The results that can be visualized are presented visually, thus making the analysis results more understandable. During the analysis process, some results that could not be reached with the codes in the R packages were obtained by writing new codes. Briefly, the main purpose of this study is; In Logistic Regression Analysis applications, choose the suitable model for the data type, apply the Data Mining Pre-Analysis Preparation Processes based on the theory of the selected model, estimating the model in the R programming language and interpreting the results.
Benzer Tezler
- Destek vektör makineleri yardımıyla tüketici kredilerinin sınıflandırılması
Classifying consumer loans by means of support vector machines
KAYAHAN KAYA
Yüksek Lisans
Türkçe
2016
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesiİşletme Mühendisliği Ana Bilim Dalı
PROF. DR. FERHAN ÇEBİ
- Veri madenciliğinde sınıflandırma yöntemlerinin karşılaştırılması 'bankacılık müşteri veri tabanı üzerinde bir uygulama'
Comparison of classification techniques in data mining 'an application in banking customer database'
ÖZGÜR ÇAKIR
- Veri madenciliği algoritmaları karşılaştırılması
Comparison of data mining algorithms
CENGİZ COŞKUN
Yüksek Lisans
Türkçe
2010
MatematikDicle ÜniversitesiMatematik Ana Bilim Dalı
YRD. DOÇ. DR. ABDULLAH BAYKAL
- Müşteri kayıp analizi: Hava yolu sektöründe bir uygulama
Customer churn analysis: An application in airline industry
FATMA KAPTAN
Yüksek Lisans
Türkçe
2019
Sivil Havacılıkİstanbul Teknik Üniversitesiİşletme Mühendisliği Ana Bilim Dalı
DOÇ. DR. NİHAN YILDIRIM
- Eksik değerleri en olası değer ile doldurmanın sınıflandırma algoritmaları üzerinden karşılaştırılması
Comparison of filling missing values with the best fit over classification algorithms
ÇAĞDAŞ KEKLİK
Yüksek Lisans
Türkçe
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBeykent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. CENGİZ ÖRENCİK