İkili lojistik regresyon analizinde aykırı değer belirleme yöntemlerinin karşılaştırmalı olarak incelenmesi
Comparative examination of outlier detection methods in binary logistics regression analysis
- Tez No: 794371
- Danışmanlar: PROF. DR. GÖKHAN TAMER KAYAALP
- Tez Türü: Doktora
- Konular: Ziraat, Agriculture
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: Türkçe
- Üniversite: Çukurova Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Zootekni Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 87
Özet
Bu tez çalışmasında, aykırı değer belirleme yöntemlerinden istatistik tabanlı, yakınlık tabanlı, kümeleme tabanlı, sapma tabanlı ve yalıtım tabanlı aykırı değer belirleme yöntemleri karşılaştırılmıştır. R yazılımı ile standart normal dağılıma sahip bir simülasyon yapılmıştır. Üretilen veri setinin örnek büyüklüğü 3000 olarak seçilmiştir. 3 bağımsız 1 bağımlı değişkene sahip iki kategorili lojistik regresyona uygun bir veri seti üretilmiştir. Yöntemleri karşılaştırmak amacıyla veri setine 30 adet aykırı değer eklenerek veri modifiye edilmiştir. Çalışmanın sonucunda, yalıtım tabanlı aykırı değer belirleme yöntemlerinden iForest algoritması, eklenen tüm aykırı değerleri bulmuştur ve performansı en yüksek çıkan algoritma olduğu görülmüştür. Gerçek bir veri setinde de iForest algoritması kullanarak aykırı değerler belirlenmiştir. Ayrıca hem yapay veri de hem de gerçek veride aykırı değer içeren ve içermeyen veri setlerinde model tahmin edilmiştir. Tahmin edilen modelin uyumunun iyiliği ve yeterlilik ölçütleri incelenmiştir. Böylelikle aykırı değerlerin modele etkisi saptanmıştır.
Özet (Çeviri)
In this thesis, statistical based, proximity based, cluster based, deviation based and isolation based outlier detection methods were compared. The data set was simulated to have the standard normal distribution in R. The sample size of the data set was selected as 3000. The data set suitable for binary logistic regression with 3 independent and 1 dependent variable were produced. In order to compare the methods, the data was modified by adding 30 outliers to the data set. As a result of the study, the iForest algorithm from isolation based outlier detection methods has found all the added outliers and has the highest performance. In a real data set, outliers were determined using the iForest algorithm. In addition, the model was estimated in both artificial and real data sets for all observations and without outliers. The goodness of fit and adequacy of the model were examined. Thus, the effect of outliers on the model was determined.
Benzer Tezler
- Fake news classification using machine learning and deep learning approaches
Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması
SAJA ABDULHALEEM MAHMOOD AL-OBAIDI
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR
- İkili lojistik regresyonda robust yöntemler
Robust methods in binary logistics regression
EBRU GÜNDOĞAN AŞIK
Doktora
Türkçe
2023
İstatistikKaradeniz Teknik Üniversitesiİstatistik ve Bilgisayar Bilimleri Ana Bilim Dalı
PROF. DR. ZAFER KÜÇÜK
PROF. DR. ARZU ALTIN YAVUZ
- Lojistik elastik net yönteminin alternatif yöntemlerle karşılaştırılması
Comparison of the logistic elastic net method with alternative methods
SEVİM SİMGE UYSAL
Yüksek Lisans
Türkçe
2020
İstatistikEskişehir Osmangazi Üniversitesiİstatistik Ana Bilim Dalı
PROF. DR. ARZU ALTIN YAVUZ
- Lojistik regresyon analizi ve diş hekimliğinde bir uygulama
Studies of the logistic regression analysis and its application on the dentistry
SİBEL COŞKUN
- Lojistik regresyon analizinin incelenmesi ve tıpta bir uygulaması
Studies of the logistic regression analysis and its application on the medical data
ATİLLA HALİL ELHAN
Yüksek Lisans
Türkçe
1997
Tıbbi BiyolojiAnkara ÜniversitesiBiyoistatistik Ana Bilim Dalı
PROF. DR. YILDIR ATAKURT