İkili lojistik regresyon analizinde aykırı değer belirleme yöntemlerinin karşılaştırmalı olarak incelenmesi
Comparative examination of outlier detection methods in binary logistics regression analysis
- Tez No: 794371
- Danışmanlar: PROF. DR. GÖKHAN TAMER KAYAALP
- Tez Türü: Doktora
- Konular: Ziraat, Agriculture
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: Türkçe
- Üniversite: Çukurova Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Zootekni Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 87
Özet
Bu tez çalışmasında, aykırı değer belirleme yöntemlerinden istatistik tabanlı, yakınlık tabanlı, kümeleme tabanlı, sapma tabanlı ve yalıtım tabanlı aykırı değer belirleme yöntemleri karşılaştırılmıştır. R yazılımı ile standart normal dağılıma sahip bir simülasyon yapılmıştır. Üretilen veri setinin örnek büyüklüğü 3000 olarak seçilmiştir. 3 bağımsız 1 bağımlı değişkene sahip iki kategorili lojistik regresyona uygun bir veri seti üretilmiştir. Yöntemleri karşılaştırmak amacıyla veri setine 30 adet aykırı değer eklenerek veri modifiye edilmiştir. Çalışmanın sonucunda, yalıtım tabanlı aykırı değer belirleme yöntemlerinden iForest algoritması, eklenen tüm aykırı değerleri bulmuştur ve performansı en yüksek çıkan algoritma olduğu görülmüştür. Gerçek bir veri setinde de iForest algoritması kullanarak aykırı değerler belirlenmiştir. Ayrıca hem yapay veri de hem de gerçek veride aykırı değer içeren ve içermeyen veri setlerinde model tahmin edilmiştir. Tahmin edilen modelin uyumunun iyiliği ve yeterlilik ölçütleri incelenmiştir. Böylelikle aykırı değerlerin modele etkisi saptanmıştır.
Özet (Çeviri)
In this thesis, statistical based, proximity based, cluster based, deviation based and isolation based outlier detection methods were compared. The data set was simulated to have the standard normal distribution in R. The sample size of the data set was selected as 3000. The data set suitable for binary logistic regression with 3 independent and 1 dependent variable were produced. In order to compare the methods, the data was modified by adding 30 outliers to the data set. As a result of the study, the iForest algorithm from isolation based outlier detection methods has found all the added outliers and has the highest performance. In a real data set, outliers were determined using the iForest algorithm. In addition, the model was estimated in both artificial and real data sets for all observations and without outliers. The goodness of fit and adequacy of the model were examined. Thus, the effect of outliers on the model was determined.
Benzer Tezler
- Fake news classification using machine learning and deep learning approaches
Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması
SAJA ABDULHALEEM MAHMOOD AL-OBAIDI
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR
- Besinsel liflere bağlı biyoaktif maddelerin antioksidan kapasitesi ve rejenerasyon davranışının quencher metoduyla belirlenmesi
Determination of antioxidant capacity and regeneration behaviour of bioactive materials bound to dietary fibers with quencher procedure
ECEM EVRİM ÇELİK
Yüksek Lisans
Türkçe
2013
Gıda MühendisliğiHacettepe ÜniversitesiGıda Mühendisliği Ana Bilim Dalı
PROF. DR. VURAL GÖKMEN
- Identification and characterization of a new mosquitocidal Bacillus sphaericus and its toxin proteins
Sivrisinek öldürücü yeni bir suş olan Bacillus sphaericus ve toksin proteinlerinin tanımlanması ve karakterizasyonu
FATİH ÇAKAR
Yüksek Lisans
İngilizce
2014
BiyoteknolojiYeditepe ÜniversitesiBiyoteknoloji Ana Bilim Dalı
PROF. DR. FİKRETTİN ŞAHİN
- Septum deviasyonlu hastaların septoplasti operasyonu öncesi ve sonrası akustik ses analizi ile değlerlendirilmesi
Effects of septoplasty on speech and voice
ELTAF AYÇA ÖZBAL KOÇ
Tıpta Uzmanlık
Türkçe
2008
Kulak Burun ve BoğazSağlık BakanlığıKulak Burun Boğaz ve Baş-Boyun Cerrahisi Ana Bilim Dalı
DOÇ. DR. İBRAHİM ERCAN
- Endoskopik olarak normal görünümlü terminal ileum biyopsilerinin tanısal önemi
Başlık çevirisi yok
ALİ RIZA KÖKSAL
Tıpta Yan Dal Uzmanlık
Türkçe
2012
GastroenterolojiSağlık BakanlığıGastroenteroloji Ana Bilim Dalı
DOÇ. DR. CANAN ALKIM