Geri Dön

İkili lojistik regresyon analizinde aykırı değer belirleme yöntemlerinin karşılaştırmalı olarak incelenmesi

Comparative examination of outlier detection methods in binary logistics regression analysis

  1. Tez No: 794371
  2. Yazar: MELİS ÇELİK GÜNEY
  3. Danışmanlar: PROF. DR. GÖKHAN TAMER KAYAALP
  4. Tez Türü: Doktora
  5. Konular: Ziraat, Agriculture
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: Türkçe
  9. Üniversite: Çukurova Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Zootekni Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 87

Özet

Bu tez çalışmasında, aykırı değer belirleme yöntemlerinden istatistik tabanlı, yakınlık tabanlı, kümeleme tabanlı, sapma tabanlı ve yalıtım tabanlı aykırı değer belirleme yöntemleri karşılaştırılmıştır. R yazılımı ile standart normal dağılıma sahip bir simülasyon yapılmıştır. Üretilen veri setinin örnek büyüklüğü 3000 olarak seçilmiştir. 3 bağımsız 1 bağımlı değişkene sahip iki kategorili lojistik regresyona uygun bir veri seti üretilmiştir. Yöntemleri karşılaştırmak amacıyla veri setine 30 adet aykırı değer eklenerek veri modifiye edilmiştir. Çalışmanın sonucunda, yalıtım tabanlı aykırı değer belirleme yöntemlerinden iForest algoritması, eklenen tüm aykırı değerleri bulmuştur ve performansı en yüksek çıkan algoritma olduğu görülmüştür. Gerçek bir veri setinde de iForest algoritması kullanarak aykırı değerler belirlenmiştir. Ayrıca hem yapay veri de hem de gerçek veride aykırı değer içeren ve içermeyen veri setlerinde model tahmin edilmiştir. Tahmin edilen modelin uyumunun iyiliği ve yeterlilik ölçütleri incelenmiştir. Böylelikle aykırı değerlerin modele etkisi saptanmıştır.

Özet (Çeviri)

In this thesis, statistical based, proximity based, cluster based, deviation based and isolation based outlier detection methods were compared. The data set was simulated to have the standard normal distribution in R. The sample size of the data set was selected as 3000. The data set suitable for binary logistic regression with 3 independent and 1 dependent variable were produced. In order to compare the methods, the data was modified by adding 30 outliers to the data set. As a result of the study, the iForest algorithm from isolation based outlier detection methods has found all the added outliers and has the highest performance. In a real data set, outliers were determined using the iForest algorithm. In addition, the model was estimated in both artificial and real data sets for all observations and without outliers. The goodness of fit and adequacy of the model were examined. Thus, the effect of outliers on the model was determined.

Benzer Tezler

  1. Fake news classification using machine learning and deep learning approaches

    Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması

    SAJA ABDULHALEEM MAHMOOD AL-OBAIDI

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR

  2. İkili lojistik regresyonda robust yöntemler

    Robust methods in binary logistics regression

    EBRU GÜNDOĞAN AŞIK

    Doktora

    Türkçe

    Türkçe

    2023

    İstatistikKaradeniz Teknik Üniversitesi

    İstatistik ve Bilgisayar Bilimleri Ana Bilim Dalı

    PROF. DR. ZAFER KÜÇÜK

    PROF. DR. ARZU ALTIN YAVUZ

  3. Lojistik elastik net yönteminin alternatif yöntemlerle karşılaştırılması

    Comparison of the logistic elastic net method with alternative methods

    SEVİM SİMGE UYSAL

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    İstatistikEskişehir Osmangazi Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF. DR. ARZU ALTIN YAVUZ

  4. Lojistik regresyon analizi ve diş hekimliğinde bir uygulama

    Studies of the logistic regression analysis and its application on the dentistry

    SİBEL COŞKUN

    Yüksek Lisans

    Türkçe

    Türkçe

    2004

    İşletmeCumhuriyet Üniversitesi

    İşletme Ana Bilim Dalı

    DOÇ. DR. MAHMUT KARTAL

  5. Lojistik regresyon analizinin incelenmesi ve tıpta bir uygulaması

    Studies of the logistic regression analysis and its application on the medical data

    ATİLLA HALİL ELHAN

    Yüksek Lisans

    Türkçe

    Türkçe

    1997

    Tıbbi BiyolojiAnkara Üniversitesi

    Biyoistatistik Ana Bilim Dalı

    PROF. DR. YILDIR ATAKURT