Geri Dön

İkili lojistik regresyon analizinde aykırı değer belirleme yöntemlerinin karşılaştırmalı olarak incelenmesi

Comparative examination of outlier detection methods in binary logistics regression analysis

  1. Tez No: 794371
  2. Yazar: MELİS ÇELİK GÜNEY
  3. Danışmanlar: PROF. DR. GÖKHAN TAMER KAYAALP
  4. Tez Türü: Doktora
  5. Konular: Ziraat, Agriculture
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: Türkçe
  9. Üniversite: Çukurova Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Zootekni Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 87

Özet

Bu tez çalışmasında, aykırı değer belirleme yöntemlerinden istatistik tabanlı, yakınlık tabanlı, kümeleme tabanlı, sapma tabanlı ve yalıtım tabanlı aykırı değer belirleme yöntemleri karşılaştırılmıştır. R yazılımı ile standart normal dağılıma sahip bir simülasyon yapılmıştır. Üretilen veri setinin örnek büyüklüğü 3000 olarak seçilmiştir. 3 bağımsız 1 bağımlı değişkene sahip iki kategorili lojistik regresyona uygun bir veri seti üretilmiştir. Yöntemleri karşılaştırmak amacıyla veri setine 30 adet aykırı değer eklenerek veri modifiye edilmiştir. Çalışmanın sonucunda, yalıtım tabanlı aykırı değer belirleme yöntemlerinden iForest algoritması, eklenen tüm aykırı değerleri bulmuştur ve performansı en yüksek çıkan algoritma olduğu görülmüştür. Gerçek bir veri setinde de iForest algoritması kullanarak aykırı değerler belirlenmiştir. Ayrıca hem yapay veri de hem de gerçek veride aykırı değer içeren ve içermeyen veri setlerinde model tahmin edilmiştir. Tahmin edilen modelin uyumunun iyiliği ve yeterlilik ölçütleri incelenmiştir. Böylelikle aykırı değerlerin modele etkisi saptanmıştır.

Özet (Çeviri)

In this thesis, statistical based, proximity based, cluster based, deviation based and isolation based outlier detection methods were compared. The data set was simulated to have the standard normal distribution in R. The sample size of the data set was selected as 3000. The data set suitable for binary logistic regression with 3 independent and 1 dependent variable were produced. In order to compare the methods, the data was modified by adding 30 outliers to the data set. As a result of the study, the iForest algorithm from isolation based outlier detection methods has found all the added outliers and has the highest performance. In a real data set, outliers were determined using the iForest algorithm. In addition, the model was estimated in both artificial and real data sets for all observations and without outliers. The goodness of fit and adequacy of the model were examined. Thus, the effect of outliers on the model was determined.

Benzer Tezler

  1. Fake news classification using machine learning and deep learning approaches

    Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması

    SAJA ABDULHALEEM MAHMOOD AL-OBAIDI

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR

  2. Besinsel liflere bağlı biyoaktif maddelerin antioksidan kapasitesi ve rejenerasyon davranışının quencher metoduyla belirlenmesi

    Determination of antioxidant capacity and regeneration behaviour of bioactive materials bound to dietary fibers with quencher procedure

    ECEM EVRİM ÇELİK

    Yüksek Lisans

    Türkçe

    Türkçe

    2013

    Gıda MühendisliğiHacettepe Üniversitesi

    Gıda Mühendisliği Ana Bilim Dalı

    PROF. DR. VURAL GÖKMEN

  3. Identification and characterization of a new mosquitocidal Bacillus sphaericus and its toxin proteins

    Sivrisinek öldürücü yeni bir suş olan Bacillus sphaericus ve toksin proteinlerinin tanımlanması ve karakterizasyonu

    FATİH ÇAKAR

    Yüksek Lisans

    İngilizce

    İngilizce

    2014

    BiyoteknolojiYeditepe Üniversitesi

    Biyoteknoloji Ana Bilim Dalı

    PROF. DR. FİKRETTİN ŞAHİN

  4. Septum deviasyonlu hastaların septoplasti operasyonu öncesi ve sonrası akustik ses analizi ile değlerlendirilmesi

    Effects of septoplasty on speech and voice

    ELTAF AYÇA ÖZBAL KOÇ

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2008

    Kulak Burun ve BoğazSağlık Bakanlığı

    Kulak Burun Boğaz ve Baş-Boyun Cerrahisi Ana Bilim Dalı

    DOÇ. DR. İBRAHİM ERCAN

  5. Endoskopik olarak normal görünümlü terminal ileum biyopsilerinin tanısal önemi

    Başlık çevirisi yok

    ALİ RIZA KÖKSAL

    Tıpta Yan Dal Uzmanlık

    Türkçe

    Türkçe

    2012

    GastroenterolojiSağlık Bakanlığı

    Gastroenteroloji Ana Bilim Dalı

    DOÇ. DR. CANAN ALKIM