Geri Dön

Kayıp değer atamasına bulanık kümeleme yaklaşımı

Fuzzy clustering approach to missing value imputation

  1. Tez No: 907347
  2. Yazar: ALEYNA KOL
  3. Danışmanlar: PROF. DR. GÜLHAYAT GÖLBAŞI ŞİMŞEK
  4. Tez Türü: Yüksek Lisans
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: Türkçe
  9. Üniversite: Yıldız Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: İstatistik Bilim Dalı
  13. Sayfa Sayısı: 59

Özet

Çalışmalarımızda yer alan veri setlerinde hücrelerde bulunan değerlerin gözlenememesi durumu eksik veri, kayıp veri veya tamamlanamamış veri olarak isimlendirilmektedir. Kayıp değerleri bulabilmek ve veri setlerindeki eksikleri tamamlayarak daha sağlıklı sonuçlara ulaşabilmek amaçlanmıştır. Eksik verileri tamamlamak için çeşitli kayıp veri tahmin etme yöntemleri bulunmaktadır. Bu çalışmada kayıp verileri tahmin etme yöntemlerine alternatif bir yöntem olarak bulanık c-ortalamalar yöntemi kullanılmıştır. Yöntemin eksik verilerin tamamlanmasında uygunluğu incelenmiştir. Bu çalışmada“Depresyon Anksiyete ve Stres Ölçekleri-21”(DASS-21) veri seti kullanılmıştır. DASS-21 veri setinden %1, %5, %10 ve %20 oranlarında rastgele veri kaybedilmiştir. Her veri seti için 100 tekrar yapılarak yöntemlerin performansları karşılaştırılmıştır. Bu çalışmada belirli küme sayılarına ayrılarak RMSE, MAE ve Cronbach alfa değerleri hesaplanmıştır. Veri setlerindeki kayıpların tahmin edilmesinde örneklem büyüklüğünün bir etkisinin olup olmadığını anlamak amacıyla tam veri seti yarıya indirilerek yapılan işlemler yeniden uygulanarak iki veri setinin sonuçları karşılaştırılmıştır. Bulanık C-Ortalamalar 1'den 11'e kadar küme sayıları artırılarak sonuçlar incelenmiştir. Çıkan değerlerin, sıklıkla kullanılan ortalama atama, medyan atama ve mod atama yöntemleri ile kıyaslanması yapılmıştır. Araştırmanın uygulaması R Studio programında gerçekleştirilmiştir.

Özet (Çeviri)

n the data sets in our studies, the situation where the values in the cell cannot be observed is called missing data, missing data or incomplete data. It is aimed to find missing values and reach more accurate results by completing the missing data in the data sets. There are various missing data estimation methods to complete missing data. In this study, the fuzzy c-means method was used as an alternative method to estimating missing data. The suitability of the method in completing missing data was examined.“Depression Anxiety and Stress Scales-21”(DASS-21) data set was used in this study. Random data was lost at rates of 1%, 5%, 10% and 20% from the DASS-21 data set. The performances of the methods were compared by performing 100 repetitions for each data set. In this study, RMSE, MAE and Cronbach's Alpha values were calculated by dividing into certain cluster numbers. In order to understand whether the sample size has an effect on estimating the losses in the data sets, the results of the two data sets were compared by halving the full data set and applying the operations again. Fuzzy C-Means the results were examined by increasing the number of clusters from 1 to 11. The resulting values were compared with the frequently used mean assignment, median assignment and mode assignment methods. The application of the research was carried out in the R Studio program.

Benzer Tezler

  1. Nicel birliktelik kurallarının bulanık mantık ve genetik algoritma ile otomatik keşfi

    Discovery of quantitative association rules with fuzzy logic and genetic algorithms

    KORKUT KORAY GÜNDOĞAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2003

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. YETKİN TATAR

  2. Havacılık sektöründe kaba küme temelli uçak arıza güvenilirliği tahmin modeli ve Türkiye uygulaması

    Rough cluster based aircraft failure reliability prediction model in aviation sector and its application in Turkey

    NURÇİN KAYA

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    Endüstri ve Endüstri MühendisliğiErciyes Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MİHRİMAH ÖZMEN

  3. Akdeniz iklim koşullarında pasif ev standartlarının uygulanabilirliğinin sinirsel bulanık mantık ile tahmini ve tasarım sürecine dahil edilmesi: Yarı olimpik kapalı havuz örneği

    Estimating the applicability of passive house standards in Mediterranean climate conditions with neuro fuzzy logic and its including into the design process: A case of a semi-olympic indoor pool

    SETENAY UÇAR

    Doktora

    Türkçe

    Türkçe

    2023

    MimarlıkAkdeniz Üniversitesi

    Mimarlık Ana Bilim Dalı

    PROF. DR. İLKNUR AKINER

  4. Sağlık işletmeleri için teletıp hizmet tasarımı: Bulanık kalite fonksiyon göçerimi uygulaması

    Teletıp service design for healthcare enterprises: Application of fuzzy quality function deployment

    MEVLÜT SERHAT ALTAŞ

    Doktora

    Türkçe

    Türkçe

    2022

    Sağlık Kurumları Yönetimiİstanbul Sabahattin Zaim Üniversitesi

    İşletme Ana Bilim Dalı

    PROF. DR. İBRAHİM GÜRAN YUMUŞAK

  5. Multiple criteria decision making approaches for container shipping line selection in export shipments from Turkey

    Türkiye'den ihracat sevkiyatlarında denizyolu konteyner taşıma hattı seçimi için çok ölçütlü karar verme yaklaşımları

    ESLEM DUYGU BÖYÜK

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Endüstri ve Endüstri MühendisliğiGalatasaray Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ZEYNEP ŞENER