Kayıp değer atamasına bulanık kümeleme yaklaşımı
Fuzzy clustering approach to missing value imputation
- Tez No: 907347
- Danışmanlar: PROF. DR. GÜLHAYAT GÖLBAŞI ŞİMŞEK
- Tez Türü: Yüksek Lisans
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: Türkçe
- Üniversite: Yıldız Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: İstatistik Bilim Dalı
- Sayfa Sayısı: 59
Özet
Çalışmalarımızda yer alan veri setlerinde hücrelerde bulunan değerlerin gözlenememesi durumu eksik veri, kayıp veri veya tamamlanamamış veri olarak isimlendirilmektedir. Kayıp değerleri bulabilmek ve veri setlerindeki eksikleri tamamlayarak daha sağlıklı sonuçlara ulaşabilmek amaçlanmıştır. Eksik verileri tamamlamak için çeşitli kayıp veri tahmin etme yöntemleri bulunmaktadır. Bu çalışmada kayıp verileri tahmin etme yöntemlerine alternatif bir yöntem olarak bulanık c-ortalamalar yöntemi kullanılmıştır. Yöntemin eksik verilerin tamamlanmasında uygunluğu incelenmiştir. Bu çalışmada“Depresyon Anksiyete ve Stres Ölçekleri-21”(DASS-21) veri seti kullanılmıştır. DASS-21 veri setinden %1, %5, %10 ve %20 oranlarında rastgele veri kaybedilmiştir. Her veri seti için 100 tekrar yapılarak yöntemlerin performansları karşılaştırılmıştır. Bu çalışmada belirli küme sayılarına ayrılarak RMSE, MAE ve Cronbach alfa değerleri hesaplanmıştır. Veri setlerindeki kayıpların tahmin edilmesinde örneklem büyüklüğünün bir etkisinin olup olmadığını anlamak amacıyla tam veri seti yarıya indirilerek yapılan işlemler yeniden uygulanarak iki veri setinin sonuçları karşılaştırılmıştır. Bulanık C-Ortalamalar 1'den 11'e kadar küme sayıları artırılarak sonuçlar incelenmiştir. Çıkan değerlerin, sıklıkla kullanılan ortalama atama, medyan atama ve mod atama yöntemleri ile kıyaslanması yapılmıştır. Araştırmanın uygulaması R Studio programında gerçekleştirilmiştir.
Özet (Çeviri)
n the data sets in our studies, the situation where the values in the cell cannot be observed is called missing data, missing data or incomplete data. It is aimed to find missing values and reach more accurate results by completing the missing data in the data sets. There are various missing data estimation methods to complete missing data. In this study, the fuzzy c-means method was used as an alternative method to estimating missing data. The suitability of the method in completing missing data was examined.“Depression Anxiety and Stress Scales-21”(DASS-21) data set was used in this study. Random data was lost at rates of 1%, 5%, 10% and 20% from the DASS-21 data set. The performances of the methods were compared by performing 100 repetitions for each data set. In this study, RMSE, MAE and Cronbach's Alpha values were calculated by dividing into certain cluster numbers. In order to understand whether the sample size has an effect on estimating the losses in the data sets, the results of the two data sets were compared by halving the full data set and applying the operations again. Fuzzy C-Means the results were examined by increasing the number of clusters from 1 to 11. The resulting values were compared with the frequently used mean assignment, median assignment and mode assignment methods. The application of the research was carried out in the R Studio program.
Benzer Tezler
- Nicel birliktelik kurallarının bulanık mantık ve genetik algoritma ile otomatik keşfi
Discovery of quantitative association rules with fuzzy logic and genetic algorithms
KORKUT KORAY GÜNDOĞAN
Yüksek Lisans
Türkçe
2003
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. YETKİN TATAR
- Havacılık sektöründe kaba küme temelli uçak arıza güvenilirliği tahmin modeli ve Türkiye uygulaması
Rough cluster based aircraft failure reliability prediction model in aviation sector and its application in Turkey
NURÇİN KAYA
Yüksek Lisans
Türkçe
2020
Endüstri ve Endüstri MühendisliğiErciyes ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MİHRİMAH ÖZMEN
- Akdeniz iklim koşullarında pasif ev standartlarının uygulanabilirliğinin sinirsel bulanık mantık ile tahmini ve tasarım sürecine dahil edilmesi: Yarı olimpik kapalı havuz örneği
Estimating the applicability of passive house standards in Mediterranean climate conditions with neuro fuzzy logic and its including into the design process: A case of a semi-olympic indoor pool
SETENAY UÇAR
- Sağlık işletmeleri için teletıp hizmet tasarımı: Bulanık kalite fonksiyon göçerimi uygulaması
Teletıp service design for healthcare enterprises: Application of fuzzy quality function deployment
MEVLÜT SERHAT ALTAŞ
Doktora
Türkçe
2022
Sağlık Kurumları Yönetimiİstanbul Sabahattin Zaim Üniversitesiİşletme Ana Bilim Dalı
PROF. DR. İBRAHİM GÜRAN YUMUŞAK
- Multiple criteria decision making approaches for container shipping line selection in export shipments from Turkey
Türkiye'den ihracat sevkiyatlarında denizyolu konteyner taşıma hattı seçimi için çok ölçütlü karar verme yaklaşımları
ESLEM DUYGU BÖYÜK
Yüksek Lisans
İngilizce
2018
Endüstri ve Endüstri MühendisliğiGalatasaray ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ZEYNEP ŞENER