Geri Dön

Veri madenciliğinde kullanılan kestirim yöntemlerinin performanslarının karşılaştırlması

Performance comparison of estimation methods used in data mining

  1. Tez No: 459491
  2. Yazar: ESRA GÜLTÜRK
  3. Danışmanlar: DOÇ. DR. HÜDAVERDİ BİRCAN
  4. Tez Türü: Doktora
  5. Konular: Biyoistatistik, İstatistik, İşletme, Biostatistics, Statistics, Business Administration
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2016
  8. Dil: Türkçe
  9. Üniversite: Cumhuriyet Üniversitesi
  10. Enstitü: Sosyal Bilimler Enstitüsü
  11. Ana Bilim Dalı: İşletme Ana Bilim Dalı
  12. Bilim Dalı: Sayısal Yöntemler Bilim Dalı
  13. Sayfa Sayısı: 158

Özet

Bu çalışmada, literatürde eksikliği fark edilen“Destek Vektör Regresyon, Random Forest ve Regresyon Ağacı”yöntemlerinin kestirim performanslarının kıyaslanması amaçlanmıştır. Bağımlı değişkeni kategorik ve sürekli değişken olarak alıp hem sınıflama, hemde regresyon yöntemlerinin kestirim performansları incelenmiştir. Bu amaçla, Cumhuriyet Üniversitesi Tıp Fakültesi Enfeksiyon Hastalıkları ve Çocuk Sağlığı Hastalıkları servisinde yatan kırım kongo kanamalı ateş tanısı ile tedavi gören 2009-2011 yılları arası tüm hasta bireylerin verileri servis kayıtlarından alınmıştır. Bu üç yıl içerisindeki toplam 245 hastaya ait 6125 veri girişi yapılmıştır. Çalışmada yetişkin, çocuk ve tüm hasta olmak üzere toplam üç grup hasta verisi kullanılmıştır. Regresyon modellerinin performanslarını karşılaştırmak için hata kareler ortalaması ve açıklayıcı yüzdesine bakılmıştır. Sınıflamada modellerin karşılaştırılmalarına bakmak için duyarlılık, kesinlik, doğruluk oranı ve F ölçütüne bakılmıştır. Gerçek veri seti için regresyon yöntemlerinden, her üç gruptada destek vektör regresyon açıklayıcılık yüzdesi en fazla, hata kareler ortalaması en az olan regresyon modeli olarak bulunmuştur. Simülasyon çalışmasında, her bir senaryo 1000 kez tekrar edilmiş, her bir tekrarda sözü edilen regresyon yöntemleri uygulanmıştır. Senaryo yapılarına göre en iyi regresyon yöntemi destek vektör regresyon olarak bulunmuştur.

Özet (Çeviri)

In this study, performance comparison of estimation methods as“Support Vector Regression, Random Forest and Regression Tree”were aimed. By taking categorical and continuous variables as dependent variable, performances of classification and regression estimation methods were examined. For this purpose, data of all patients, who were hospitalized with the diagnosis of crimean-congo haemorrhagic fever between 2009 and 2011 years in Cumhuriyet University Faculty of Medicine, Infectious Diseases and Children's Health ward, were obtained from the service records. 6125 data entry of 245 patient's were made within three years. In this study, three sets of data including adults, children and all patients were used. To compare the performances of regression models, mean square error and explanatory percentage were examined. Sensitivity, precision, accuracy and F measure were examined to look into comparison of models in classification. For real data set in all of three groups, explanatory percentage of support vector regression was maximum, mean square error of support vector regression was minimum. In the simulation study, each scenario was repeated 1000 times, relevant regression methods were applied in each repetition. According to the scenario structures, support vector regression was the best regression method.

Benzer Tezler

  1. Pre-release forecasting of imdb movie ratings using multi-view data

    Gösterime girmemiş filmlerin ımdb puanının farklı özellik kümeleri kullanılarak tahmin edilmesi

    BEYZA ÇİZMECİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ŞULE ÖĞÜDÜCÜ

  2. Rol madenciliğinde AHC kullanarak rol tabanlı erişim kontrol sistemlerinin yeniden yapılandırılması: Bir yazılım endüstrisi deneyimi

    Reconfiguring role-based access control systems by using AHC in role mining: A software industry experience

    OSMAN DURDAĞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAtatürk Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ AHMET COŞKUNÇAY

  3. Veri madenciliğinde kullanılan teknikler ve bir uygulama

    Data mining techniques and an application

    ELİF ÖZGE ÖZDAMAR

    Yüksek Lisans

    Türkçe

    Türkçe

    2002

    İstatistikMimar Sinan Güzel Sanatlar Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF. DR. M. KEMAL YOĞURTÇUGİL

  4. Veri madenciliğinde kullanılan sınıflandırma yöntemleri ve bir uygulama

    Classification methods used in data mining and an application

    MİNE ÇELİK

    Yüksek Lisans

    Türkçe

    Türkçe

    2009

    Ekonometriİstanbul Üniversitesi

    Ekonometri Ana Bilim Dalı

    DOÇ. DR. ENİS SINIKSARAN

  5. Veri madenciliğinde kullanılan birliktelik analizi ve market sepet analizi: Bir uygulama

    Association and market basket analysis in data mining: An implementation

    SENİHA GÜNDÜZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    İstatistikOndokuz Mayıs Üniversitesi

    İstatistik Ana Bilim Dalı

    DOÇ. DR. YÜKSEL ÖNER