Geri Dön

Using data mining for analyzing effects of biomarkers on decision of depression levels

Bioişaretlerin depresyon düzeyine karar vermedeki etkisinin veri madenciliği kullanarak analizi

  1. Tez No: 740120
  2. Yazar: RAHMİ KAVAK
  3. Danışmanlar: PROF. DR. SELMA AYŞE ÖZEL
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: İngilizce
  9. Üniversite: Çukurova Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 109

Özet

Depresyon, kalıcı bir üzüntü hissine ve ilgi kaybına neden olan bir duygu durum bozukluğudur. Birçok duygusal ve fiziksel etkene bağlı olduğu için teşhis edilmesi zor bir sağlık sorunudur. Depresyonun erken teşhis edilmesi, intihar gibi ciddi sonuçları olan durumları önlemeye yardımcı olmaktadır. Bu çalışmanın amacı, veri ön işleme tekniklerini kullanarak eksik ve gürültülü sağlık verilerinden düzenli bir veri seti elde etmek ve bu veri seti üzerinde ilk kez veri madenciliği yöntemleri uygulanarak depresyon seviyesi tanısında psikoterapistlere yardımcı olacak bir model geliştirmektir. Ayrıca veri setinde yer alan kan biyobelirteçlerinin depresyon ile ilişkisi incelenmektedir. Önerilen modelin öğrenilmesi ve test edilmesi için Adana Dr. Ekrem Tok Ruh Sağlığı Hastanesi'nden alınan veri seti kullanılmaktadır. Eksik veri tamamlama için k-En Yakın Komşu (kNN), Zincirlenmiş Denklemlerle Çok Değişkenli İmputasyon (MICE) ve Rastgele Orman (missForest) yöntemleri uygulanmıştır. Tıbbi veri setleri üzerinde daha önce uygulanmış ve başarısı ispatlanmış olan k-En Yakın Komşu (kNN), Rastgele Orman (RF) ve Çok Katmanlı Algılayıcı (MLP) sınıflayıcıları uygulanarak veri seti sınıflandırılmıştır. Performans değerlendirme kriteri olarak doğruluk ve F-skoru metrikleri kullanılmıştır. En iyi başarı oranı Rastgele Ormanlar sınıflayıcısı ile elde edilmiştir (Doğruluk=0.557 ve F-skoru=0.268). Üç özellik seçim yöntemi tarafından ortaklaşa seçilen en önemli 5 biyobelirteç şu şekildedir: Kreatinin (kanda), HIV Combi, Üre, HBs Ab ve HBsAg.

Özet (Çeviri)

Depression is a mood disorder that causes a persistent feeling of sadness and loss of interest. It is a difficult health problem to diagnose because it depends on many emotional and physical factors. Early detection of depression helps prevent situations with serious consequences such as suicide. The aim of this study is to obtain a clean data set from an incomplete and noisy health data using data preprocessing techniques and to develop a model that will help psychotherapists in the diagnosis of depression for the first time by applying data mining methods. In addition, the relationship between the blood biomarkers in the data set and depression is examined. To train and test the classification model, the data set from Adana Dr. Ekrem Tok Mental Health Hospital is obtained and used. For missing data completion, k-Nearest Neighbor (kNN), Multivariate Imputation by Chained Equations (MICE) and Random Forest (missForest) methods were applied. The data set was classified by applying the k-Nearest Neighbors (kNN), Random Forests (RF) and Multilayer Perceptron (MLP) classifiers, which were previously applied and proven to be successful on medical data sets. Accuracy and F-measure metrics were used as performance evaluation criteria. The best success rate was obtained with the Random Forests classifier (Accuracy=0.557 and F-measure=0.268). The 5 most important biomarkers that are jointly selected by the three feature selection methods are as follows: Creatinin (in blood), HIV Combi, Urea, HBs Ab and HBsAg.

Benzer Tezler

  1. Otomotiv sektöründe yakıt tüketimi ve emisyon seviyelerinin veri madenciliği ile analizi

    Application of data mining in automotive industry for analyzing fuel consumption and emission levels

    SİMGE DENİZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2016

    Endüstri ve Endüstri MühendisliğiGazi Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. HADİ GÖKÇEN

  2. Analysing effects of global warming on earth using data mining methods

    Küresel ısınmanın dünyaya etkilerinin veri madenciliği yöntemi ile analizi

    KIVANÇ KILIÇER

    Yüksek Lisans

    İngilizce

    İngilizce

    2006

    Bilim ve TeknolojiBahçeşehir Üniversitesi

    Bilgi Teknolojileri Ana Bilim Dalı

    YRD. DOÇ. DR. ADEM KARAHOCA

  3. Arama motoru (google) reklamlarının veri madenciliği yöntemleri ile incelenmesi: Bir e-ticaret sitesi örneği

    Investigation of search engine advertisements with data mining techniques: The case of e-commercial site

    CEMAL FURKAN ÖZBEK

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBandırma Onyedi Eylül Üniversitesi

    Yönetim Bilişim Sistemleri Ana Bilim Dalı

    DOÇ. DR. UFUK ÇELİK

  4. Yapay zekâ ve veri madenciliği teknikleriyle müşteri profili tanımlama: Müşteri ilişkileri yönetimi dinamik modelleme uygulaması

    Defining customer profile with artificial intelligence and data mining techniques: Customer relations management dynamic modeli̇ng application

    ALİ ALSAÇ

    Doktora

    Türkçe

    Türkçe

    2024

    Endüstri ve Endüstri Mühendisliğiİstanbul Üniversitesi-Cerrahpaşa

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET MUTLU YENİSEY

  5. Tekrar eden veri analizini kullanarak yazılım geliştirme için iyileştirilmiş hata tahmini

    A new improved defect prediction framework for software development using repeated data analysis

    MUHAMMED MARUF ÖZTÜRK

    Doktora

    Türkçe

    Türkçe

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya Üniversitesi

    Bilgisayar ve Bilişim Mühendisliği Ana Bilim Dalı

    DOÇ. DR. AHMET ZENGİN