Using data mining for analyzing effects of biomarkers on decision of depression levels
Bioişaretlerin depresyon düzeyine karar vermedeki etkisinin veri madenciliği kullanarak analizi
- Tez No: 740120
- Danışmanlar: PROF. DR. SELMA AYŞE ÖZEL
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: İngilizce
- Üniversite: Çukurova Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 109
Özet
Depresyon, kalıcı bir üzüntü hissine ve ilgi kaybına neden olan bir duygu durum bozukluğudur. Birçok duygusal ve fiziksel etkene bağlı olduğu için teşhis edilmesi zor bir sağlık sorunudur. Depresyonun erken teşhis edilmesi, intihar gibi ciddi sonuçları olan durumları önlemeye yardımcı olmaktadır. Bu çalışmanın amacı, veri ön işleme tekniklerini kullanarak eksik ve gürültülü sağlık verilerinden düzenli bir veri seti elde etmek ve bu veri seti üzerinde ilk kez veri madenciliği yöntemleri uygulanarak depresyon seviyesi tanısında psikoterapistlere yardımcı olacak bir model geliştirmektir. Ayrıca veri setinde yer alan kan biyobelirteçlerinin depresyon ile ilişkisi incelenmektedir. Önerilen modelin öğrenilmesi ve test edilmesi için Adana Dr. Ekrem Tok Ruh Sağlığı Hastanesi'nden alınan veri seti kullanılmaktadır. Eksik veri tamamlama için k-En Yakın Komşu (kNN), Zincirlenmiş Denklemlerle Çok Değişkenli İmputasyon (MICE) ve Rastgele Orman (missForest) yöntemleri uygulanmıştır. Tıbbi veri setleri üzerinde daha önce uygulanmış ve başarısı ispatlanmış olan k-En Yakın Komşu (kNN), Rastgele Orman (RF) ve Çok Katmanlı Algılayıcı (MLP) sınıflayıcıları uygulanarak veri seti sınıflandırılmıştır. Performans değerlendirme kriteri olarak doğruluk ve F-skoru metrikleri kullanılmıştır. En iyi başarı oranı Rastgele Ormanlar sınıflayıcısı ile elde edilmiştir (Doğruluk=0.557 ve F-skoru=0.268). Üç özellik seçim yöntemi tarafından ortaklaşa seçilen en önemli 5 biyobelirteç şu şekildedir: Kreatinin (kanda), HIV Combi, Üre, HBs Ab ve HBsAg.
Özet (Çeviri)
Depression is a mood disorder that causes a persistent feeling of sadness and loss of interest. It is a difficult health problem to diagnose because it depends on many emotional and physical factors. Early detection of depression helps prevent situations with serious consequences such as suicide. The aim of this study is to obtain a clean data set from an incomplete and noisy health data using data preprocessing techniques and to develop a model that will help psychotherapists in the diagnosis of depression for the first time by applying data mining methods. In addition, the relationship between the blood biomarkers in the data set and depression is examined. To train and test the classification model, the data set from Adana Dr. Ekrem Tok Mental Health Hospital is obtained and used. For missing data completion, k-Nearest Neighbor (kNN), Multivariate Imputation by Chained Equations (MICE) and Random Forest (missForest) methods were applied. The data set was classified by applying the k-Nearest Neighbors (kNN), Random Forests (RF) and Multilayer Perceptron (MLP) classifiers, which were previously applied and proven to be successful on medical data sets. Accuracy and F-measure metrics were used as performance evaluation criteria. The best success rate was obtained with the Random Forests classifier (Accuracy=0.557 and F-measure=0.268). The 5 most important biomarkers that are jointly selected by the three feature selection methods are as follows: Creatinin (in blood), HIV Combi, Urea, HBs Ab and HBsAg.
Benzer Tezler
- Otomotiv sektöründe yakıt tüketimi ve emisyon seviyelerinin veri madenciliği ile analizi
Application of data mining in automotive industry for analyzing fuel consumption and emission levels
SİMGE DENİZ
Yüksek Lisans
Türkçe
2016
Endüstri ve Endüstri MühendisliğiGazi ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. HADİ GÖKÇEN
- Analysing effects of global warming on earth using data mining methods
Küresel ısınmanın dünyaya etkilerinin veri madenciliği yöntemi ile analizi
KIVANÇ KILIÇER
Yüksek Lisans
İngilizce
2006
Bilim ve TeknolojiBahçeşehir ÜniversitesiBilgi Teknolojileri Ana Bilim Dalı
YRD. DOÇ. DR. ADEM KARAHOCA
- Arama motoru (google) reklamlarının veri madenciliği yöntemleri ile incelenmesi: Bir e-ticaret sitesi örneği
Investigation of search engine advertisements with data mining techniques: The case of e-commercial site
CEMAL FURKAN ÖZBEK
Yüksek Lisans
Türkçe
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBandırma Onyedi Eylül ÜniversitesiYönetim Bilişim Sistemleri Ana Bilim Dalı
DOÇ. DR. UFUK ÇELİK
- Yapay zekâ ve veri madenciliği teknikleriyle müşteri profili tanımlama: Müşteri ilişkileri yönetimi dinamik modelleme uygulaması
Defining customer profile with artificial intelligence and data mining techniques: Customer relations management dynamic modeli̇ng application
ALİ ALSAÇ
Doktora
Türkçe
2024
Endüstri ve Endüstri Mühendisliğiİstanbul Üniversitesi-CerrahpaşaEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. MEHMET MUTLU YENİSEY
- Tekrar eden veri analizini kullanarak yazılım geliştirme için iyileştirilmiş hata tahmini
A new improved defect prediction framework for software development using repeated data analysis
MUHAMMED MARUF ÖZTÜRK
Doktora
Türkçe
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya ÜniversitesiBilgisayar ve Bilişim Mühendisliği Ana Bilim Dalı
DOÇ. DR. AHMET ZENGİN