Geri Dön

Karadeniz Teknik Üniversitesi Farabi Hastanesi Biyokimya Laboratuvarı test sonuçlarından veri madenciliği yolu ile örüntü çıkarma

Pattern extraction from Karadeniz Technical University Farabi Hospital Biochemistry Laboratory medical tests using data mining techniques

  1. Tez No: 359744
  2. Yazar: YASEMİN ZEYNEP ENGİN
  3. Danışmanlar: DOÇ. DR. KEMAL TURHAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Biyokimya, Computer Engineering and Computer Science and Control, Biochemistry
  6. Anahtar Kelimeler: Veri madenciliği, biyokimya testleri, birliktelik analizi, destek vektör makineleri, kümeleme analizi, artırılmış regresyon ağaçları, örüntü çıkarma, Data mining, biochemistry, association analysis, support vector machines, cluster analysis, regression trees increased, pattern extraction
  7. Yıl: 2014
  8. Dil: Türkçe
  9. Üniversite: Karadeniz Teknik Üniversitesi
  10. Enstitü: Sağlık Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Tıp Bilişimi Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 114

Özet

Veri madenciliği, tek boyutlu yararlanılan çok miktardaki verinin yararlı bilgi birikimine dönüştürülmesini ve özellikle öngörülemeyen boyutlarıyla kullanılmasını sağlayan popüler bir çalışma alanıdır. Tıp alanında da çok sayıda ve türdeki veri veritabanlarında kayıt altına alınmaktadır. Bu bağlamda, sağlık alanı veri madenciliği çalışmaları için önemli kaynaklardan birisidir. Çalışmada, tıp alanındaki laboratuvar verilerinin veri madenciliği teknikleri ile analiz edilmesi ve örüntüler çıkarılması, elde edilen örüntülerden çıkarımlar yapılması amaçlanmıştır. Çalışma kapsamına Karadeniz Teknik Üniversitesi Tıp Fakültesi Farabi Hastanesi biyokimya laboratuvarında Ocak-Aralık 2010 ve Haziran 2011-Haziran 2012 süreleri arasında tutulan test sonuçları alınmıştır. Tez kapsamında, birliktelik kuralı analizi ile test seçiminde canlı arama tekniğinin kullanılması; kanser belirteci testlerin değerlendirilerek destek vektör makineleri yöntemiyle jinekolojik kanserlerin tanı kontrolünün yapılması; lökosit(WBC), eritrosit(RBC) ve hemoglobin(Hb) değerlerinin artırılmış regresyon ağaçları yöntemiyle tahmin edilmesi; Potasyum (K) ve Hemoliz İndeksi (HI) arasındaki ilişkinin kümeleme analizi yöntemi ile irdelenmesi; yaşamsal tahmin yapılması konuları ele alınmıştır. Birliktelik kuralları çıkarılarak sıklıkla birlikte istenen testlerin canlı arama tekniği ile görüntülenmesi ve test seçiminde hekime yol göstermesi test seçim başarısını artırmaya, hekimin daha hızlı karar verebilmesine ve eksik istemlerin önüne geçilerek maliyetlerin düşürülmesine imkan sunacaktır. Kanser belirteci testlerin değerlendirilerek tanı kontrollerinin yapılması ile kullanıcı hatası sonucu yanlış girildiği bariz olan ICD (International Statistical Classification of Diseases and Related Health Problems) kodlarının tespit edilebilmesi ve yeniden hekim görüşüne sunulması; böylece sisteme girilen tanı kodlarının doğruluğunun ve tutarlılığının artırılması amaçlanmıştır. Elde edilen sonuçlarda 304 hasta içinde yanlış sınıflandırılan iki kayıt gözlenmiş; bunlardan birinin kardiyoloji polikliniğinde kayıtlı ve 30 yaşında olduğu saptanmıştır. Bu ICD kodunun yanlış girildiği düşünülmektedir. Bazı tam kan testi parametrelerinin tahmini yapılmış ve WBC testinde gözlenen değerlere yakın sonuçlar elde edilmiştir. Bu yöntemle başka uygun problem alanlarında da araştırma amaçlı olarak eksik verilerin tamamlanabileceği gösterilmiştir. K ve HI arasında var olduğu bilinen ilişki bu konuda daha önce kullanılmamış bir yöntemle ortaya çıkarılmış ve geçerli değerler içeren iki kümede K ve HI arasında korelasyon değeri 0,91 ve 0,80 hesaplanmıştır. Yöntemin bu gibi problemlerde başarılı olduğu ve başka tıbbi problemlerde kullanılmaya uygun olduğu ortaya konulmuştur. Destek vektör makineleri kullanılarak, laktat ve laktat dehidrogenaz testleri istenen hastalarda yapılan yaşamsal tahmin sınıflandırmasında, %97, %96.6 ve %92.3 oranlarında başarılı sonuçlar elde edilmiştir. Hemogram parametreleri istenen diyabetli hastalarda yapılan yaşamsal tahmin analizinde ise, %96.6 ve %97.5 oranlarında başarılı sınıflandırma yapılmıştır. Bu şekilde risk grubunda olma olasılığı yüksek hastalara dikkat çekilebilir, bu hastaların risk değerlendirmelerinin yapılması önerilebilir. Yapılan analizlerle tıbbi veriden önceden öngörülemeyen ve klasik yöntemlerle elde edilemeyecek sonuçlar çıkarılmıştır. Fakat bu sonuçların anlamlandırılması için tıbbi alan uzmanı desteği kesinlikle gerekmektedir. Bu yüzden tıbbi veri üzerinde yapılacak olan veri madenciliği çalışmaları multidisipliner şekilde yürütülmelidir. Ayrıca kullanılan tıbbi veriler ön işlemeye tabi tutulmuş ve birçok eksik kayıt olduğu görülmüştür. Daha sonra yapılması planlanan çalışmaların başarısı için verilerin daha kaliteli olması gerekmektedir.

Özet (Çeviri)

Data mining is a popular field that enables you to convert the massive amount of data to useful information and allows you to use it with unpredictable dimensions. In the field of medicine, a large number of data in many types are recorded and stored. In this context, health area is one of the sources for the studies of data mining. Aim of the study was analyzing laboratory data of the medical field with data mining techniques and extracting patterns, then making inference from derived patterns. Biochemistry laboratory data of Karadeniz Technical University, Faculty of Medicine, Farabi Hospital collected between dates January-December 2010 and June 2011-June 2012 were included in the study. In the scope of this thesis, live search technique for medical test selection by using association rule mining for more accurate test claims; the control of the diagnosis of gynecologic cancers and detecting ICD codes entered incorrectly; prediction of some complete blood count parameters' values and searching method to complete the missing data in another possible problem area; analysis of a known problem area with previously unused method, analyzing the relation between Potassium (K) and Hemolysis Index (HI) with data mining; prediction of survival and identifying the patients who are in risk group realized. Displaying rules often requested together provides physicians to decide more quickly and lowering costs by avoiding inaccurate claims. Diagnostic checks done by evaluating cancer marker tests aim to detect the incorrect ICD codes as a result of user error obviously, so that to increase the accuracy and consistency of the identification codes entered into the system. Obtained results show misclassified two records observed in 304 patients, one of them was in the cardiology clinic and 30 years old. It is thought that the ICD code was entered incorrectly. Values of WBC, RBC and Hb parameters were predicted and WBC test results were close to the observed values. Missing data was shown to be complete in other suitable research areas with this method. Relationship between K(potassium) and HI(hemolysis index) is known to exist is revealed by a method previously unused in this regard. In two clusters containing valid values of K and HI, correlation value was calculated 0.91 and 0.80. The success of the method have been proved on such problems and it have been found to be suitable for use in other medical problems. Classification of survival predict in patients which lactate and lactate dehydrogenase tests have requested good results were obtained in the rates of 97%, 96.6% and 92.3%. Survival prediction of hemogram parameters requested of patients with diabetes successful classification was made in rates of 96.6% and 97.5%. In this way patients likely to be at risk can be pointed out, performing risk assessments of these patients can suggested. With the analysis of medical data, unpredictable results can not be obtained by conventional methods was concluded. However, the support of the medical field expert is required for the signification of results. Therefore data mining studies that will be performed on medical data should be conducted in a multidisciplinary way. Furthermore used medical data was preprocessed and many missing records were found. Data needs to have better quality for the success of planned work in future.

Benzer Tezler

  1. Farklı süreç sigma düzeylerine sahip biyokimya testlerinin hasta temelli kalite kontrol uygulaması ile değerlendirilmesi

    Evaluation of biochemistry tests with different process sigma levels via patient-based quality control implementation

    SÜMEYYE AYTEKİN GARİP

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2024

    BiyokimyaKaradeniz Teknik Üniversitesi

    Tıbbi Biyokimya Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ HÜSEYİN YAMAN

  2. Klinik biyokimya laboratuvar testlerinin referans değişim değerlerinin belirlenmesi

    Determination of reference change values of clinical biochemistry laboratory tests

    MEHMET AKİF BİLDİRİCİ

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2019

    BiyokimyaKaradeniz Teknik Üniversitesi

    Tıbbi Biyokimya Ana Bilim Dalı

    PROF. DR. YÜKSEL ALİYAZICIOĞLU

  3. Karadeniz Teknik Üniversitesi Farabi Hastanesi Klinik Biyokimya Laboratuvarında hizmet kalite standartlarının uygulanması ve değerlendirilmesi

    Başlık çevirisi yok

    SELÇUK YAMAN

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2014

    BiyokimyaKaradeniz Teknik Üniversitesi

    Tıbbi Biyokimya Ana Bilim Dalı

    PROF. DR. YÜKSEL ALİYAZICIOĞLU

  4. KTÜ Tıp Fakültesi Farabi Hastanesi klinik biyokimya laboratuvarında ölçüm belirsizliğinin değerlendirilmesi

    Evaluation of uncertainty measurement in clinical biochemistry laboratory of Farabi Hospital Faculty of Medicine of KTU

    HATİCE BOZKURT YAVUZ

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2018

    BiyokimyaKaradeniz Teknik Üniversitesi

    Tıbbi Biyokimya Ana Bilim Dalı

    PROF. DR. SÜLEYMAN CANER KARAHAN

  5. Farklı kalite kontrol materyal verilerinden hesaplanan süreç sigma değerlerinin incelenmesi

    Analysis of process sigma values calculated from different quality control material data

    MERVE KATKAT

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2021

    BiyokimyaKaradeniz Teknik Üniversitesi

    Tıbbi Biyokimya Ana Bilim Dalı

    PROF. DR. ASIM ÖREM