Geri Dön

Implementation of some medical data in Apriori algorithm

Apriori algoritmasının bazı tıbbı verilere uygulanması

  1. Tez No: 397344
  2. Yazar: FAWAD SADIQMAL
  3. Danışmanlar: YRD. DOÇ. DR. NILÜFER YURTAY
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Tıbbı Veri Madenciliği, Birliktelik Kuralları, Apriori Algoritması, Medical Data Mining, Association Rules, Apriori Algorithm
  7. Yıl: 2015
  8. Dil: İngilizce
  9. Üniversite: Sakarya Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar ve Bilişim Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 64

Özet

Tıp alanında yapılan hastalara ait teşhis ve tedavi kayıtlarının, bilgisayar programları tarafından analiz edilmesi ve raporlanması etkili tedavi sürecini destekleyici bir unsur oluşturmaktadır. Birçok alanda olduğu gibi, tıp alanında da veri madenciliği yöntemlerinin kullanımı hızla artmaktadır. Bu yüzden tıbbi veri madenciliği başlı başına bir yöntem haline gelmiştir. Veri madenciliği yöntemlerinin kullanıldığı tıbbi karar destek sistemine yardımcı verilerin elde edilmesi ile hekimlere karar vermede yardımda bulunacak sistemin geliştirilmesi bu tez çalışmasında gösterilmiştir. Amaç: Modern tıp bilgileri, tıbbi veritabanında saklanan bilgilerin büyük bir kısmını oluşturmaktadır. Bu yüzden tanı ve hastalığın tedavisi için bilimsel karar vermede tıbbi veritabanından yararlı bilgilerin ayıklanması gerekli hale gelmektedir. Tıbbi veri madenciliği ile bu sorunları giderilebilir, aynı zamanda hastane bilgi yönetim düzeyini geliştirebilir ve toplumu tıp gelişimine teşvik edebilir. Kapsam: Bu tez çalışmasının ana konusu tıbbı veri madenciliğidir. Veriler tıbbı makale ve yayınlardan toplanmıştır. Literatürde 6000 ile 7000 arasında makale ve yayınlar incelenmiş ve bu tez çalışması için bunlardan 1000 tanesi uygulamada kullanılmıştır. İncelenen makale ve yayınlardan bu çalışma ile ilgili olmayanlar elenmiştir. Seçilen makale ve yayınlar 2010 ile 2015 senelerinde yazılmış makalelerdir. Veri girişi olarak makalenin yazarı, makalenin ismi ve makalede geçen anahtar kelimeler kullanılmıştır. Bunlar arasından odaklanılan faktör anahtar kelimelerdir. Uygulamanın hedefi anahtar kelimeler arasındaki farklı ilişkileri bulmaktır. Verileri toplamak için kullanılan kelimeler şunlardır; tıbbi veri madenciliği, tıbbi kümelenme, tıbbi sınıflandırma, tıbbi karar destek sistemi, bulanık sistemde ve yapay sinir ağlarda tıbbi yayınlar. Yöntem: Tıbbi veri madenciliği, tıbbi verilerin, farklı desen ve kaynaklardan, hızlı ve sağlam sonuçları güvenilir bir şekilde bize sunan işlem ve tekniklerden oluşmaktadır. Bu teknik ve yöntemler; bir tür yapay sinir ağı, bulanık sistem, karar destek sistemi, evrimsel algoritmalar, destek vektör makinesi gibi hesaplamalara dayalı uygulamalardır. Tıbbi veritabanlarında, hastalar ve tedavileri hakkında bilgiler büyük miktarlarda birikmiştir. Bu veriler içerisindeki ilişkiler ve desenler ile yeni tıbbi bilgiler sağlanabilir. Yeni bilgilerin üretilmesi için birkaç metodolojiler geliştirmiş ve bu gizli bilgileri keşfetmek için uygulanmıştır. Veri madenciliği teknikleri geniş bir tıbbi veritabanında veriler arasındaki ilişkileri aramak için kullanılmıştır. Tüm bu araştırmalar tıbbi veriler üzerine yapılmıştır çünkü tıp alanında birçok araştırma ve çalışmaların olması, sürekli büyüyen ve gelişen bir yapıda olması ve aynı zamanda sağlıklı yaşamanın hayatımızın en önemli kısmında yer almasıdır. Tıbbi veri madenciliğinin önemini Stanford Üniversitesi araştırmacıları tarafından yapılan bir çalışma ile şöyle gösterebiliriz. Bu çalışma 19 Eylül 2011 tarihinde yapmıştır. Çalışmada; iki farklı tedavi için kullanılan ilaçların birlikte kullanılması halinde ortaya çıkabilecek yan etkilerin saptanmasında veri madenciliğinin kullanılması ve çalışmaya olan olumlu etkisi gösterilmiştir. Birinci ilaç antidepresan için kullanılan Paxil adlı ilaçtır ve 1992 yılında tedavi için kullanılmıştır. İkinci ilaç ise kolesterol düşürücü için kullanılan Pravachol adlı ilaçtır ve 1996 yılında kullanılmıştır. Tedavi süreçlerinde her ilaç kendi tedavisine olumlu cevap vermiştir. İlaçların birlikte alındığı süreçlerde ise oluşabilecek yan etkilerin önceden saptanabilmesi için veri madenciliği uygulanmıştır. Öncelikle tedavi sürecindeki onbinlerce hastadan bilgileri alınarak elektronik hasta veritabanı oluşturulmuştur. Oluşturulan bu veritabanına veri madenciliği uygulanmıştır.Uygulama sonucunda her iki ilacı kullanan insanlarda yüksek kan şekeri seviyelerinin olacağı gözlemlenmiştir. İlaç etkileşimleri ile oluşabilecek yan etkileri yukarıdaki çalışmada da görüleceği gibi tıbbi veri madenciliğinin son çalışmaları ve araştırmaları ile bulunabilmektedir. Buradanda görüleceği gibi tıp alanındaki son gelişmelerin önemli parçalarından birisi de tıbbi veri madenciliğidir. Bu tıbbi veri madenciliği çalışmasında RapidMiner yazılımı kullanılmış ve Apriori Algoritması bu yazılımda çalıştırılmıştır. Apriori Algoritması' nın özellikleri ise şu şekildedir: Bu algoritma birliktelik kurallarının oluşturulmasında yararlanılan ve yaygın olarak kullanılan bir algoritmadır. Algoritma aşağıdaki adımlardan oluşmaktadır: • Öncelikle destek ve güven ölçülerini karşılaştırmak için eşik değerleri belirlenir. • Her bir ürün için destek sayıları hesaplanır. Eşik değeri ile karşılaştırılan destek değerlerinin içinden eşik değerinden düşük olanlar çıkarılır. • Kalan ürünler ikişerli gruplanarak, grup destek sayıları hesaplanır. Tekrar eşik değerleri ile karşılaştırılan destek değerlerinden eşik değerinin altında kalanlar iptal edilir. • Daha sonra üçerli, dörderli, beşerli, vb. biçimde gruplar için aynı karşılaştırma ve eleme işlemi devam ettirilir. Eşik değerlere uygun olduğu sürece işlemler sürecektir. • Belirlenen ürün grubunun destek ölçülerine bakarak birliktelik kuralları türetilir ve bu kurallarının her biri için güven ölçüleri belirlenir. Apriori Algoritması ile oluşturulan birliktelik kurallarının özellikleri ise şu şekildedir; Birliktelik kuralları (association rules), veri madenciliği alanında üzerinde çok fazla araştırma ve çalışma yapılmış olan ilgi çekici bir konudur. Birliktelik kuralları, aynı işlem içinde çoğunlukla beraber görülen nesneleri içeren kurallardır. Birliktelik kurallarının kullanıldığı en tipik örnek market sepeti uygulamasıdır. Bu işlem, müşterilerin yaptıkları alışverişlerdeki ürünler arasındaki birliktelikleri bularak müşterilerin satın alma alışkanlıklarını çözümler. Bu tip birlikteliklerin keşfedilmesi, müşterilerin hangi ürünleri bir arada aldıkları bilgisini ortaya çıkarır ve market yöneticileri de bu bilgi ışığında raf düzenlerini belirleyerek satış oranlarını artırabilir ve etkili satış stratejileri geliştirebilirler. Market sepeti çözümlemesinin son zamanlarda çok büyük ilgi ile karşılaşmasının sebebi kullanım kolaylığı ve anlaşılabilirliğidir. Market sepet analizi ile birliktelik kuralları çıkarımı ilk olarak Agrawal ve diğerleri tarafından 1993 yılında ele alınmıştır. Kuralları oluşturabilmek için 'destek' (support) ve 'güven' (confidence) değerlerini kullanarak, kullanıcı tarafından belirlenmiş minimum destek ve minimum güven değerlerinden yaygın birlikteliklerin belirlenmesi amaçlanmıştır. Market sepet analizinde, nesneler müşteriler tarafından satın alınan ürünlerdir ve bir hareket (kayıt) birçok nesneyi içinde bulunduran tek bir satın almadır. Birliktelik kurallarının kullanışlı olması için hem konu ile ilgili hem de anlaşılabilir olması gerekir. Birliktelik kurallarında, kullanıcının kuralların tipini ve sayısını kontrol edebileceği çeşitli yollar vardır. En yaygın olarak kullanılan yöntem, eşik değerleri olarak bilinen minimum destek ve minimum güven değerlerinin belirlendiği yöntemdir. Bu yöntemde sadece kullanıcı tarafından belirlenen eşik değerlerinden büyük olan destek ve güven değerlerine sahip kurallar bulunur ve kullanılır. Diğer bir yöntemde kullanıcının sınırlanmış nesne tanımlamasıdır. Sınırlanmış nesne, kuralların içeriğinin sınırlanmasında kullanılan mantıksal bir ifadedir. Örneğin sınırlanmış nesne cips, kola ve hamburger olsun. Sadece cips, kola ve hamburger içeren kurallar ile ilgilenilir. Birliktelik kurallarındaki bir nesnenin ve bir işlemin tanımı uygulamaya bağlıdır. Market sepeti analizinde; nesneler, müşterilerin aldığı ürünler ve işlem, beraber alınan bütün nesnelerin kümesidir. Birliktelik kurallarında sıklıkla kullanılan birkaç önemli terim vardır. Bunlar; kuralın sol tarafını ifade eden önce (antecedent), kuralın sağ tarafını ifade eden sonuç (consequent), destek değeri, güven değeri, min_destek olarak gösterilen minimum destek değeri, min_güven olarak gösterilen minimum güven değeri, nesne küme, yaygın nesne kümesi ve aday nesne kümesidir. X ürünü alan bir müşterinin Y ürününü de alma durumu (birliktelik kuralı) ile gösterilir. Destek ölçütü: ile hesaplanır. A ve B ürünlerinin birlikte sayın alınma olasılığı güven değeridir. Güven değeri: ile bulunabilir. Destek ve güven ölçütlerinin yanı sıra, bu değerleri karşılaştırabilmek için eşik değerlerine de ihtiyaç duyulmaktadır. Bulunan eşik değerlerinin, hesaplanan destek ve güven değerlerinden küçük olması beklenir. Hesaplanan destek ve güven değerlerinin büyüklük derecesi birliktelik kurallarının da o kadar güçlü olduğunu ifade eder. Örneğin 25 tane müşterinin bir defada aldığı ürün bilgilerinden yola çıkarak birliktelik kuralı şu şekilde bulunmuş olsun: Burada ve değerleri için pantolon ve kazak alan müşterilerin bunların yanında çorap da sayın alama olasılığını ifade eder. Müşterinin bu 3 ürünü birlikte satın alma sayısı 7 ve müşteri sayısı 25 ise belirttiğimiz bu kuralın destek ölçütü şöyle olacaktır. Destek ölçütü: Eğer pantolon ve kazak alanların sayısının 4 olduğunu farzedelim. Güven ölçütü: olacaktır. Alışveriş yerleri genel olarak müşteri bilgileri ele geçirirler. Satılan her bir hareket sepet (“basket”) olarak adlandırılır. Market–Sepet analizi, müşteri eğilimlerini tanımlayan sepet verilerini analiz eder. RapidMiner da kullanacağımız veriler iki süreçte işlenir. İlk süreç veri toplanması, ikinci süreç veri düzenlenmesidir. Verilerin toplanması ve düzenlenmesi el ile yapılmıştır. 1. Verilerin Toplanması; Verilerin hepsi tıbbi makalelerden alınmıştır. Kullanılmış olunan makaleler sciencedirect.com' dan (%80' i) ve IEEE web sitesinden (%20' si) alınmıştır. Tıbbi makaleler sciencedirct.com' dan daha kolay bir şekilde bulunmuştur. Toplanan verilerden makale ismi, yazar ve anahtar kelimeler alınarak excel sayfasında tablolaştırılmıştır. 2.Verilerin Düzenlenmesi; Excel sayfasında toplanan verilerin direkt olarak RapidMinner' da kullanılması bize doğru sonuçlar vermez. Buyüzden toplanan verilerin öncelikle düzenlenmesi gerekmektedir. Bu düzenlemede bazı gereksiz semboller örneğin; virgül (,), noktalı virgül (;) , nokta (.), eksi işareti (-) vb. kaldırılmıştır. Birliktelik kurallarının oluşturulması, Apriori algoritmalarının çalışması için anahtar kelimeler (|) özel işareti ile karakterize edilmiştir. İyi sonuçlar elde etmek için verilerde gruplama yapılmış, yapılan gruplamayla birlikte; 'kümeleme' ve 'sınıflandırma' kelimeleri alınarak veri madenciliği oluşturulmuştur. Sonuç: Bu tez çalışmasında bir verimadenciliği aracı olan RapidMiner kullanarak bir uygulama yapılmış ve beklenen sonuçlar başarıyla alınmıştır. Önceden de belirtildiği gibi anahtar kelimeler arasında farklı ilişkiler bulunmaktadır. Bu ilişkiler; birliktelik kuralları ve her birliktelik kuralları için güven ve destek değerleri ile ölçülmüştür. Bu değerlerin bu çalışma sonrası bulunması ile başta Market Sepet analizi olmak üzere bir çok karar destek sistemlerine girdi olarak kullanılması sağlanmıştır. Uygulamada incelenen 1000 adet makalenin anahtar kelimelerinin tekrar sayısının bulunması ile Tıbbi makalelerde kullanılan yöntemler arasındaki ilişki gözlemlenmiştir.

Özet (Çeviri)

Modern medicine generates a great deal of information stored in the medical database. Extracting useful knowledge and providing scientific decision-making for the diagnosis and treatment of disease from the database increasingly becomes necessary. Data mining in medicine can deal with this problem [1]. This thesis work is based on medical data mining. I collected data from medical papers and journals, and looked for around 6000 to 7000 papers and journals then I selected 1000 papers only, and discarded the rest which were not needed or related to my thesis work. The selected papers which I used are from years 2010 to 2015. My data is, name or title of the paper, keywords and authors, the focusing factor from the above data is keywords. I did an implementation on the keywords of the data. the target of the implementation is finding different relationships among these keywords. The searching keywords which I used for collecting the data are: medical data mining , medical clustering , medical classification, medical decision support system, and medical papers in fuzzy system and artificial neural network. I collected all the data manually. After I organize the data and performed the implementation using Apriori algorithm. In the result I found two things from the keywords. First one the most occurring words (with number of occurring), second association rules among those words.

Benzer Tezler

  1. Veri madenciliği uygulamaları için veri indirgeme algoritmalarının geliştirilmesi ve resim madenciliğine uygulanması

    Development of data reduction algorithms for data mining applications and implementation of these algorithms to image mining

    ONUR İNAN

    Doktora

    Türkçe

    Türkçe

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSelçuk Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. NİHAT YILMAZ

  2. Tıp ceza hukukunda kişisel sağlık verilerinin korunması

    Protection of personal health data in medical criminal law

    MEHMET AKÇAKOCA

    Doktora

    Türkçe

    Türkçe

    2021

    HukukErciyes Üniversitesi

    Kamu Hukuku Ana Bilim Dalı

    DOÇ. DR. FATİH BİRTEK

  3. Tomografik görüntü oluşturulmasında doğrudan fourier yöntemine yeni bir yaklaşım

    A Novel approach to direct fourier transform technique in tomographic image reconstruction

    A.FİLİZ BAYTAŞ

    Doktora

    Türkçe

    Türkçe

    1994

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Nükleer Mühendislik Ana Bilim Dalı

    PROF. DR. MELİH GEÇKİNLİ

  4. Terapötik tactile touch uygulamalarının, yoğun bakımdaki hastaların korku, kaygı ve ağrı düzeyine etkisi

    Therapeutic touch tactile applications, fears of patients in intensive care, the effect of anxiety level and pain

    ASİYE ÇAPA GÖRGÖZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Hemşirelikİstanbul Medipol Üniversitesi

    Hemşirelik Ana Bilim Dalı

    YRD. DOÇ. SİBEL DOĞAN

  5. Insitu calibration of earphone input signals using inverse filtering and implementation of a feed back system

    Ters süzgeçleme kullanılarak kulak içikulaklıklarının giriş işaretlerinin yerinde kalibrasyonu ve bir geri besleme sisteminin oluşturulması

    TUNA AYDIN

    Yüksek Lisans

    İngilizce

    İngilizce

    2000

    Tıbbi BiyolojiBoğaziçi Üniversitesi

    Biyomedikal Mühendisliği Ana Bilim Dalı

    PROF. DR. YEKTA ÜLGEN

    PROF. DR. FERDA AKDAŞ

    PROF. DR. H. ÖZCAN GÜLÇÜR