Geri Dön

Turkish medical text parsing and classification

Türkçe medikal metin ayrıştırma ve sınıflandırma

  1. Tez No: 563834
  2. Yazar: AHMET BARDIZ
  3. Danışmanlar: DR. ÖĞR. ÜYESİ İSMAİL BURAK PARLAK
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilim ve Teknoloji, Science and Technology
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2019
  8. Dil: İngilizce
  9. Üniversite: Galatasaray Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 60

Özet

Bu çalışma hastane yönetim sistemlerinde yer alan, uzman hekimler tarafından muayene edilen hastalara ait kayıtları referans alarak, hastaların şikayetleriyle ilgilenebilecek en muhtemel hastane branşını makine öğrenmesi yöntemleriyle tespit etmeyi kapsamaktadır. Fakat sınıflandırma aşamasından önce Türkçe dilinin yapısal ve anlamsal çözümlemesini yapmak gerekmektedir. Ayrıca bu çözümlemeyi medikal uzayda özelleştirmek de gerekir. Bu kapsamda Türkçe' nin sondan eklemeli bir dil olma özelliğini ve kendine özgü dil bilgisi kurallarını göz önünde bulundurmakla beraber, medikal sözlüklerle destekli bir şekilde metin ayrıştırma yöntemleri uygulanır. Bu çalışma kapsamında sınıflandırma performansını artırmak için Türkçe medikal kelime veya kelime gruplarını ayrıştıran ve semantik olarak anlamladıran bir medikal Türkçe doğal dil işleme servisi geliştirilmiştir. Bu servis üzerinde işlenip anlamlandırılan medikal metin verileri karar destek makineleri, çok terimli Naïve Bayes ve evrişimsel sinir ağları yöntemleri kullanılarak sınıflandırılmış ve yapılan testler sonucu en yüksek doğruluk oranı %98.16 olarak hesaplanmıştır. Ayrıca medikal Türkçe doğal dil işleme ve sınıflandırma katmanları paketlenerek, herhangi bir sistem veya web ortamına entegre olabilecek şekilde bir API olarak yayınlanmıştır. Sonuç olarak hastanenelerin online randevu sistemlerinde bu hizmetin kullanılmasıyla, hastaların şikayetleriyle örtüşen daha doğru ve özelleşmiş bir hastane branşına yönlendirilmesi hedeflenmiştir.

Özet (Çeviri)

This study includes approaches to identify the hospital departments with the methods of machine learning by referencing narratives of patients typed by expert physicians in the hospital information management systems. The main challenge is the preservation of semantic integrity while resolving the complex Turkish grammar rules on medical context. A Turkish medical parser was built and was characterized by specific abilities to extract medical entities and to act according to Turkish grammar. This parser identifies the syntactic, morphological, lexical and semantic features on the medical text. This parser basically discovers the misspellings, disassembles the possible morphemes of a term, assigns the optimal part of speech tags, gets rid of the morphemes that do not affect the semantic intensely and then decides to the best parse regarding the language and word2vec models. A medical corpus which includes patients' medical narrative records and hospital departments that corresponds to those narratives has become the basis for these studies. Additionally, a Turkish medical lexicon has been generated to extract medical entities. It consists of clinically favored terms that specify and differentiate diagnoses. These overall parsing steps provide to perform an exhaustive analysis of Turkish texts through the medical and agglutinative linguistic perspective. Secondly, the features extracted by this medical parser were used to predict hospital departments from patients' narrative records. The accuracies of the Multinomial Naïve Bayes, Support Vector Machines and Convolutional Neural Networks are evaluated to classify the medical content. The Support Vector Machines approach has acquired 98.16 % accuracy rate to classify hospital departments from medically parsed patients' narrative text.

Benzer Tezler

  1. Sağlıkla ilgili sosyal medya forum verilerinde içeriğinin bilgilendirici özellikleri: İlaç yan etkilerinin araştırılması üzerine bir çalışma

    Informational characteristics of health-related social media content: A study on the investigation of drug side effects

    ALKAN KAYA

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Okan Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. PINAR YILDIRIM

  2. Disiplinlerarası ilişkiler bağlamında medikal illüstrasyonun nazal cerrahi eğitimindeki yeri – fotoğraf ve yazılı anlatım ile karşılaştırılması

    The place of medical illustration in nasal surgery regarding the interdisciplinary relationships and its comparison with photography and written expression

    SEFA ERSAN KAYA

    Doktora

    Türkçe

    Türkçe

    2020

    Güzel SanatlarOndokuz Mayıs Üniversitesi

    Güzel Sanatlar Eğitimi Ana Bilim Dalı

    PROF. SEVGİ SOYLU KOYUNCU

  3. Erythromcın ilacının yan etkilerinin araştırılması üzerine veri madenciliği çalışması

    Data mining on the research of the side effects of erythromycin

    ERHAN TAHMİNCİLER

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOkan Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. PINAR YILDIRIM

  4. An Intelligent diagnostic system from the clinical narratives in Turkish

    Türkçe hasta hikayeleri üzerinde teşhis/tanı sistemi

    MUHAMMED OĞUZHAN KÜLEKCİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2000

    Tıbbi BiyolojiBoğaziçi Üniversitesi

    Biyomedikal Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MEHMET ÖZKAN

  5. Erzurumlu Emrah'ın hayatı ve eserleri

    Başlık çevirisi yok

    AHMET SELİM DOĞAN

    Yüksek Lisans

    Türkçe

    Türkçe

    1996

    Müzikİstanbul Teknik Üniversitesi

    DR. MUSTAFA ERKAN