Turkish medical text parsing and classification
Türkçe medikal metin ayrıştırma ve sınıflandırma
- Tez No: 563834
- Danışmanlar: DR. ÖĞR. ÜYESİ İSMAİL BURAK PARLAK
- Tez Türü: Yüksek Lisans
- Konular: Bilim ve Teknoloji, Science and Technology
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: İngilizce
- Üniversite: Galatasaray Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 60
Özet
Bu çalışma hastane yönetim sistemlerinde yer alan, uzman hekimler tarafından muayene edilen hastalara ait kayıtları referans alarak, hastaların şikayetleriyle ilgilenebilecek en muhtemel hastane branşını makine öğrenmesi yöntemleriyle tespit etmeyi kapsamaktadır. Fakat sınıflandırma aşamasından önce Türkçe dilinin yapısal ve anlamsal çözümlemesini yapmak gerekmektedir. Ayrıca bu çözümlemeyi medikal uzayda özelleştirmek de gerekir. Bu kapsamda Türkçe' nin sondan eklemeli bir dil olma özelliğini ve kendine özgü dil bilgisi kurallarını göz önünde bulundurmakla beraber, medikal sözlüklerle destekli bir şekilde metin ayrıştırma yöntemleri uygulanır. Bu çalışma kapsamında sınıflandırma performansını artırmak için Türkçe medikal kelime veya kelime gruplarını ayrıştıran ve semantik olarak anlamladıran bir medikal Türkçe doğal dil işleme servisi geliştirilmiştir. Bu servis üzerinde işlenip anlamlandırılan medikal metin verileri karar destek makineleri, çok terimli Naïve Bayes ve evrişimsel sinir ağları yöntemleri kullanılarak sınıflandırılmış ve yapılan testler sonucu en yüksek doğruluk oranı %98.16 olarak hesaplanmıştır. Ayrıca medikal Türkçe doğal dil işleme ve sınıflandırma katmanları paketlenerek, herhangi bir sistem veya web ortamına entegre olabilecek şekilde bir API olarak yayınlanmıştır. Sonuç olarak hastanenelerin online randevu sistemlerinde bu hizmetin kullanılmasıyla, hastaların şikayetleriyle örtüşen daha doğru ve özelleşmiş bir hastane branşına yönlendirilmesi hedeflenmiştir.
Özet (Çeviri)
This study includes approaches to identify the hospital departments with the methods of machine learning by referencing narratives of patients typed by expert physicians in the hospital information management systems. The main challenge is the preservation of semantic integrity while resolving the complex Turkish grammar rules on medical context. A Turkish medical parser was built and was characterized by specific abilities to extract medical entities and to act according to Turkish grammar. This parser identifies the syntactic, morphological, lexical and semantic features on the medical text. This parser basically discovers the misspellings, disassembles the possible morphemes of a term, assigns the optimal part of speech tags, gets rid of the morphemes that do not affect the semantic intensely and then decides to the best parse regarding the language and word2vec models. A medical corpus which includes patients' medical narrative records and hospital departments that corresponds to those narratives has become the basis for these studies. Additionally, a Turkish medical lexicon has been generated to extract medical entities. It consists of clinically favored terms that specify and differentiate diagnoses. These overall parsing steps provide to perform an exhaustive analysis of Turkish texts through the medical and agglutinative linguistic perspective. Secondly, the features extracted by this medical parser were used to predict hospital departments from patients' narrative records. The accuracies of the Multinomial Naïve Bayes, Support Vector Machines and Convolutional Neural Networks are evaluated to classify the medical content. The Support Vector Machines approach has acquired 98.16 % accuracy rate to classify hospital departments from medically parsed patients' narrative text.
Benzer Tezler
- Sağlıkla ilgili sosyal medya forum verilerinde içeriğinin bilgilendirici özellikleri: İlaç yan etkilerinin araştırılması üzerine bir çalışma
Informational characteristics of health-related social media content: A study on the investigation of drug side effects
ALKAN KAYA
Yüksek Lisans
Türkçe
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Okan ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. PINAR YILDIRIM
- Disiplinlerarası ilişkiler bağlamında medikal illüstrasyonun nazal cerrahi eğitimindeki yeri – fotoğraf ve yazılı anlatım ile karşılaştırılması
The place of medical illustration in nasal surgery regarding the interdisciplinary relationships and its comparison with photography and written expression
SEFA ERSAN KAYA
Doktora
Türkçe
2020
Güzel SanatlarOndokuz Mayıs ÜniversitesiGüzel Sanatlar Eğitimi Ana Bilim Dalı
PROF. SEVGİ SOYLU KOYUNCU
- Erythromcın ilacının yan etkilerinin araştırılması üzerine veri madenciliği çalışması
Data mining on the research of the side effects of erythromycin
ERHAN TAHMİNCİLER
Yüksek Lisans
Türkçe
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOkan ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. PINAR YILDIRIM
- An Intelligent diagnostic system from the clinical narratives in Turkish
Türkçe hasta hikayeleri üzerinde teşhis/tanı sistemi
MUHAMMED OĞUZHAN KÜLEKCİ
Yüksek Lisans
İngilizce
2000
Tıbbi BiyolojiBoğaziçi ÜniversitesiBiyomedikal Mühendisliği Ana Bilim Dalı
DOÇ. DR. MEHMET ÖZKAN