Text mining in Turkish radiology reports
Türkçe radyoloji raporlarında metin madenciliği
- Tez No: 365662
- Danışmanlar: YRD. DOÇ. DR. DEVRİM ÜNAY
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2013
- Dil: İngilizce
- Üniversite: Bahçeşehir Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 59
Özet
Metin madenciliği ve sınıflandırma, makine öğrenmesi ve bilgi erişimi alanlarında popüler bir konudur. Tıbbi metinlerin otomatik analizi ve sınıflandırılması medikal veri akışında verimliğin artırılması, teşhis ve tedavinin iyileştirilmesi gibi konularda katkı sağlayabilir. Literatürde radyoloji raporlarının analizi ve sınıflandırılması konusunda çalışmalar mevcuttur. Ancak bahsedilen çalışmalar Türkçe raporların anatomik bölgeye göre sınıflanması problemine eğilmemiştir. Dolayısıyla bu tez, metin madenciliği kullanarak sözlük temelli bir yöntemle Türkçe radyoloji raporlarını anatomik bölgelere göre sınıflandırmayı hedefleyerek literatürdeki eksiği kapatmayı amaç edinmiştir. Önerilen çözüm, radyoloji departmanlarında teknisyenler tarafından elle yapılan bu işin hızlandırılmasını, otomatikleştirilmesini ve doğruluğunun artırılmasını sağlayacaktır. Raporlardaki alt ve üst bilgilerinin silinmesi, Türkçe karakterlerin elenmesi, kök bulma, kelime frekans analizi, normalizasyon ve skorlama aşamalarından oluşan önerilen yöntem Bash ortamında tasarlanmıştır. Yöntemin geliştirilmesi(n=69) ve başarımının ölçülmesi(n=161) için hastane ortamında rutin olarak hazırlanan 8 farklı anatomik bölgeye ait toplam 230 Türkçe radyoloji raporu kullanılmıştır. Önerilen yöntemin başarımı F-ölçütü kriterine göre %98,6 olarak ölçülmüştür. Ayrıca yöntemin elle sınıflamada hatalı sınıfa atanmış olan 7 adet raporu doğru sınıfladığı gözlenmiştir. Önerilen yöntemin başarımının artırılması için öğrenme kümesinin büyütülmesi, doğal dil işleme çözümlerinden yararlanılması ve anatomik/patolojik bilgileri kodlayan ontolojilerin kullanılması gibi yollar denenebilir. Buna ek olarak bu yöntem konuşma tanıma çözümleri ile birlikte kullanılarak radyologların ses kayıtlarından raporların otomatik üretilmesi gerçekleştirilebilir. Son olarak, bu sistem kullanıcı geribildirimi yoluyla geliştirilebilir.
Özet (Çeviri)
Text mining and text classification is a popular area of machine learning and information retrieval. Automated categorization and analysis of medical documents may improve work flow, and aid in better diagnosis and therapy planning. There is already some research done on analysis and categorization of radiology reports. However, to the best of our knowledge there is no prior work on anatomical region based classification of Turkish radiology reports. In order to fill this gap, this thesis focuses on dictionary-based classification of Turkish radiology reports into anatomical regions. The proposed solution is intented to automatize, speed up, and improve the accuracy of the task of classifying these documents, which is manually realized traditionally. The proposed solution, implemented in Bash environment, consists of header-footer removal, Turkish character elimination, stemming, word frequency analysis, normalization, and scoring steps. Training (n=69) and performance evaluation (n=161) of the system is realized using a total of 230 Turkish radiology reports from 8 different anatomical regions acquired from routine clinical practice. F-score of the system is measured as 98,6%, and it is observed that the proposed system correctly identifies the actual classes of 7 reports that were previously misclassified by the radiology staff. In order to improve the accuracy of the system one can increase the size of the training set, incorporate natural language processing solutions, or make use of ontologies that encode anatomical/pathological knowledge. In addition to that, the proposed system can be integrated with speech processing solutions to automatically create radiology reports from audio recordings of radiologists. Lastly, the system can be further improved by user feedback.
Benzer Tezler
- Ontology based text mining in Turkish radiology reports
Türkçe radyoloji raporlarında ontoloji tabanlı metin mağdenciliği
ONUR DENİZ
Yüksek Lisans
İngilizce
2012
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilgisayar Mühendisliği Bölümü
DR. MELTEM TURHAN YÖNDEM
PROF. DR. GÖKTÜRK ÜÇOLUK
- Eğitimde metin madenciliği: Türkçe metinlerde sözlük tabanlı duygu analizi
Text mining in education: Dictionary-based in Turkish texts sentiment analysis
LEYLA KARAKUŞ
Yüksek Lisans
Türkçe
2021
Eğitim ve ÖğretimAkdeniz ÜniversitesiEğitim Bilimleri Ana Bilim Dalı
DOÇ. DR. BİLAL BARIŞ ALKAN
- Türkçe öğretmenlerinin teknolojik pedagojik alan bilgisi yeterliliklerinin incelenmesi
Text mining in education: Dictionary-based in Turkish texts sentiment analysis
TUĞÇE AKISKA
Yüksek Lisans
Türkçe
2022
Eğitim ve ÖğretimAkdeniz ÜniversitesiTürkçe ve Sosyal Bilimler Eğitimi Ana Bilim Dalı
DOÇ. DR. BEKİR DİREKCİ
- Text mining analysis of translation, social communication and literary writing for Turkish
Metin madenciliği ile Türkçede çeviri, sosyal iletişim ve edebi yazı analizi
SEVİL ÇALIŞKAN
Yüksek Lisans
İngilizce
2020
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. FAZLI CAN
- İnşaat sözleşmelerinde hak talebi yönetimi: Kamu projeleri için öneri model
Claim management in construction contracts: Proposed model for public construction projects
İSMAİL CENGİZ YILMAZ
Doktora
Türkçe
2013
Mimarlıkİstanbul Teknik ÜniversitesiMimarlık Ana Bilim Dalı
PROF. DR. HÜSEYİN ATİLLA DİKBAŞ