Geri Dön

Classification of medical documents according to diseases

Tıbbi dokümanların hastalıklara göre sınıflandırılması

  1. Tez No: 438121
  2. Yazar: BEKİR PARLAK
  3. Danışmanlar: YRD. DOÇ. DR. ALPER KÜRŞAT UYSAL
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Metin Sınıflandırma, Öznitelik Seçim Yöntemleri, Sınıflandırma Algoritmaları, Önişleme Adımları, Text Classification, Feature Selection Methods, Classification Algorithms, Preprocessing Steps
  7. Yıl: 2016
  8. Dil: İngilizce
  9. Üniversite: Anadolu Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 68

Özet

Bilgisayar kullanımının yaygınlaşmasından sonra, bilgisayar ortamında üretilen dokümanların sayısının her geçen sene ivmeli olarak arttığı görülmektedir. İnternet ortamında metinlerin üssel artışından dolayı otomatik metin sınıflandırma önemli hale gelmiştir. Metin sınıflandırmadaki önemli sorunlar öznitelik sayısının çok olması ve buna bağlı olarak yapılan hatalı sınıflandırmalardır. Bu tez çalışmasında, Türkçe makalelere ait tıbbi metin özetleri kullanılarak İngilizce ve Türkçe içerikli medikal alanda iki farklı veri kümesi oluşturulmuştur. Bu veri kümesi İngilizce tıbbi metin özetleri içeren Ohsumed isimli veri kümesine benzer yapıdadır. Literatürde akademik çalışmalarda kullanılmak üzere Türkçe kaynaklardan elde edilen Ohsumed benzeri bir veri kümesi bulunmamaktadır. Otomatik metin sınıflandırma aşamalarında çeşitli ön işlem, öznitelik seçim yöntemleri ve bu alanda başarılı sınıflandırıcılar kullanılmıştır. Ayrıca diller bazında farklılık gösteren ve ön işleme adımlarından biri olan kök bulma algoritmasının uygulanıp uygulanmamasına göre sınıflandırma başarımının nasıl etkilendiği diller bazında incelenmiştir. Bunun yanı sıra, farklı öznitelik seçim yöntemlerinin sınıflandırmadaki başarımı nasıl etkilediği incelenmiştir. Başarımı etkileyen bir diğer etken olan sınıflandırıcı performansları farklı sınıflandırıcıların uygulanması ile analiz edilmiştir. Son olarak ta, aynı yayınlara ait farklı dillerdeki tıbbi metin özetleri üzerinde en iyi başarımı sağlayan sınıflandırma şemaları belirlenmiştir.

Özet (Çeviri)

The number of documents produced on computers has increased exponentially every year, after the spreading use of the computers. Automatic text classification has become an important due to the exponential growth of texts on the Internet. Significant problems in text classification are the great number of features and misclassification are made accordingly. In this thesis, it is constructed of two different datasets containing English and Turkish abstract belonging to Turkish articles in the medical field. This dataset is similar structure to namely Ohsumed which is containing English medical text summary. In the literature, there is no dataset like Ohsumed datasets obtained from Turkish datasets to be used in academic studies. Various preprocessing, feature selection and successful classifiers in this field are used in automatic text classification stages. It has been investigated in the basis of languages how influences the performance of the classification according to whether stemming which differs in languages and one of the preprocessing steps applied or not. And also, the classification performance of different feature selection method has been investigated. Classifier performance which is another factor affecting the performance was analyzed by applying different classifiers. Finally, classification schemes that provide the best performance on the medical text summary in the same publication and different languages is determined.

Benzer Tezler

  1. Acil servise pelvis travması ile başvuran hastalarda mortaliteye etki eden faktörlerin retrospektif olarak incelenmesi

    Retrospective evaluation of factors affecting mortality in patients presenting to the emergency department with pelvic trauma

    ATAKAN AKAY

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2022

    Acil TıpSelçuk Üniversitesi

    Acil Tıp Ana Bilim Dalı

    PROF. DR. AHMET AK

  2. Cancer diagnosis and classification using ML-based natural language processing: A case study at an Iraqi hospital

    ML tabanlı doğal dil işleme kullanılarak kanser tanısı ve sınıflandırılması: Irak'ta bir hastanede bir vaka çalışması

    SAFA MUWAFAQ NAYYEF AL-FARIS

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. MUSTAFA ÖZBAYRAK

  3. Konjenital hipotiroidi nedeni ile kliniğimize sevk edilen ve konjenital hipotiroidi tanısı alan olguların geriye dönük değerlendirilmesi

    Retrospective evaluation of the patients who were referred to our clinic for congenital hypothyroidism anddiagnosed as congenital hypothyroidism in our clinic

    ELİF TUNÇ

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2021

    Çocuk Sağlığı ve HastalıklarıKaradeniz Teknik Üniversitesi

    Çocuk Sağlığı ve Hastalıkları Ana Bilim Dalı

    PROF. DR. GÜLAY KARAGÜZEL

  4. Bilateral vokal kord paralizisi tedavisinde uygulanan farklı tedavi yöntemlerinin sonuçlarının retrospektif karşılaştırılması

    A retrospective comparison of results of different treatment modalities in bilateral vocal fold paralysis treatment

    MEHMET EGE AKÇA

    Tıpta Uzmanlık

    Türkçe

    Türkçe

    2017

    Kulak Burun ve BoğazUludağ Üniversitesi

    Kulak Burun Boğaz Hastalıkları Ana Bilim Dalı

    PROF. DR. HAMDİ HAKAN COŞKUN