Geri Dön

Veri madenciliği ve makine öğrenmesi yaklaşımı ile tiroit kanserinin tanılanması

Diagnosis of thyroid cancer using data mining and machine learning approach

  1. Tez No: 863688
  2. Yazar: MEHMET EMİN ASAN
  3. Danışmanlar: PROF. DR. HARUN TAŞKIN
  4. Tez Türü: Doktora
  5. Konular: Endüstri ve Endüstri Mühendisliği, Industrial and Industrial Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: Sakarya Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Endüstri Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 141

Özet

Sağlık sistemi, hedeflenen kitlenin sağlıkları ile ilgili tüm hizmetlerini görmek üzere ilgili kurumların, kaynakların ve insanların bir arada örgütlendiği bir sistem olarak tanımlanabilir. DSÖ'ne göre Sağlık sistemi, sağlığı korumak, hastalıkları tedavi etmek ve bireylerde sağlıklı gelişimi sağlamak üzere kişileri, eylemleri ve organizasyonları kapsamaktadır. Her yıl artarak devam eden hastalık ve ölüm oranları zaman, para ve insan gücü maliyetleri açılarından büyük giderlere muhatap olmaktadır. Hızlı artan bu maliyetler daha fazla insan gücü istihdamı ile çözülememektedir. Teknolojinin gelişimi ve birçok alanda olduğu gibi tıp alanında da yararlı neticeler vermesi sonucu, yukarıda belirtilen problemlerin çözümü ve maliyetlerin olabildiğince aza indirilerek verimliliğin arttırılması amacıyla, uzmanlar tarafından yürütülen karar süreçleri zeki karar destek sistemleri ile desteklenme potansiyeline sahiptir. Veri bilimi (Data science) ve eldeki hasta verilerinin birer anlamlı bilgiye dönüştürülmeleri için kullanılacak teknikler elde etmek istenilen sonuçların anahtarı niteliğindedir. Bu anahtar, maliyetleri azaltacak ve doktorların üzerinden fazlalık işleri alarak hastalara daha fazla bakım ve daha verimli tedavi olanakları sağlayacak şekilde sağlık sistemlerini başarıya ulaştıracaklardır. Veri bilimi bu başarısını, çoklu veri kullanımı ile tanı ve tedavide çoklu seçeneklere sahip olmasına borçludur ve hatalı sonuçlar vermesi çok küçük düzeylerde kalmaktadır. Buna mukabil birçok doktorun son tıbbi gelişmeler hakkında yayınlanan örneğin binlerce makaleyi (verileri kontrol altında tutmak açısından) okuyabilmesi ve elde ettiği tüm verilerden analizler çıkartarak tanı ve tedavi yapabilmesi mümkün görünmemektedir. Uzman kontrolünde yazılım ve donanım olarak kullanılan teknolojik yapılar, günümüzde yapay zekâ adıyla anılan ve kendi kendine öğrenerek karar çıktıları üretebilen makine öğrenmesi türünden algoritmalar ile desteklenebilmektedirler. Bu araştırmada önerilen yöntem, uygun veri toplama (bizim durumumuzda, çevrimiçi eldeki veri setleri), veri seçimi, veri ön işleme işlemlerinin gerçekleştirilmeleri ile birlikte destek vektör makineleri ve lojistik regresyon gibi makine öğrenmesi yöntemlerinin karar destek sistemleri olarak modellenmelerinde veri madenciliği ve makine öğrenmesi yaklaşımları olmuştur. Elde edilen bilgiler, tablolar ve diyagramlarda gösterilmek üzere sonuçların görselleştirilmesi ve değerlendirilmesi ile başlayan farklı veri madenciliği süreçlerini de içermektedir. Tanı ve tedavi için eldeki kullanılabilir veriler, destek vektör makineleri, lojistik regresyon teknikleri ile diğer makine öğrenmesi algoritmaları ile uzmanlık seviyesinde karar verme süreçlerine yardımcı olabilir bilgilere dönüştürülmüştür. xxii Öznitelik seçme teknikleri amaca yönelik araştırılan tüm modelleri ve bu modellerin sonuçlarını etkilemektedir. Bu sebeple mümkün olan tüm öznitelik seçme algoritmaları denenerek en uygun doğru sınıflandırma elde edilmiştir. Farklı öznitelik seçme algoritmalarından elde edilen en uygun özniteliklerin, sonuçları doğru vermede (Accuracy) çok önemli olduğu ortaya konmuştur. Ayrıca model değerlendirmesinde Spesifiklik ölçüsü gibi farklı ölçülerin kullanılabileceği ve bu ölçüler üzerinden doğru sonuçlar ve analizler yapılabileceği gösterilmiştir. Destek vektör makineleri sınıflandırıcısı kullanılarak oluşturulan bir model üzerinden bir web uygulaması çalıştırılmıştır. Girdi olarak elde var olan tiroit kanser hasta verilerini alan web formu, modelin verdiği karar üzerinden hastanın kanserli olup olmadığı sonucunu web ara yüzü üzerinden ekrana yansıtmaktadır.

Özet (Çeviri)

The health system can be defined as a system in which relevant institutions, resources and people are organized together to provide all health-related services to the targeted population. According to WHO, the health system includes people, actions and organizations to protect health, treat diseases, and ensure healthy development in individuals. Today's Health services within the health system stand out with their“Medical Practice”aspect rather than“Medical Science”. Today, diagnosis is provided partly through the information provided by the patients, the patient's medical history, and/or the symptoms of the disease/diseases they have (even if the patients cannot adequately convey the symptoms they have in an appropriate language). Diseases can be diagnosed based on information/experiences obtained from previous procedures on different patients or information obtained from old lectures in medical schools that doctors can partially remember. With exceptions, it is often possible to receive three different diagnoses and treatment recommendations from three different doctors for a health problem. In this case, the clearest result is the delayed treatment and the monetary and temporal costs for the patient. Disease and death rates, which continue to increase every year, result in great expenses in terms of time, money, and manpower costs. These rapidly increasing costs cannot be solved by employing more manpower. As a result of the development of technology and it's yielding beneficial results in the field of medicine as in many fields, decision processes carried out by experts have the potential to be supported by intelligent decision support systems to solve the above-mentioned problems and increase efficiency by minimizing costs as much as possible. For the field of Medicine in general, and health services in particular, to provide higher quality and more efficient services, they need to be supported through various systems and the costs of this level of services must be reduced. The health system, which is becoming more specialized day by day but cannot adequately meet our expectations of receiving quality health care, cause our health workers to be under more labor force. This situation necessitates the need to support the healthcare system, especially our specialist doctors and healthcare professionals. Once we obtain collective data about patients and start operating these data within the framework of Data Science by establishing appropriate systems and ensuring data compatibility between them, the knowledge-based expert systems to be used will make inferences on this data, allowing doctors to be faster, more effective, and more efficient in their work. Data Science and the techniques used to transform existing patient data into meaningful information are the key to the results we want to achieve. This key will xxiv make healthcare systems successful by reducing costs and taking redundant work off doctors, providing patients with more care and more efficient treatment opportunities. Data science owes its success to the use of multiple data and multiple options in diagnosis and treatment, and its erroneous results are minimal. On the other hand, it does not seem possible for many doctors to read, for example, thousands of articles published about the latest medical developments (to keep the data under control) and to make diagnoses and treatments by analyzing all the data they obtain. According to statistical data, Cancer has been one of the leading causes of death worldwide, with an estimated 9.6 million deaths in 2018. Although Thyroid Cancer, which is not among the most common types of cancer in terms of the majority of cases, is not statistically at the top in terms of risk of death and disease, the difficulty of diagnosis and the inability to perform a biopsy compared to other types of cancer have brought different methods for diagnosis to the agenda. In this type of cancer, where a definitive diagnosis requires surgery, misdiagnosis results in unnecessary surgery. Sometimes, when a patient is diagnosed as having cancer and is biopsied after the surgery, it is concluded that he or she is cancer-free, while in some cases the opposite results occur. On this occasion, the need to use data mining and machine learning algorithms for thyroid cancer diagnosis has emerged. Technological structures used as software and hardware under expert control can be supported by algorithms of the Machine Learning type, now known as Artificial Intelligence, which can produce decision outputs by self-learning. Based on this, after obtaining the necessary ethics committee permissions from the General Surgery Department of Sakarya University Research Hospital, we tried to create a model that can make the diagnosis by using the Thyroid cancer patient data we obtained from various Machine Learning algorithms. The method proposed in this research has been Data mining and Machine learning approaches in modeling Machine learning methods such as Support vector machines and Logistic regression as Decision support systems, along with appropriate data collection (in our case, offline available data sets), data selection, data pre-processing operations. The information obtained also includes different data mining processes, starting with visualizing and evaluating the results to be displayed in tables and diagrams. Available data for diagnosis and treatment have been transformed into information that can help decision-making processes at the expert level with Support vector machines, Logistic regression techniques and other machine learning algorithms. Feature selection techniques affect all models researched for the purpose and the results of these models. For this reason, all possible feature selection algorithms were tried and the most appropriate correct classification was obtained. It has been demonstrated that the most appropriate features obtained from different feature selection algorithms are very important in providing accurate results (Accuracy). In addition, it has been shown that different measures such as the Specificity measure can be used in model evaluation, and accurate results and analyses can be made through these measures. We ran a web application on a model we created using the support vector machines classifier. The web form, which takes the Thyroid cancer patient data as input, reflects the result of whether the patient has cancer or not based on the decision made by the model, on the screen via the web interface. xxv This model can help doctors as a decision support system to diagnose thyroid cancer. The model classifier we created in this section can also be used in other binary disease diagnoses.

Benzer Tezler

  1. Makine öğrenmesi algoritmalarının hibrit yaklaşımı ile ağ anomalisi tespiti

    Network anomaly detection with a hybrid approach of machine learning algorthms

    FEYZA ÖZGER

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya Uygulamalı Bilimler Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HALİT ÖZTEKİN

  2. Pre-release forecasting of imdb movie ratings using multi-view data

    Gösterime girmemiş filmlerin ımdb puanının farklı özellik kümeleri kullanılarak tahmin edilmesi

    BEYZA ÇİZMECİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ŞULE ÖĞÜDÜCÜ

  3. A challenge to copyright: Text and data mining

    Telif hukukunda metin ve veri madenciliği

    ESMA MUHEYNE DOĞAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Hukukİstanbul Medeniyet Üniversitesi

    Özel Hukuk Ana Bilim Dalı

    DOÇ. DR. CAHİT SULUK

  4. Data engineering and management in textile sector

    Tekstil sektöründe veri mühendisliği ve yönetimi

    PELİN YILDIRIM

    Doktora

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDokuz Eylül Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. DERYA BİRANT

  5. Meteorolojik ölçüm verilerinin regresyon yaklaşımı ile modellenmesinde veri madenciliği aşamaları ve kullanımı

    Data mining stages and usage in modeling meteorological measurement data with regression approach

    SELÇUK KURT

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    MeteorolojiMuğla Sıtkı Koçman Üniversitesi

    Çevre Bilimleri Ana Bilim Dalı

    DOÇ. DR. OĞUZ AKPOLAT