Geri Dön

Veri kalitesi ve miktarının transfer öğrenme performansına etkisi: tablo verileri ile Covid-19 teşhisi örneği

The effect of data quality and quantity on transfer learning performance: Covid-19 diagnosis example with tabular data

  1. Tez No: 968124
  2. Yazar: VOLKAN KAPUCU
  3. Danışmanlar: PROF. DR. ERALP DOĞU
  4. Tez Türü: Doktora
  5. Konular: Biyoistatistik, İstatistik, Biostatistics, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: Türkçe
  9. Üniversite: Muğla Sıtkı Koçman Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 150

Özet

Bu çalışmanın amacı, veri bozulması durumunda, COVID-19 hastalığının teşhisi için kaynak ve hedef veri kümeleri arasında, model transferinin mümkün olup olmadığını ve bu transferin başarısını etkileyen temel faktörleri araştırmayı amaçlamaktadır. Çalışmada, kaynak veri kümesinin boyutu ve hem kaynak hem de hedef veri kümelerindeki gürültü seviyesi ana değişkenler olarak ele alınmış; bu değişkenlerin tablo verileri ile transfer öğrenme bağlamında model performansı üzerindeki etkileri sistematik olarak analiz edilmiştir. Ayrıca model performansını belirleyen hiperparametrelerin hedef veri kümesinde ne ölçüde etkili olduğu da değerlendirilmektedir. Bulgular, kaynak veri boyutunun artırılmasının transfer sonrası model performansını önemli ölçüde artırdığını; diğer yandan hedef veriye eklenen gürültü seviyesinin artırılmasının model performansını olumsuz etkilediğini ve özellikle yüksek gürültü varlığında transfer performansında önemli düşüşler gözlemlendiğini göstermektedir. Bu bağlamda çalışma, tablo verileri üzerinde transfer öğrenmenin potansiyelini ortaya koymakta ve veri kalitesi ile örneklem büyüklüğünün transfer performansı üzerindeki kritik rolüne dikkat çekmektedir.

Özet (Çeviri)

The aim of this study is to investigate the feasibility of model transfer between source and target datasets for the diagnosis of COVID-19 disease in case of data corruption and the main factors affecting the success of this transfer. In the study, the size of the source dataset and the noise level in both source and target datasets are considered as the main variables, and their effects on model performance in the context of transfer learning with tabular data are systematically analysed. In addition, the extent to which the hyperparameters that determine model performance are effective in the target dataset is also evaluated. The findings show that increasing the source data size significantly improves the post-transfer model performance; on the other hand, increasing the noise level added to the target data has a negative impact on the model performance and significant decreases in transfer performance are observed, especially in the presence of high noise. In this context, the study demonstrates the potential of transfer learning on tabular data and draws attention to the critical role of data quality and sample size on transfer performance.

Benzer Tezler

  1. Measuring and evaluating the maintainability of microservices

    Mikroservislerin sürdürülebilirliğinin ölçülmesi ve değerlendirilmesi

    RAHİME YILMAZ

    Doktora

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. FEZA BUZLUCA

  2. Gaziantep'te PM2.5 konsantrasyonunun zamansal ve mekânsaltahminine yönelik transfer öğrenme destekli hibrit yapay zeka modelleri

    Spatio-temporal estimation of PM2.5 concentrations in gaziantepusing transfer learning-based hybrid artificial intelligence models

    TÜRKAN ZENGİN GÖMLEKSİZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Meteorolojiİstanbul Teknik Üniversitesi

    İklim Bilimi ve Meteoroloji Mühendisliği Ana Bilim Dalı

    PROF. DR. HÜSEYİN TOROS

  3. Evaluation des performances des projets de l'affaire électronique basé sur GRC en utilisant le tableau de bord équilibré et management de capital client

    CRM bazlı e-iş proje performanslarının dengelenmiş skorkartı ve entelektüel müşteri sermayesi yönetimi ile değerlendirilmesi

    BURHAN BURÇ KILIÇER

    Yüksek Lisans

    Fransızca

    Fransızca

    2004

    Endüstri ve Endüstri MühendisliğiGalatasaray Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF.DR. ETHEM TOLGA

  4. An efficient multi-neural network ensemble model for image classification

    Görüntü sınıflandırması için verimli bir çoklu-sinir ağ topluluğu modeli

    VELİ NAKÇİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2025

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. MUSTAFA ALTUN

  5. Derin öğrenme tabanlı şiddetli farenjit tespiti

    Deep learning based severe pharyngitis detection

    TUĞBA TAK

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKarabük Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HAKAN KUTUCU