Veri kalitesi ve miktarının transfer öğrenme performansına etkisi: tablo verileri ile Covid-19 teşhisi örneği
The effect of data quality and quantity on transfer learning performance: Covid-19 diagnosis example with tabular data
- Tez No: 968124
- Danışmanlar: PROF. DR. ERALP DOĞU
- Tez Türü: Doktora
- Konular: Biyoistatistik, İstatistik, Biostatistics, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: Türkçe
- Üniversite: Muğla Sıtkı Koçman Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 150
Özet
Bu çalışmanın amacı, veri bozulması durumunda, COVID-19 hastalığının teşhisi için kaynak ve hedef veri kümeleri arasında, model transferinin mümkün olup olmadığını ve bu transferin başarısını etkileyen temel faktörleri araştırmayı amaçlamaktadır. Çalışmada, kaynak veri kümesinin boyutu ve hem kaynak hem de hedef veri kümelerindeki gürültü seviyesi ana değişkenler olarak ele alınmış; bu değişkenlerin tablo verileri ile transfer öğrenme bağlamında model performansı üzerindeki etkileri sistematik olarak analiz edilmiştir. Ayrıca model performansını belirleyen hiperparametrelerin hedef veri kümesinde ne ölçüde etkili olduğu da değerlendirilmektedir. Bulgular, kaynak veri boyutunun artırılmasının transfer sonrası model performansını önemli ölçüde artırdığını; diğer yandan hedef veriye eklenen gürültü seviyesinin artırılmasının model performansını olumsuz etkilediğini ve özellikle yüksek gürültü varlığında transfer performansında önemli düşüşler gözlemlendiğini göstermektedir. Bu bağlamda çalışma, tablo verileri üzerinde transfer öğrenmenin potansiyelini ortaya koymakta ve veri kalitesi ile örneklem büyüklüğünün transfer performansı üzerindeki kritik rolüne dikkat çekmektedir.
Özet (Çeviri)
The aim of this study is to investigate the feasibility of model transfer between source and target datasets for the diagnosis of COVID-19 disease in case of data corruption and the main factors affecting the success of this transfer. In the study, the size of the source dataset and the noise level in both source and target datasets are considered as the main variables, and their effects on model performance in the context of transfer learning with tabular data are systematically analysed. In addition, the extent to which the hyperparameters that determine model performance are effective in the target dataset is also evaluated. The findings show that increasing the source data size significantly improves the post-transfer model performance; on the other hand, increasing the noise level added to the target data has a negative impact on the model performance and significant decreases in transfer performance are observed, especially in the presence of high noise. In this context, the study demonstrates the potential of transfer learning on tabular data and draws attention to the critical role of data quality and sample size on transfer performance.
Benzer Tezler
- Measuring and evaluating the maintainability of microservices
Mikroservislerin sürdürülebilirliğinin ölçülmesi ve değerlendirilmesi
RAHİME YILMAZ
Doktora
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. FEZA BUZLUCA
- Gaziantep'te PM2.5 konsantrasyonunun zamansal ve mekânsaltahminine yönelik transfer öğrenme destekli hibrit yapay zeka modelleri
Spatio-temporal estimation of PM2.5 concentrations in gaziantepusing transfer learning-based hybrid artificial intelligence models
TÜRKAN ZENGİN GÖMLEKSİZ
Yüksek Lisans
Türkçe
2025
Meteorolojiİstanbul Teknik Üniversitesiİklim Bilimi ve Meteoroloji Mühendisliği Ana Bilim Dalı
PROF. DR. HÜSEYİN TOROS
- Evaluation des performances des projets de l'affaire électronique basé sur GRC en utilisant le tableau de bord équilibré et management de capital client
CRM bazlı e-iş proje performanslarının dengelenmiş skorkartı ve entelektüel müşteri sermayesi yönetimi ile değerlendirilmesi
BURHAN BURÇ KILIÇER
Yüksek Lisans
Fransızca
2004
Endüstri ve Endüstri MühendisliğiGalatasaray ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF.DR. ETHEM TOLGA
- An efficient multi-neural network ensemble model for image classification
Görüntü sınıflandırması için verimli bir çoklu-sinir ağ topluluğu modeli
VELİ NAKÇİ
Yüksek Lisans
İngilizce
2025
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. MUSTAFA ALTUN
- Derin öğrenme tabanlı şiddetli farenjit tespiti
Deep learning based severe pharyngitis detection
TUĞBA TAK
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKarabük ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. HAKAN KUTUCU