Tahmin modellerinde veri kaymalarının açıklanabilir yapay zekâ araçlarıyla tespit edilmesi
Detecting data drifts in predictive models by explainable artificial intelligence tools
- Tez No: 887864
- Danışmanlar: DR. MUSTAFA ÇAVUŞ
- Tez Türü: Yüksek Lisans
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: Türkçe
- Üniversite: Eskişehir Teknik Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 89
Özet
Kavram kayması, veri setlerinde zamanla meydana gelen ve tahmin modellerininperformansını olumsuz etkileyen değişikliklerdir. Bu tezde, kavram kaymasınıntespitinde kullanılan klasik istatistiksel yöntemlerin bazı durumlarda yetersiz kaldığı elealınmış ve bu eksiklikleri gidermek amacıyla Açıklanabilir Yapay Zeka (AYZ)yöntemlerinden biri olan Kısmi Bağımlılık Profili (PDP) baz alınarak yeni bir yöntemgeliştirilmiştir: Profil Kayması Tespiti (PDD – Profile Drift Detection). Bu yeni yöntem,PDP eğrileri arasındaki değişiklikleri profillerin öklidyen uzaklıkları, türevleri arasındakiöklidyen uzaklık ve Profile Disparity Index (PDI) metrikleri ile değerlendirir.Çalışmada, literatürde bu konuda sıkça kullanılan sentetik ve gerçek hayat verisetleri kullanılarak, farklı yığın (batch) sayılarında veriler bölüntülenerek istatistikseltestler ve PDD yöntemi karşılaştırılmıştır. PDD, genellikle daha az sayıda kavramkayması tespit etmesine rağmen, model performansı bakımından istatistiksel testlerlebenzer veya daha iyi sonuçlar göstermiş ve yığın sayısı değiştiğinde de tutarlı sonuçlarvermiştir. PDD, model ile veri arasındaki ilişkinin daha detaylı incelenmesine olanaktanır. Önerilen yöntemin performansı, farklı yığın büyüklükleri için sentetik ve gerçekhayat verileri üzerinde yapılan deneysel çalışmalarla araştırılmıştır. Elde edilen bulgularagöre yöntemin kullanılabilirliği tartışılmıştır.
Özet (Çeviri)
Concept drift refers to changes in data sets over time that negatively impact theperformance of predictive models. This thesis addresses the limitations of traditionalstatistical methods used to detect concept drift and proposes a new method based onPartial Dependence Profile (PDP), an eXplainable Artificial Intelligence (XAI)technique: Profile Drift Detection (PDD). This new method evaluates changes in PDPcurves using metrics such as Euclidean distances between profiles, Euclidean distancesbetween their derivatives, and the Profile Disparity Index (PDI).The study compares traditional statistical tests and the Profile Drift Detection(PDD) method using synthetic and real-world data sets commonly used in the literature.The data sets are divided into different batch sizes for analysis. PDD generally detectsfewer instances of concept drift while achieving similar or better model performancecompared to statistical tests, and it provides consistent results when batch sizes vary.Additionally, PDD enables a more detailed examination of the relationship between themodel and the data. The performance of the proposed method is investigated throughexperimental studies conducted on synthetic and real-world data for different batch sizes.The usability of the method is discussed based on the findings.
Benzer Tezler
- Aiding agricultural practices with the exploration of earth observation data via machine learning
Yer gözlem uydu verilerinin tarımsal uygulamalara yardımcı olmak amacıya makine öğrenme algoritmaları ile incelenmesi
MEHMET FURKAN ÇELİK
Doktora
İngilizce
2023
Jeodezi ve Fotogrametriİstanbul Teknik ÜniversitesiGeomatik Mühendisliği Ana Bilim Dalı
PROF. DR. ESRA ERTEN
- Derin öğrenme algoritmaları kullanarak öğrenci akademik performansının erken tahmini
Early prediction of student academic performance using deep learning algorithms
AHMET KALA
Doktora
Türkçe
2025
Endüstri ve Endüstri MühendisliğiSakarya ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. ORHAN TORKUL
DR. ÖĞR. ÜYESİ TUĞBA YILDIZ
- Comressıon of convolutıonal neural networks vıa hıgh dımensıonal model representatıon
Yüksek boyutlu model gösterilimi aracılığıyla evrişimsel sinir ağlarının sıkıştırılması
BERNA YILMAZ
Yüksek Lisans
İngilizce
2025
Bilim ve Teknolojiİstanbul Teknik ÜniversitesiHesaplamalı Bilimler ve Mühendislik Ana Bilim Dalı
DR. ÖĞR. ÜYESİ SÜHA TUNA
- Pediatrik göğüs ağrısı ile kalp hastalığı tanısında makine öğrenmesi uygulamaları
Machine learning applications in the diagnosis of heart disease in pediatric chest pain
ASUDE DEMİR
Yüksek Lisans
Türkçe
2025
Endüstri ve Endüstri MühendisliğiBursa Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. YUNUS DEMİR
- Coupling different machine learning and meta-heuristic optimization techniques to generate the snow avalanche susceptibility map in French alps
Makine öğrenmesi ve meta-sezgisel optimizasyon tekniklerinin birleştirilmesiyle Fransız alplerinde kar çığları duyarlılık haritası oluşturma
ENES CAN KAYHAN
Yüksek Lisans
İngilizce
2025
İnşaat Mühendisliğiİstanbul Teknik Üniversitesiİnşaat Mühendisliği Ana Bilim Dalı
DOÇ. DR. ÖMER EKMEKCİOĞLU