Tahmin modellerinde veri kaymalarının açıklanabilir yapay zekâ araçlarıyla tespit edilmesi
Detecting data drifts in predictive models by explainable artificial intelligence tools
- Tez No: 887864
- Danışmanlar: DR. MUSTAFA ÇAVUŞ
- Tez Türü: Yüksek Lisans
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2024
- Dil: Türkçe
- Üniversite: Eskişehir Teknik Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 89
Özet
Kavram kayması, veri setlerinde zamanla meydana gelen ve tahmin modellerininperformansını olumsuz etkileyen değişikliklerdir. Bu tezde, kavram kaymasınıntespitinde kullanılan klasik istatistiksel yöntemlerin bazı durumlarda yetersiz kaldığı elealınmış ve bu eksiklikleri gidermek amacıyla Açıklanabilir Yapay Zeka (AYZ)yöntemlerinden biri olan Kısmi Bağımlılık Profili (PDP) baz alınarak yeni bir yöntemgeliştirilmiştir: Profil Kayması Tespiti (PDD – Profile Drift Detection). Bu yeni yöntem,PDP eğrileri arasındaki değişiklikleri profillerin öklidyen uzaklıkları, türevleri arasındakiöklidyen uzaklık ve Profile Disparity Index (PDI) metrikleri ile değerlendirir.Çalışmada, literatürde bu konuda sıkça kullanılan sentetik ve gerçek hayat verisetleri kullanılarak, farklı yığın (batch) sayılarında veriler bölüntülenerek istatistikseltestler ve PDD yöntemi karşılaştırılmıştır. PDD, genellikle daha az sayıda kavramkayması tespit etmesine rağmen, model performansı bakımından istatistiksel testlerlebenzer veya daha iyi sonuçlar göstermiş ve yığın sayısı değiştiğinde de tutarlı sonuçlarvermiştir. PDD, model ile veri arasındaki ilişkinin daha detaylı incelenmesine olanaktanır. Önerilen yöntemin performansı, farklı yığın büyüklükleri için sentetik ve gerçekhayat verileri üzerinde yapılan deneysel çalışmalarla araştırılmıştır. Elde edilen bulgularagöre yöntemin kullanılabilirliği tartışılmıştır.
Özet (Çeviri)
Concept drift refers to changes in data sets over time that negatively impact theperformance of predictive models. This thesis addresses the limitations of traditionalstatistical methods used to detect concept drift and proposes a new method based onPartial Dependence Profile (PDP), an eXplainable Artificial Intelligence (XAI)technique: Profile Drift Detection (PDD). This new method evaluates changes in PDPcurves using metrics such as Euclidean distances between profiles, Euclidean distancesbetween their derivatives, and the Profile Disparity Index (PDI).The study compares traditional statistical tests and the Profile Drift Detection(PDD) method using synthetic and real-world data sets commonly used in the literature.The data sets are divided into different batch sizes for analysis. PDD generally detectsfewer instances of concept drift while achieving similar or better model performancecompared to statistical tests, and it provides consistent results when batch sizes vary.Additionally, PDD enables a more detailed examination of the relationship between themodel and the data. The performance of the proposed method is investigated throughexperimental studies conducted on synthetic and real-world data for different batch sizes.The usability of the method is discussed based on the findings.
Benzer Tezler
- Aiding agricultural practices with the exploration of earth observation data via machine learning
Yer gözlem uydu verilerinin tarımsal uygulamalara yardımcı olmak amacıya makine öğrenme algoritmaları ile incelenmesi
MEHMET FURKAN ÇELİK
Doktora
İngilizce
2023
Jeodezi ve Fotogrametriİstanbul Teknik ÜniversitesiGeomatik Mühendisliği Ana Bilim Dalı
PROF. DR. ESRA ERTEN
- Assessing the performance of gridded precipitation products – a comparative analysis of the Black Sea and East Africa regions
Gridli yağış ürünlerinin performansının belirlenmesi - Karadeniz ve Doğu Afrika bölgelerinin karşılaştırmalı analizi
SEAD AHMED SWALIH
Doktora
İngilizce
2022
İnşaat Mühendisliğiİstanbul Teknik Üniversitesiİnşaat Mühendisliği Ana Bilim Dalı
PROF. DR. ERCAN KAHYA
- Türkiye için yeni bir yer hareketi tahmin denklemi geliştirilmesi
Development of a new ground motion prediction equation for Turkey
SERRA TINBIR KOLAŞİN
Yüksek Lisans
Türkçe
2023
Deprem Mühendisliğiİstanbul Teknik ÜniversitesiDeprem Mühendisliği Ana Bilim Dalı
DOÇ. DR. ALİ SARI
- Dalgacık bulanık zaman serisi yöntemi ile aylık akım tahmini
Monthly river discharge prediction by wavelet fuzzy time series method
EYYUP ENSAR BAŞAKIN
Yüksek Lisans
Türkçe
2018
İnşaat Mühendisliğiİstanbul Teknik Üniversitesiİnşaat Mühendisliği Ana Bilim Dalı
DOÇ. DR. MEHMET ÖZGER
- Derin öğrenme ve büyük veri analitiği yöntemleriKullanarak Covid-19 yayılımının ileriye dönük tahmini
Forecasting the spread of covid-19 using deep learning and big data analytics methods
CYLAS KIGANDA
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Bilimleri Ana Bilim Dalı
PROF. DR. MUHAMMET ALİ AKCAYOL