Geri Dön

Tahmin modellerinde veri kaymalarının açıklanabilir yapay zekâ araçlarıyla tespit edilmesi

Detecting data drifts in predictive models by explainable artificial intelligence tools

  1. Tez No: 887864
  2. Yazar: UĞUR DAR
  3. Danışmanlar: DR. MUSTAFA ÇAVUŞ
  4. Tez Türü: Yüksek Lisans
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: Eskişehir Teknik Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 89

Özet

Kavram kayması, veri setlerinde zamanla meydana gelen ve tahmin modellerininperformansını olumsuz etkileyen değişikliklerdir. Bu tezde, kavram kaymasınıntespitinde kullanılan klasik istatistiksel yöntemlerin bazı durumlarda yetersiz kaldığı elealınmış ve bu eksiklikleri gidermek amacıyla Açıklanabilir Yapay Zeka (AYZ)yöntemlerinden biri olan Kısmi Bağımlılık Profili (PDP) baz alınarak yeni bir yöntemgeliştirilmiştir: Profil Kayması Tespiti (PDD – Profile Drift Detection). Bu yeni yöntem,PDP eğrileri arasındaki değişiklikleri profillerin öklidyen uzaklıkları, türevleri arasındakiöklidyen uzaklık ve Profile Disparity Index (PDI) metrikleri ile değerlendirir.Çalışmada, literatürde bu konuda sıkça kullanılan sentetik ve gerçek hayat verisetleri kullanılarak, farklı yığın (batch) sayılarında veriler bölüntülenerek istatistikseltestler ve PDD yöntemi karşılaştırılmıştır. PDD, genellikle daha az sayıda kavramkayması tespit etmesine rağmen, model performansı bakımından istatistiksel testlerlebenzer veya daha iyi sonuçlar göstermiş ve yığın sayısı değiştiğinde de tutarlı sonuçlarvermiştir. PDD, model ile veri arasındaki ilişkinin daha detaylı incelenmesine olanaktanır. Önerilen yöntemin performansı, farklı yığın büyüklükleri için sentetik ve gerçekhayat verileri üzerinde yapılan deneysel çalışmalarla araştırılmıştır. Elde edilen bulgularagöre yöntemin kullanılabilirliği tartışılmıştır.

Özet (Çeviri)

Concept drift refers to changes in data sets over time that negatively impact theperformance of predictive models. This thesis addresses the limitations of traditionalstatistical methods used to detect concept drift and proposes a new method based onPartial Dependence Profile (PDP), an eXplainable Artificial Intelligence (XAI)technique: Profile Drift Detection (PDD). This new method evaluates changes in PDPcurves using metrics such as Euclidean distances between profiles, Euclidean distancesbetween their derivatives, and the Profile Disparity Index (PDI).The study compares traditional statistical tests and the Profile Drift Detection(PDD) method using synthetic and real-world data sets commonly used in the literature.The data sets are divided into different batch sizes for analysis. PDD generally detectsfewer instances of concept drift while achieving similar or better model performancecompared to statistical tests, and it provides consistent results when batch sizes vary.Additionally, PDD enables a more detailed examination of the relationship between themodel and the data. The performance of the proposed method is investigated throughexperimental studies conducted on synthetic and real-world data for different batch sizes.The usability of the method is discussed based on the findings.

Benzer Tezler

  1. Aiding agricultural practices with the exploration of earth observation data via machine learning

    Yer gözlem uydu verilerinin tarımsal uygulamalara yardımcı olmak amacıya makine öğrenme algoritmaları ile incelenmesi

    MEHMET FURKAN ÇELİK

    Doktora

    İngilizce

    İngilizce

    2023

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    Geomatik Mühendisliği Ana Bilim Dalı

    PROF. DR. ESRA ERTEN

  2. Derin öğrenme algoritmaları kullanarak öğrenci akademik performansının erken tahmini

    Early prediction of student academic performance using deep learning algorithms

    AHMET KALA

    Doktora

    Türkçe

    Türkçe

    2025

    Endüstri ve Endüstri MühendisliğiSakarya Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. ORHAN TORKUL

    DR. ÖĞR. ÜYESİ TUĞBA YILDIZ

  3. Comressıon of convolutıonal neural networks vıa hıgh dımensıonal model representatıon

    Yüksek boyutlu model gösterilimi aracılığıyla evrişimsel sinir ağlarının sıkıştırılması

    BERNA YILMAZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2025

    Bilim ve Teknolojiİstanbul Teknik Üniversitesi

    Hesaplamalı Bilimler ve Mühendislik Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ SÜHA TUNA

  4. Pediatrik göğüs ağrısı ile kalp hastalığı tanısında makine öğrenmesi uygulamaları

    Machine learning applications in the diagnosis of heart disease in pediatric chest pain

    ASUDE DEMİR

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Endüstri ve Endüstri MühendisliğiBursa Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. YUNUS DEMİR

  5. Coupling different machine learning and meta-heuristic optimization techniques to generate the snow avalanche susceptibility map in French alps

    Makine öğrenmesi ve meta-sezgisel optimizasyon tekniklerinin birleştirilmesiyle Fransız alplerinde kar çığları duyarlılık haritası oluşturma

    ENES CAN KAYHAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2025

    İnşaat Mühendisliğiİstanbul Teknik Üniversitesi

    İnşaat Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ÖMER EKMEKCİOĞLU