Geri Dön

Minority class augmentation in tabular data using generative adversarial network models

Üretken çekişmeli ağ modelleri kullanarak tablo verisinde azınlık sınıf artırımı

  1. Tez No: 831156
  2. Yazar: ESRANUR POLAT
  3. Danışmanlar: DOÇ. DR. FULYA GÖKALP YAVUZ
  4. Tez Türü: Yüksek Lisans
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: İngilizce
  9. Üniversite: Orta Doğu Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 110

Özet

Hızla gelişen teknoloji ortamında, ilerleyen teknoloji ile verilerin katlanarak büyümesi arasındaki etkileşim, yapay zekanın ortaya çıkmasında bir tetikleyici olmuştur. Bu veriye dayalı geri bildirim döngüleri, sürekli özelleştirmeye olanak tanıyarak yapay zekanın gelişmesini sağlamış ve yeni bir teknolojik sıçramayı temsil etmiştir. Bununla birlikte, yapay zeka alanında birçok zorluk da ortaya çıkmaktadır. Etkili eğitim, büyük ve çeşitli veri kümeleri gerektiren önemli miktarda veri gerektirdiğinden, bu zorluklardan ilki, yapay zeka modelini beslemek için gereken verilerin kalitesi ve miktarıdır. Diğer bir konu da yapay zeka sistemlerinin sağlık, finans, havacılık ve savunma gibi alanlardaki gizli bilgileri içselleştirmesi nedeniyle veri gizliliği endişelerinin ortaya çıkmasıdır. Veri kümelerinde dengesiz sınıflara sahip olmak, özellikle sınıflandırma algoritmalarının adaletini ve doğruluğunu etkilediği için başka bir zorluktur. Bu zorlukların üstesinden gelmek için veri bilimi ve yapay zeka uzmanları, verileri sentezlemek ve/veya artırmak için çeşitli yöntemler geliştirmektedir. Bu çalışmalarda önemli rol oynayan Üretken Çekişmeli Ağlar ile farklı veri türlerinin üretilmesinde büyük bir başarı sağlanmıştır. Bu tez tablo verilerindeki azınlık sınıfını artırmaya odaklanmaktadır. Farklı hacimlere sahip çeşitli açık kaynaklı dengesiz sınıf veri kümelerini kullanan çalışma, azınlık sınıfını artırmak için çeşitli GAN modellerinden yararlanır. Orijinal ve artırılmış veri kümeleri daha sonra istatistiksel görselleştirmeler ve makine öğrenimi modeli performansları kullanılarak karşılaştırılır. Sonuç olarak bu araştırma, GAN'ların yapay zekadaki verilerle ilgili zorlukları ele almadaki önemli rolünü vurgulamakta ve gelişmiş model performansı için dengesiz veri kümelerini yeniden dengelemedeki etkinliğini göstermektedir.

Özet (Çeviri)

In the rapidly developing technology environment, the interaction between advancing technology and the exponential growth of data has been a trigger in the emergence of Artificial Intelligence (AI). These data-driven feedback loops enabled continued customization, enabling AI to evolve and representing a new technological leap forward. Nevertheless, many challenges also arise in the field of AI. The first of these challenges is the quality and quantity of the data required to feed the AI model, as effective training requires a significant amount of data, which necessitates large and diverse datasets. Another issue is that data privacy concerns have arisen as AI systems internalize confidential information from fields such as health, finance, aerospace and defense. Having imbalanced classes within datasets is another challenge since it specifically affects the fairness and accuracy of classification algorithms. To overcome these challenges, Data Science (DS) and AI experts are developing various methods of synthesizing and/or augmenting data. Great success has been achieved in the generation of different data types with Generative Adversarial Networks (GANs), which play an important role in these studies. This thesis focuses on improving minority class in tabular data. Using various open source imbalanced class dataset with different volumes, the study leverages various GAN models to augment minority class. The original and augmented datasets are then compared using statistical visualizations and Machine Learning (ML) model performances. In conclusion, the research highlights the important role of GANs in addressing data-related challenges in AI and demonstrates their effectiveness in rebalancing unstable datasets for improved model performance.

Benzer Tezler

  1. Avrupa insan hakları mahkemesi yargı kararlarının tahmin edilmesi

    Predicting the judgments of the european court of human rights

    NAGİHAN ÜNAL

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Adli Bilişim Ana Bilim Dalı

    DOÇ. DR. OKTAY YILDIZ

  2. Derin öğrenmeye dayalı videolarda şiddet tespiti

    Violence detection in videos based on deep learning

    AHMET SİVRİDAŞLI

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    Elektrik ve Elektronik MühendisliğiGazi Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. AYŞE DEMİRHAN

  3. Erken ve ortak füzyon stratejileri ile derin ve geleneksel görüntü özelliklerinin entegrasyonuna dayalı diz osteoartriti derecelendirmesi

    Grading of knee osteoarthritis based on the integration of deep and traditional image features via early and joint fusion strategies

    USAME YILMAZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKonya Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ FATMA ZEHRA SOLAK

  4. Ambulatory monitoring of ECG signals for arrhythmia detection using deep neural networks

    Derin sinir ağları kullanılarak aritmi tespiti için EKG sinyallerinin ayaktan izlenmesi

    NURGÜL ÖZMEN SÜZME

    Doktora

    İngilizce

    İngilizce

    2025

    BiyomühendislikEskişehir Teknik Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. ÖMER NEZİH GEREK

  5. Hybrid deep learning approach for multiclass prediction offintech startups

    Fintech girişimlerinin çok sınıflı tahmini için hibrit derin öğrenme yaklaşımı

    MORTEZA ROKHASHMAH

    Yüksek Lisans

    Türkçe

    Türkçe

    2025

    İstanbul Teknik Üniversitesi

    Büyük Veri ve İş Analitiği Ana Bilim Dalı

    DOÇ. DR. CUMHUR EKİNCİ