Geri Dön

Veri ambarındaki perakende verilerinde anomali tespiti ve aktarımı için yapay zeka tabanlı yaklaşımlar

Artificial intelligence-based approaches for anomaly detection and transfer in retail data in the data warehouse

  1. Tez No: 841224
  2. Yazar: ONUR ÇİRKİN
  3. Danışmanlar: DR. ÖĞR. ÜYESİ NAGEHAN İLHAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: Türkçe
  9. Üniversite: Harran Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 96

Özet

Bu çalışma, veri ambarına alınan kaynak veriler üzerinden anomali tespiti için bazı öneriler sunmaktadır. Kirli ve gürültü verilerin veri ambarına girişinin engellenmesi için bazı yapay zekâ algoritmalarının testleriyle bilgi verilmeye çalışılmıştır. Veri ambarında temiz ve sağlıklı verilerin bulunması, veri bilimi çalışmaları gibi alanlar için oldukça faydalıdır. Günümüzde yaşanan çip krizi, fiziksel makinelerde tasarrufun önemini artırmıştır. Bu bağlamda, sunulan yaklaşımın fiziksel makinelerde tasarruf sağlama potansiyeli bulunmaktadır. LSTM, Isolation Forest, Local Outlier Factor ve SVM algoritmaları test edilmiştir. LSTM algoritmasının büyük verilerde zamansal olarak dezavantajlı olabileceği düşüncesiyle Local Outlier Factor ve SVM algoritmaları da değerlendirmeye dahil edilmiştir. Isolation Forest, LSTM, Local Outlier Factor ve SVM algoritmaları arasında çalışma yapılmıştır. Ancak, algoritmaların her birinin farklı anomalileri tespit ettiği gözlemlenmiştir, bu da anomali tespiti problemlerinde“tek en iyi algoritma”yaklaşımının yetersiz olduğunu ortaya koymaktadır. Sonuç olarak, algoritmaların hibrit bir ensemble modeli olarak entegrasyonu, çeşitli algoritmaların güçlü yönlerinden faydalanarak ve zayıf yönlerini dengelerken, performansın artırılması yönünde önemli bir potansiyel taşımaktadır. Bu yaklaşımın uygulanabilirliği ve etkinliği, daha geniş veri kümeleri üzerindeki kapsamlı deneylerle doğrulanmalı ve belirli uygulama senaryolarına göre maliyet-fayda analizi ile değerlendirilmelidir.

Özet (Çeviri)

This study presents several recommendations for anomaly detection based on source data taken into the data warehouse. Efforts have been made to provide information through the testing of certain artificial intelligence algorithms to prevent the entry of dirty and noisy data into the data warehouse. Having clean and healthy data in the data warehouse is quite beneficial for areas such as data science studies. The current chip crisis has increased the importance of savings in physical machines. In this context, the proposed approach has the potential to provide savings in physical machines. LSTM, Isolation Forest, Local Outlier Factor, and SVM algorithms have been tested. Considering that the LSTM algorithm may be temporally disadvantaged with large data, the Local Outlier Factor and SVM algorithms have also been included in the evaluation. A study has been conducted among the Isolation Forest, LSTM, Local Outlier Factor, and SVM algorithms. However, it has been observed that each algorithm detects different anomalies, which indicates that the“single best algorithm”approach is insufficient for anomaly detection problems. Consequently, the integration of algorithms as a hybrid ensemble model carries significant potential for enhancing performance by leveraging the strengths and balancing the weaknesses of various algorithms. The applicability and effectiveness of this approach should be validated with comprehensive experiments on larger datasets and evaluated with a cost-benefit analysis according to specific application scenarios.

Benzer Tezler

  1. Veri madenciliği sınıflandırma algoritmaları ile e-posta önemliliğinin belirlenmesi

    Determination of e-mail importance with data mining classification algorlthms

    BURCU KALE

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    İstatistikÇukurova Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF. DR. GÜZİN YÜKSEL

  2. Data mining based decision support system using data warehouse

    Veri ambarı kullanarak veri madenciliği tabanlı karar destek sistemi

    EZGİ DEMİR

    Yüksek Lisans

    İngilizce

    İngilizce

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDokuz Eylül Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. CANAN ATAY

  3. Veri ambarı oluşumunda kullanılan teknolojilerin incelenmesi ve veri ambarlarının kişiye özel üretimde kullanımı

    Examination of technologies used for building data warehouses and use of data warehouses in mass customization

    ŞEFİK EĞRİBOZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2002

    İşletmeİstanbul Teknik Üniversitesi

    İşletme Mühendisliği Ana Bilim Dalı

    DR. HALİL HALEFŞAN SÜMEN

  4. Stratejik büyük veri yönetiminin yatırımlar üzerindeki etkileri

    The effects of strategic big data management on investments

    ÜMİT DÜLGER

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Mühendislik Bilimleriİstanbul Üniversitesi

    Mühendislik Bilimleri Ana Bilim Dalı

    PROF. DR. ŞAH İSMAİL KIRBAŞLAR

    YRD. DOÇ. DR. GAMZE SART

  5. 'R' programlama dilinde tahmin edici veri madenciliği algoritmalarının modellenmesi ve performanslarının karşılaştırılması

    Modeling of predictive data mining algorithms in the 'R' programming language and comparison of their performances

    ŞENGÜL CAN

    Doktora

    Türkçe

    Türkçe

    2022

    İşletmeManisa Celal Bayar Üniversitesi

    İşletme Ana Bilim Dalı

    DOÇ. DR. MUSTAFA GERŞİL