Veri ambarındaki perakende verilerinde anomali tespiti ve aktarımı için yapay zeka tabanlı yaklaşımlar

Artificial intelligence-based approaches for anomaly detection and transfer in retail data in the data warehouse

PDF İndir

Tez No: 841224
Yazar: ONUR ÇİRKİN
Danışmanlar: DR. ÖĞR. ÜYESİ NAGEHAN İLHAN
Tez Türü: Yüksek Lisans
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2023
Dil: Türkçe
Üniversite: Harran Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
Sayfa Sayısı: 96

Özet

Bu çalışma, veri ambarına alınan kaynak veriler üzerinden anomali tespiti için bazı öneriler sunmaktadır. Kirli ve gürültü verilerin veri ambarına girişinin engellenmesi için bazı yapay zekâ algoritmalarının testleriyle bilgi verilmeye çalışılmıştır. Veri ambarında temiz ve sağlıklı verilerin bulunması, veri bilimi çalışmaları gibi alanlar için oldukça faydalıdır. Günümüzde yaşanan çip krizi, fiziksel makinelerde tasarrufun önemini artırmıştır. Bu bağlamda, sunulan yaklaşımın fiziksel makinelerde tasarruf sağlama potansiyeli bulunmaktadır. LSTM, Isolation Forest, Local Outlier Factor ve SVM algoritmaları test edilmiştir. LSTM algoritmasının büyük verilerde zamansal olarak dezavantajlı olabileceği düşüncesiyle Local Outlier Factor ve SVM algoritmaları da değerlendirmeye dahil edilmiştir. Isolation Forest, LSTM, Local Outlier Factor ve SVM algoritmaları arasında çalışma yapılmıştır. Ancak, algoritmaların her birinin farklı anomalileri tespit ettiği gözlemlenmiştir, bu da anomali tespiti problemlerinde“tek en iyi algoritma”yaklaşımının yetersiz olduğunu ortaya koymaktadır. Sonuç olarak, algoritmaların hibrit bir ensemble modeli olarak entegrasyonu, çeşitli algoritmaların güçlü yönlerinden faydalanarak ve zayıf yönlerini dengelerken, performansın artırılması yönünde önemli bir potansiyel taşımaktadır. Bu yaklaşımın uygulanabilirliği ve etkinliği, daha geniş veri kümeleri üzerindeki kapsamlı deneylerle doğrulanmalı ve belirli uygulama senaryolarına göre maliyet-fayda analizi ile değerlendirilmelidir.

Özet (Çeviri)

This study presents several recommendations for anomaly detection based on source data taken into the data warehouse. Efforts have been made to provide information through the testing of certain artificial intelligence algorithms to prevent the entry of dirty and noisy data into the data warehouse. Having clean and healthy data in the data warehouse is quite beneficial for areas such as data science studies. The current chip crisis has increased the importance of savings in physical machines. In this context, the proposed approach has the potential to provide savings in physical machines. LSTM, Isolation Forest, Local Outlier Factor, and SVM algorithms have been tested. Considering that the LSTM algorithm may be temporally disadvantaged with large data, the Local Outlier Factor and SVM algorithms have also been included in the evaluation. A study has been conducted among the Isolation Forest, LSTM, Local Outlier Factor, and SVM algorithms. However, it has been observed that each algorithm detects different anomalies, which indicates that the“single best algorithm”approach is insufficient for anomaly detection problems. Consequently, the integration of algorithms as a hybrid ensemble model carries significant potential for enhancing performance by leveraging the strengths and balancing the weaknesses of various algorithms. The applicability and effectiveness of this approach should be validated with comprehensive experiments on larger datasets and evaluated with a cost-benefit analysis according to specific application scenarios.

Benzer Tezler

Tez No
534879
Veri madenciliği sınıflandırma algoritmaları ile e-posta önemliliğinin belirlenmesi
Determination of e-mail importance with data mining classification algorlthms
BURCU KALE
Yüksek Lisans
Türkçe
2018
İstatistik Çukurova Üniversitesi
İstatistik Ana Bilim Dalı
PROF. DR. GÜZİN YÜKSEL
Tez No
491171
Data mining based decision support system using data warehouse
Veri ambarı kullanarak veri madenciliği tabanlı karar destek sistemi
EZGİ DEMİR
Yüksek Lisans
İngilizce
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Dokuz Eylül Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. CANAN ATAY
Tez No
411483
Stratejik büyük veri yönetiminin yatırımlar üzerindeki etkileri
The effects of strategic big data management on investments
ÜMİT DÜLGER
Yüksek Lisans
Türkçe
2015
Mühendislik Bilimleri İstanbul Üniversitesi
Mühendislik Bilimleri Ana Bilim Dalı
PROF. DR. ŞAH İSMAİL KIRBAŞLAR
YRD. DOÇ. DR. GAMZE SART
Tez No
126714
Veri ambarı oluşumunda kullanılan teknolojilerin incelenmesi ve veri ambarlarının kişiye özel üretimde kullanımı
Examination of technologies used for building data warehouses and use of data warehouses in mass customization
ŞEFİK EĞRİBOZ
Yüksek Lisans
Türkçe
2002
İşletme İstanbul Teknik Üniversitesi
İşletme Mühendisliği Ana Bilim Dalı
DR. HALİL HALEFŞAN SÜMEN
Tez No
734837
'R' programlama dilinde tahmin edici veri madenciliği algoritmalarının modellenmesi ve performanslarının karşılaştırılması
Modeling of predictive data mining algorithms in the 'R' programming language and comparison of their performances
ŞENGÜL CAN
Doktora
Türkçe
2022
İşletme Manisa Celal Bayar Üniversitesi
İşletme Ana Bilim Dalı
DOÇ. DR. MUSTAFA GERŞİL

Geri Dön