Veri ambarındaki perakende verilerinde anomali tespiti ve aktarımı için yapay zeka tabanlı yaklaşımlar
Artificial intelligence-based approaches for anomaly detection and transfer in retail data in the data warehouse
- Tez No: 841224
- Danışmanlar: DR. ÖĞR. ÜYESİ NAGEHAN İLHAN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: Türkçe
- Üniversite: Harran Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Mühendisliği Bilim Dalı
- Sayfa Sayısı: 96
Özet
Bu çalışma, veri ambarına alınan kaynak veriler üzerinden anomali tespiti için bazı öneriler sunmaktadır. Kirli ve gürültü verilerin veri ambarına girişinin engellenmesi için bazı yapay zekâ algoritmalarının testleriyle bilgi verilmeye çalışılmıştır. Veri ambarında temiz ve sağlıklı verilerin bulunması, veri bilimi çalışmaları gibi alanlar için oldukça faydalıdır. Günümüzde yaşanan çip krizi, fiziksel makinelerde tasarrufun önemini artırmıştır. Bu bağlamda, sunulan yaklaşımın fiziksel makinelerde tasarruf sağlama potansiyeli bulunmaktadır. LSTM, Isolation Forest, Local Outlier Factor ve SVM algoritmaları test edilmiştir. LSTM algoritmasının büyük verilerde zamansal olarak dezavantajlı olabileceği düşüncesiyle Local Outlier Factor ve SVM algoritmaları da değerlendirmeye dahil edilmiştir. Isolation Forest, LSTM, Local Outlier Factor ve SVM algoritmaları arasında çalışma yapılmıştır. Ancak, algoritmaların her birinin farklı anomalileri tespit ettiği gözlemlenmiştir, bu da anomali tespiti problemlerinde“tek en iyi algoritma”yaklaşımının yetersiz olduğunu ortaya koymaktadır. Sonuç olarak, algoritmaların hibrit bir ensemble modeli olarak entegrasyonu, çeşitli algoritmaların güçlü yönlerinden faydalanarak ve zayıf yönlerini dengelerken, performansın artırılması yönünde önemli bir potansiyel taşımaktadır. Bu yaklaşımın uygulanabilirliği ve etkinliği, daha geniş veri kümeleri üzerindeki kapsamlı deneylerle doğrulanmalı ve belirli uygulama senaryolarına göre maliyet-fayda analizi ile değerlendirilmelidir.
Özet (Çeviri)
This study presents several recommendations for anomaly detection based on source data taken into the data warehouse. Efforts have been made to provide information through the testing of certain artificial intelligence algorithms to prevent the entry of dirty and noisy data into the data warehouse. Having clean and healthy data in the data warehouse is quite beneficial for areas such as data science studies. The current chip crisis has increased the importance of savings in physical machines. In this context, the proposed approach has the potential to provide savings in physical machines. LSTM, Isolation Forest, Local Outlier Factor, and SVM algorithms have been tested. Considering that the LSTM algorithm may be temporally disadvantaged with large data, the Local Outlier Factor and SVM algorithms have also been included in the evaluation. A study has been conducted among the Isolation Forest, LSTM, Local Outlier Factor, and SVM algorithms. However, it has been observed that each algorithm detects different anomalies, which indicates that the“single best algorithm”approach is insufficient for anomaly detection problems. Consequently, the integration of algorithms as a hybrid ensemble model carries significant potential for enhancing performance by leveraging the strengths and balancing the weaknesses of various algorithms. The applicability and effectiveness of this approach should be validated with comprehensive experiments on larger datasets and evaluated with a cost-benefit analysis according to specific application scenarios.
Benzer Tezler
- Veri madenciliği sınıflandırma algoritmaları ile e-posta önemliliğinin belirlenmesi
Determination of e-mail importance with data mining classification algorlthms
BURCU KALE
Yüksek Lisans
Türkçe
2018
İstatistikÇukurova Üniversitesiİstatistik Ana Bilim Dalı
PROF. DR. GÜZİN YÜKSEL
- Data mining based decision support system using data warehouse
Veri ambarı kullanarak veri madenciliği tabanlı karar destek sistemi
EZGİ DEMİR
Yüksek Lisans
İngilizce
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDokuz Eylül ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. CANAN ATAY
- Veri ambarı oluşumunda kullanılan teknolojilerin incelenmesi ve veri ambarlarının kişiye özel üretimde kullanımı
Examination of technologies used for building data warehouses and use of data warehouses in mass customization
ŞEFİK EĞRİBOZ
Yüksek Lisans
Türkçe
2002
İşletmeİstanbul Teknik Üniversitesiİşletme Mühendisliği Ana Bilim Dalı
DR. HALİL HALEFŞAN SÜMEN
- Stratejik büyük veri yönetiminin yatırımlar üzerindeki etkileri
The effects of strategic big data management on investments
ÜMİT DÜLGER
Yüksek Lisans
Türkçe
2015
Mühendislik Bilimleriİstanbul ÜniversitesiMühendislik Bilimleri Ana Bilim Dalı
PROF. DR. ŞAH İSMAİL KIRBAŞLAR
YRD. DOÇ. DR. GAMZE SART
- 'R' programlama dilinde tahmin edici veri madenciliği algoritmalarının modellenmesi ve performanslarının karşılaştırılması
Modeling of predictive data mining algorithms in the 'R' programming language and comparison of their performances
ŞENGÜL CAN
Doktora
Türkçe
2022
İşletmeManisa Celal Bayar Üniversitesiİşletme Ana Bilim Dalı
DOÇ. DR. MUSTAFA GERŞİL