Veri madenciliği sınıflandırma algoritmaları ile e-posta önemliliğinin belirlenmesi
Determination of e-mail importance with data mining classification algorlthms
- Tez No: 534879
- Danışmanlar: PROF. DR. GÜZİN YÜKSEL
- Tez Türü: Yüksek Lisans
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Büyük Veri, Sınıflandırma Algoritmaları, Önemli E-postalar, Rapid Miner, Big Data, Classification Algorithms, Important E-mails, Rapid Miner
- Yıl: 2018
- Dil: Türkçe
- Üniversite: Çukurova Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 120
Özet
Günümüzde internet ortamında yaptığımız her hareket çeşitli araştırmacılar tarafından takip edilmekte ve kayıt altına alınmaktadır. Veri madenciliği, gizli veri tahminlerini büyük veri tabanlarından çıkaran, veri ambarındaki önemli bilgileri analiz etme potansiyeline sahip güçlü ve yeni bir teknolojidir. Bu çalışmada önemli e-postaları ayırt edici belirgin farkları ortaya çıkarıp bunları öğrenen bir yapay zekâ tasarlanmaktadır. Çalışmada 19 değişkenden oluşan 4.709 birimlik veri üzerinde analizler gerçekleştirilmiştir. Decision Tree, Deep Learning, Gradient Boosted Tree, K-NN, Naive Bayes, Random Forest ve Logistic Regression sınıflandırma algoritmaları seçilmiş ve doğruluk, ağırlıklı ortalama anma, ağırlıklı ortalama duyarlılık ve kök hata kareler ortalaması istatistikleri kullanılarak karşılaştırılmış ve en iyi sınıflandırma algoritması belirlenmiştir. Analizler için Rapid Miner veri madenciliği programı kullanılmıştır.
Özet (Çeviri)
Nowadays, every movement we make on the internet is followed and recorded by various researchers. Data mining is a powerful new technology that takes out hidden data estimates from large databases and has the potential to analyze important information in the data warehouse. In this study, an artificial intelligence is designed to reveal distinctive differences of important e-mails and learn them. In the study, 4.709 data consisting of 19 variables were analyzed. Decision Tree, Deep Learning, Gradient Boosted Tree, K-NN, Naive Bayes, Random Forest and Logistic Regression classification algorithms were selected and compared using accuracy, weighted mean recall, weighted mean precision and root error squares averages statistics and the best classification algorithm was determined. Rapid Miner data mining program was used for analysis.
Benzer Tezler
- Sosyal ağlardaki siber zorbalığın yapay zeka algoritmaları ile tespiti ve sınıflandırılması
Cyberbullying detection and classification with artificial intelligence algorithms in social network
EREN ÇÜRÜK
Yüksek Lisans
Türkçe
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMersin ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ÇİĞDEM ACI
- Öğrenci performansının veri madenciliği ile belirlenmesi
Determination of students performance with data mining
SEVİL ÖZARSLAN
Yüksek Lisans
Türkçe
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKırıkkale ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. NECAATTİN BARIŞÇI
- E-ticaret sistemlerinde sahtecilik tespit sistemi tasarımı
Fraud detecti̇on system design in e-commerce systems
FATMA SERAP ÖRENLİ
Yüksek Lisans
Türkçe
2019
Elektrik ve Elektronik MühendisliğiSüleyman Demirel ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ UFUK ÖZKAYA
- Veri madenciliğinde sınıflandırma algoritmaları kullanılarak hepatit hastalığının tespiti
Detection of hepatitis disease using classification algorithms in data mining
SEMA GÜZEL
Yüksek Lisans
Türkçe
2018
Elektrik ve Elektronik MühendisliğiKahramanmaraş Sütçü İmam ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. AHMET ALKAN
- Makine öğrenmesi yöntemleri ile müşteri kaybı analizi
Churn analysis with machine learning algorithms
BUKET ÖNAL
Yüksek Lisans
Türkçe
2017
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Aydın ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. METİN ZONTUL