Veri madenciliği modelleri ve örnek bir uygulama
Data mining models and a sample application
- Tez No: 570970
- Danışmanlar: PROF. DR. LEVENT ŞENYAY
- Tez Türü: Yüksek Lisans
- Konular: Ekonometri, Econometrics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: Türkçe
- Üniversite: Dokuz Eylül Üniversitesi
- Enstitü: Sosyal Bilimler Enstitüsü
- Ana Bilim Dalı: Ekonometri Ana Bilim Dalı
- Bilim Dalı: Ekonometri Bilim Dalı
- Sayfa Sayısı: 100
Özet
Bu çalışma içeriğinde, ham verilerden faydalı bilgi elde etme aşamaları olan veri madenciliği kavramı anlatılmaya çalışılmıştır. Bu ham veriyi işlemede yaygın olarak kullanılan CRISP-DM aşamaları açıklanmıştır. Veri madenciliği algoritmalarının tanımlayıcı ve tahmin edici olarak ikiye ayrılmasından bahsedilmiştir. Ayrıca sınıflandırma, kümeleme ve birliktelik kuralları algoritmalarıyla kurulan modellerin aşmaları ayrıntılı olarak anlatılmıştır. Bu anlatımlar doğrultusunda uygulamada Türkiye'de kitap satışı yapan internet sitelerinden alınan en çok satan kitap listelerindeki kitapları türlerine göre sınıflandırma yaparken hangi faktörlerin etkili olduğu belirlenmeye çalışılmıştır. Çalışmada, veri madenciliği sınıflandırma algoritmalarından biri olan K- En Yakın Komşuluk (k-nearest neighbor, k-nn) algoritması en başarılı sonucu verdiği için seçilmiştir.
Özet (Çeviri)
In this study, data mining concept, which means extracting useful information from raw data, has been elucidated. Besides, CRISP-DM phases, which is commonly used in raw data processing has been explained. Moreover, it has been mentioned that two types of data mining algorithms as descriptive and predictive. In addition, the phases of models built-up by the rules of classification, clustering and association algorithms has been explained in detail. In line with those expressions, it has been determined that which factors affects to classification of the book sale web sites' bestsellers of Turkey according to their types. In this study, one of the data mining classification algorithm, k-nearest neighbor – k-nn algorithm has been selected due to its best result.
Benzer Tezler
- Veri madenciliğinde kategorik veri analizi:teknoloji bağımlılığı üzerine bir uygulama
Categorical data analysis in data mining:an application on technology addiction
RAMAZAN PEHLİVAN
Doktora
Türkçe
2023
İstatistikİstanbul Üniversitesiİşletme Ana Bilim Dalı
PROF. DR. ÇİĞDEM ARICIGİL ÇİLAN
- Sağlık verilerinde veri kalitesi ve sağlık sektöründe veri madenciliği analiz yöntemleri ve uygulama örnekleri
Data quality in health data and data mining analysis methods and application examples in health sector
AHMET KOÇAK
Yüksek Lisans
Türkçe
2023
Yönetim Bilişim SistemleriGazi ÜniversitesiSağlık Bilişimi Ana Bilim Dalı
PROF. DR. MEHMET ALİ ERGÜN
- E-ticaret sitelerine öneri sisteminin uygulanması
Applicatin of suggestion system to e-commerce sites
ABDULLAH ÖZKILIÇ
Yüksek Lisans
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBursa Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ VOLKAN ALTUNTAŞ
- Elektronik ticarette iş modelleri ve güncel sorunlar
Business models and current issues in electronic commerce
BÜLENT KAYA
Yüksek Lisans
Türkçe
2024
Uluslararası Ticaretİstanbul ÜniversitesiEnformatik Ana Bilim Dalı
PROF. DR. SEVİNÇ GÜLSEÇEN
- Veri madenciliği yöntemleri ile ana harcama gruplarının paylarının tahmini
Estimation of main expenditure groups' portion with data mining methods
LEVENT AHİ
Yüksek Lisans
Türkçe
2015
İstatistikHacettepe Üniversitesiİstatistik Ana Bilim Dalı
PROF. DR. MURTAZA ÖZGÜR YENİAY