Veri madenciliğinde karar ağacı algoritmaları: Ufuk Üniversitesi öğrenci verileri ile bir çalışma
Decision tree algorithms in data mining: A study on student data of Ufuk University
- Tez No: 741622
- Danışmanlar: PROF. DR. ARAL EGE, DR. ÖĞR. ÜYESİ ASLIHAN ALHAN
- Tez Türü: Yüksek Lisans
- Konular: Bilim ve Teknoloji, Science and Technology
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: Türkçe
- Üniversite: Ufuk Üniversitesi
- Enstitü: Sosyal Bilimler Enstitüsü
- Ana Bilim Dalı: Yönetim Bilişim Sistemleri Ana Bilim Dalı
- Bilim Dalı: Yönetim Bilişim Sistemleri Bilim Dalı
- Sayfa Sayısı: 60
Özet
Büyük veri gruplarıyla çalışan, veri setinin tamamıyla analizler yapabilen veri madenciliği algoritmaları, bilgiyi madenleme ve belirli tahminlemeler yapmaya olanak sağlar. Veri madenciliği sürecinde izlenecek olan adımların eksiksiz ve sırası bozulmaksızın takip edilmesi gerekmektedir. Birden fazla uygulama alanlarına sahip olan veri madenciliği, büyük veri setleri ile çalışmanın dezavantajları ile de karşılaşmaktadır. Veri madenciliği modelleri, tanımlayıcı ve tahmin edici olmak üzere iki grupta incelenmektedir. Tanımlayıcı modellerde, veri seti üzerinde araştırılmak istenilen hipotezlerin oluşturulmasına gerek olmamakla birlikte, sadece verilerin ne tür bir ilişkide olduğunu almamızı sağlayan modeller oluşturur. Tahmin edici modeller ise, bir veri setinden elde edilen sonuçlarla bir model oluşturulması ve bu modele bağlı olarak başka bir veri seti için uygun model oluşturulmasını sağlar. Tahmin edici modeller içerisinde bulunan karar ağacı algoritmaları, ulaşılmak istenilen sonuca bağlı olarak verileri sınıflandırarak oluşturduğu kök düğümden başlar, dallanma ile yeni düğümler ve yapraklar oluşturur. Dallanma yeni bölünmeler olmayıncaya karar devam eder. Bu çalışmada, Ufuk Üniversitesi öğrencilerinin başarı durumlarını etkileyen faktörlerin karar ağacı algoritmaları ile belirlenmesi amaçlanmıştır. Çalışmada SPSS 26 istatistik paket programı kullanılmıştır. Bağımlı değişkenin türevlerinden oluşturulan yeni değişkenlere bağlı olarak hazırlanan ağaç algoritmaları, öğrencilerin başarı durumlarını etkileyen birden fazla faktör tespit etmiştir.
Özet (Çeviri)
Working with large datasets, data mining algorithms that can analyze the entire data set to mine information and provide opportunities to make certain predictions. In the process of data mining following the steps in a given order without skipping phases is of critical importance. Data mining which has many application areas has the disadvantage of workin with large data sets. Data mining models are studied in two groups as descriptive and predictive models. Descriptive models do not need the a hypothesis to test on data set, since it is concerned with understanding the relationships between of data categories. The predictive models on the other hand provide the creation of a model obtained from a data set and generating suitable models for another data set based on this model. Desicion tree algorithms that are predictive models start from the root node where the data is classified and then create leaf nodes to classify the data according to a criteria. and the process continues by creating new nodes and leaves by branching. Branching continues until there are no more new divisions. This study is concerned with the determination of factors effecting the success of Ufuk University by using decision tree algorithms. In this study SPSS 26 statistics package was used. Decision trees that are based on the derivatives of dependent variables identified more than one factor effecting the success of the students.
Benzer Tezler
- Veri madenciliğinde sınıflayıcı teknikler ile demir çelik sektöründe uzun ürünlerin üretimine ilişkin bir tahmin modellemesi
A predictive model for the manufacturing of long-rolled products in iron-steel industry with classifications techniques of data mining
BÜLENT ORDU
- Veri madenciliği ve eğitim sektöründe bir uygulama
Data mining and an application in educational sector
ŞENGÜL CAN
- Tıp bilişiminde istatistiksel veri madenciliği
Statistical data mining in medical informatics
SARA FARBOUDİ
Yüksek Lisans
Türkçe
2009
İstatistikHacettepe Üniversitesiİstatistik Ana Bilim Dalı
YRD. DOÇ. DR. İBRAHİM ZOR
- Veri madenciliğinde sınıflandırma algoritmaları kullanılarak hepatit hastalığının tespiti
Detection of hepatitis disease using classification algorithms in data mining
SEMA GÜZEL
Yüksek Lisans
Türkçe
2018
Elektrik ve Elektronik MühendisliğiKahramanmaraş Sütçü İmam ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. AHMET ALKAN
- Veri madenciliğinde sınıflandırma problemleri için optimizasyon yaklaşımları
Optimization approaches for classification problems in data mining
ENVER ENGÜR
Doktora
Türkçe
2024
Endüstri ve Endüstri MühendisliğiErciyes ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. BANU SOYLU