Kategorisel değişkenler için veri kümelemede ağaç yöntemi ile yeni bir algoritma uygulaması
Application of a novel algorithm with data clustering tree method for categorical variables
- Tez No: 231659
- Danışmanlar: YRD. DOÇ. DR. GÖKHAN SİLAHTAROĞLU
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2008
- Dil: Türkçe
- Üniversite: Beykent Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Matematik Bilgisayar Ana Bilim Dalı
- Bilim Dalı: Bilgi Teknolojileri Bilim Dalı
- Sayfa Sayısı: 75
Özet
Veri madenciliğinde veri farklı şekiller ve gürültü içerdiği zaman büyük popülasyonları ayıklama önemli bir problemdir. İyi bir algoritma mekanızması veya metodu kümeleri bulmak açısından etkili olmalıdır. Ayrıca boyut büyüdükçe uzayın karmaşıklığı ve zaman karmaşıklığı önemli hale gelmeye başlar.Bu tez çalışmasında, veri madenciliği alanında kullanılmak üzere kategorisel değişkenlere sahip veri tabanlarında ağaç yöntemiyle veri kümeleme için yeni bir algoritmanın kullanılabilirliğinin gösterilmesi gerçekleştirilmiştir. Ağaç yöntemi kullanarak simgeler sahip oldukları değerlere ayrılmıştır. Bu değerler ve bölümler sayesinde bir veri tabanını mümkün olan en az parçadan en çok parçaya doğru sıralayarak bir ağaç oluşturulması gerçekleştirilmiştir.Çalışmanın birinci bölümünde veri madenciliği, kullanıldığı alanlar ve veri madenciliğinin gelişimi konularına değinilmiştir.İkinci bölümünde veri madenciliğinde kullanılan yöntemler, algoritmalar ve bu tezin konusu olan algoritmaya yakın olanları konu edilmiştir.Tez çalışmasının üçüncü bölümünde ise söz konusu olan algoritma ve uygulanması gösterilmiştir. Kategorisel verilerden oluşan bir veri tabanı ile gerçekleştirilen sonuçlar ele alınmış, aynı kategoride olan diğer algoritmalarla karşılaştırılması gerçekleştirilmiştir. Sentetik bir veri tabanı ile elde edilen sonuçlar gösterilmiştir.Dördüncü bölümde ise, elde edilen bilgiler doğrultusuna, sonuçlar incelenmiş ve algoritmanın uygulanabilirliği hakkında yorumlar yapılmıştır.
Özet (Çeviri)
The major reason that data mining became one of the hottest current technologies of the information age is the wide availability of huge amounts of data and the need for turning such data into useful information and knowledge. As computer systems getting cheaper and computer power increases, the amount of data available to be collected and processed increases. Therefore using techniques that operates very well with large amounts of data becomes an obvious choice. The information and knowledge gained can be used for applications ranging from business management, production control, and market analysis, to engineering design and science exploration.In this study, a new data mining algorithm used and tested for categorical variable. This algorithm improved by Yrd. Doç. Dr. Gökhan SİLAHTAROĞLU. This algorithm to call“A Tree Approach to Clustering Data with Categorical Variables”. In the literature there are different approaches to form tree. To determine the best attribute, used an equal-split parameter. After forming the clusters, used another clustering algorithm such as PAM, CLARA or K-Means to reduce the number of leaves to the number required by the user.
Benzer Tezler
- Clustering of divers using data mining techniques
Dalgıçların veri madenciliği teknikleri kullanılarak sınıflandırılması
AHMET CÜNEYT YAVUZ
Yüksek Lisans
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGalatasaray ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. SALİH MURAT EGİ
- Long term competitive advantage effect on company value with fuzzy logic and machine learning applications
Bulanık mantık ve makine öğrenmesi uygulamaları ile uzun vadeli rekabet avantajının şirket değeri üzerine etkisi
ZEKERİYA BİLDİK
Doktora
İngilizce
2024
İşletmeİstanbul Teknik Üniversitesiİşletme Ana Bilim Dalı
DOÇ. DR. KAYA TOKMAKÇIOĞLU
- New proposed methods for synthetic minority over-sampling technique
Sentetik azınlık aşırı örnekleme tekniği için yeni önerilen yöntemler
HAKAN KORUL
Yüksek Lisans
İngilizce
2024
Bilim ve Teknolojiİstanbul Teknik ÜniversitesiVeri Mühendisliği ve İş Analitiği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MEHMET ALİ ERGÜN
- Derin öğrenme ve büyük veri analitiği yöntemleriKullanarak Covid-19 yayılımının ileriye dönük tahmini
Forecasting the spread of covid-19 using deep learning and big data analytics methods
CYLAS KIGANDA
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Bilimleri Ana Bilim Dalı
PROF. DR. MUHAMMET ALİ AKCAYOL
- Comprehensive risk mapping and fire station optimization for forest fire management: An application in Antalya
Orman yangını yönetimi için kapsamlı risk haritalama ve yangın istasyonu optimizasyonu: Antalya uygulaması
ZÜHAL ÖZCAN YAVUZ
Doktora
İngilizce
2024
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. ÖZGÜR KABAK
DR. ÖĞR. ÜYESİ İNCİ ÇAĞLAYAN