Bölünmeli kümeleme yöntemleri ile veri madenciliği uygulamaları
Data mining applications using partitional clustering methods
- Tez No: 185009
- Danışmanlar: YRD. DOÇ. DR. ÖZGÜL VAYVAY
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2006
- Dil: Türkçe
- Üniversite: Marmara Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektronik ve Bilgisayar Eğitimi Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Kontrol Eğitimi Bilim Dalı
- Sayfa Sayısı: 95
Özet
Veri madenciliği, çok büyük veri yığınlarından kritik bilgilerin elde edilmesinive bu bilgilerin ışığında stratejik kararlar alınmasını sağlar. Gelecek ile ilgilitahminde bulunabilmemizi sağlayan yararlı ve anlaşılır bilgiler, çeşitli yöntem vetekniklerin bilgisayar programları sayesinde verilere uygulanmasıyla elde edilir. Buteknikler artan veri miktarının etkili bir şekilde kullanılmasını sağlar.Veri madenciliğinde önemli tekniklerden biri kümeleme analizidir. Kümelemeanalizinde, veri içerisindeki grupların önceden hiçbir bilgi olmadan bulunmasıamaçlanır. Kümeleme analizinde çeşitli yöntemler ve bu yöntemlere bağlı çeşitlialgoritmalar bulunmaktadır. Bu çalışmada, bölünmeli kümeleme yöntemlerikullanılarak sentetik ve gerçek veri setleri üzerinde çeşitli testler yapıldı vealgoritmaların performansları karşılaştırıldı.Öncelikle veri madenciliği ve kümeleme analizi hakkında genel bilgiler verildi.Daha sonra, bölünmeli kümeleme algoritmaları hakkında ayrıntılı teorik bilgilerverilip, bu bilgilerin ışığında kümeleme algoritmalarının kolaylıkla uygulanması vegörsel olarak yorumlanması için MATLAB ortamında iki tane program geliştirildi.Birinci program bölünmeli kümeleme algoritmalarının iki boyutlu veriler üzerindeuygulanmasını sağlayan ve sonuçları grafiksel olarak gösteren bir yapıya sahiptir.K-means, k-medoids ve fuzzy c-means algoritmaları beş ayrı sentetik veri setiüzerinde uygulanarak bu algoritmaların birbirlerine olan üstünlükleri ve zayıflıklarıtespit edildi.Gerçek veri seti uygulaması için web sayfası kümeleme analizi yapmayısağlayan ikinci program geliştirildi. İnternetin gittikçe yaygınlaşması ve boyutlarınınçok genişlemesi World Wide Web'inde büyük bir veri deposu haline gelmesineve karmaşıklığının artmasına neden olmuştur. Bu nedenlerle web'de arama yapma vekullanıcı profili çıkarma alanlarında veri madenciliğine ilgi artmıştır. Bu tezde,k-means ve fuzzy c-means algoritmalarının web dokümanları üzerinde kümelemebaşarıları karşılaştırılmalı olarak incelendi.
Özet (Çeviri)
ABSTRACTDATA MINING APPLICATIONS USING PARTITIONALCLUSTERING METHODSData mining, discovers critical and previously unknown information from largecollection of data. These potentially useful and understandable informations achievedby applying various techniques and methods with computer programs can be used forprediction. These techniques ensure efficient use of growing data.Clustering is one of the important technique in data mining. In the clusteranalysis, unknown data groups are discovered. There are number of techniques andalgorithms in cluster analysis. In this study, using partitional clustering method onsynthetic and real datasets various test are performed and the peformance ofalgorithms are compared.Firstly, data mining and cluster analysis described briefly. Then, detailedtheorical information about partitional clustering algorithms have been explained andwith the help of these informations two clustering applications have been developedin MATLAB platform to understand algorithms easily and analyze visually. In thefirst program, partitional clustering algorithms have been applied to two dimensionaldata and analyse results are visualized graphically. K-means, k-medoids and fuzzyc-means algorithms have been applied to five diferent synthetic datasets andadvantages and weakness of each algorithm have been determined.For real dataset application second program that implements web page analysishas been designed. With rapid grow in internet World Wide Web becomes a big datarepository. For these reasons, in the field of searching and analyzing user profileinterest to data mining is increased. In this thesis, k-means and fuzzy c-meansalgorithms were applied to web documents and clustering performances wereinvestigated comparatively.
Benzer Tezler
- Veri madenciliği nde regresyon ağaçları ile sınıflandırma ve bir uygulama
Classification with regression trees in data mining, and a appiication
GÜLSER DONDURMACI
Doktora
Türkçe
2011
İstatistikMimar Sinan Güzel Sanatlar Üniversitesiİstatistik Ana Bilim Dalı
PROF. DR. NALAN CİNEMRE
- Penetration rate optimization with support vector regression method
Destek vektör regresyonu yöntemi ile ilerleme hızı optimizasyonu
KORHAN KOR
Yüksek Lisans
İngilizce
2015
Petrol ve Doğal Gaz Mühendisliğiİstanbul Teknik ÜniversitesiPetrol ve Doğal Gaz Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. GÜRŞAT ALTUN
- Kayıp veri içeren veri setlerinde kümeleme uygulamaları
Clustering applications in data sets with missing data
SERPİL SEVİMLİ DENİZ
Doktora
Türkçe
2020
İstatistikVan Yüzüncü Yıl Üniversitesiİstatistik Ana Bilim Dalı
PROF. DR. HALİT ERAY ÇELİK
- Kümeleme yöntemleri ile müşteri kanal göçü analizi
Customer channel migration analysis with clustering methods
GİZEM ÇALIŞKAN
Yüksek Lisans
Türkçe
2023
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MEHMET YASİN ULUKUŞ
- Bulanık kümeleme analizi ve OECD ülkelerinin gelişmişlik bakımından kümelendirilmesi
Fuzzy cluster analysis and clustering OECD countries based on develeopment
SERRA ATAL
Yüksek Lisans
Türkçe
2015
İstatistikEskişehir Osmangazi Üniversitesiİstatistik Ana Bilim Dalı
PROF. DR. ZEKİ YILDIZ