Geri Dön

Bölünmeli kümeleme yöntemleri ile veri madenciliği uygulamaları

Data mining applications using partitional clustering methods

  1. Tez No: 185009
  2. Yazar: MELTEM IŞIK
  3. Danışmanlar: YRD. DOÇ. DR. ÖZGÜL VAYVAY
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2006
  8. Dil: Türkçe
  9. Üniversite: Marmara Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektronik ve Bilgisayar Eğitimi Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Kontrol Eğitimi Bilim Dalı
  13. Sayfa Sayısı: 95

Özet

Veri madenciliği, çok büyük veri yığınlarından kritik bilgilerin elde edilmesinive bu bilgilerin ışığında stratejik kararlar alınmasını sağlar. Gelecek ile ilgilitahminde bulunabilmemizi sağlayan yararlı ve anlaşılır bilgiler, çeşitli yöntem vetekniklerin bilgisayar programları sayesinde verilere uygulanmasıyla elde edilir. Buteknikler artan veri miktarının etkili bir şekilde kullanılmasını sağlar.Veri madenciliğinde önemli tekniklerden biri kümeleme analizidir. Kümelemeanalizinde, veri içerisindeki grupların önceden hiçbir bilgi olmadan bulunmasıamaçlanır. Kümeleme analizinde çeşitli yöntemler ve bu yöntemlere bağlı çeşitlialgoritmalar bulunmaktadır. Bu çalışmada, bölünmeli kümeleme yöntemlerikullanılarak sentetik ve gerçek veri setleri üzerinde çeşitli testler yapıldı vealgoritmaların performansları karşılaştırıldı.Öncelikle veri madenciliği ve kümeleme analizi hakkında genel bilgiler verildi.Daha sonra, bölünmeli kümeleme algoritmaları hakkında ayrıntılı teorik bilgilerverilip, bu bilgilerin ışığında kümeleme algoritmalarının kolaylıkla uygulanması vegörsel olarak yorumlanması için MATLAB ortamında iki tane program geliştirildi.Birinci program bölünmeli kümeleme algoritmalarının iki boyutlu veriler üzerindeuygulanmasını sağlayan ve sonuçları grafiksel olarak gösteren bir yapıya sahiptir.K-means, k-medoids ve fuzzy c-means algoritmaları beş ayrı sentetik veri setiüzerinde uygulanarak bu algoritmaların birbirlerine olan üstünlükleri ve zayıflıklarıtespit edildi.Gerçek veri seti uygulaması için web sayfası kümeleme analizi yapmayısağlayan ikinci program geliştirildi. İnternetin gittikçe yaygınlaşması ve boyutlarınınçok genişlemesi World Wide Web'inde büyük bir veri deposu haline gelmesineve karmaşıklığının artmasına neden olmuştur. Bu nedenlerle web'de arama yapma vekullanıcı profili çıkarma alanlarında veri madenciliğine ilgi artmıştır. Bu tezde,k-means ve fuzzy c-means algoritmalarının web dokümanları üzerinde kümelemebaşarıları karşılaştırılmalı olarak incelendi.

Özet (Çeviri)

ABSTRACTDATA MINING APPLICATIONS USING PARTITIONALCLUSTERING METHODSData mining, discovers critical and previously unknown information from largecollection of data. These potentially useful and understandable informations achievedby applying various techniques and methods with computer programs can be used forprediction. These techniques ensure efficient use of growing data.Clustering is one of the important technique in data mining. In the clusteranalysis, unknown data groups are discovered. There are number of techniques andalgorithms in cluster analysis. In this study, using partitional clustering method onsynthetic and real datasets various test are performed and the peformance ofalgorithms are compared.Firstly, data mining and cluster analysis described briefly. Then, detailedtheorical information about partitional clustering algorithms have been explained andwith the help of these informations two clustering applications have been developedin MATLAB platform to understand algorithms easily and analyze visually. In thefirst program, partitional clustering algorithms have been applied to two dimensionaldata and analyse results are visualized graphically. K-means, k-medoids and fuzzyc-means algorithms have been applied to five diferent synthetic datasets andadvantages and weakness of each algorithm have been determined.For real dataset application second program that implements web page analysishas been designed. With rapid grow in internet World Wide Web becomes a big datarepository. For these reasons, in the field of searching and analyzing user profileinterest to data mining is increased. In this thesis, k-means and fuzzy c-meansalgorithms were applied to web documents and clustering performances wereinvestigated comparatively.

Benzer Tezler

  1. Veri madenciliği nde regresyon ağaçları ile sınıflandırma ve bir uygulama

    Classification with regression trees in data mining, and a appiication

    GÜLSER DONDURMACI

    Doktora

    Türkçe

    Türkçe

    2011

    İstatistikMimar Sinan Güzel Sanatlar Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF. DR. NALAN CİNEMRE

  2. Penetration rate optimization with support vector regression method

    Destek vektör regresyonu yöntemi ile ilerleme hızı optimizasyonu

    KORHAN KOR

    Yüksek Lisans

    İngilizce

    İngilizce

    2015

    Petrol ve Doğal Gaz Mühendisliğiİstanbul Teknik Üniversitesi

    Petrol ve Doğal Gaz Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. GÜRŞAT ALTUN

  3. Kayıp veri içeren veri setlerinde kümeleme uygulamaları

    Clustering applications in data sets with missing data

    SERPİL SEVİMLİ DENİZ

    Doktora

    Türkçe

    Türkçe

    2020

    İstatistikVan Yüzüncü Yıl Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF. DR. HALİT ERAY ÇELİK

  4. Kümeleme yöntemleri ile müşteri kanal göçü analizi

    Customer channel migration analysis with clustering methods

    GİZEM ÇALIŞKAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MEHMET YASİN ULUKUŞ

  5. Bulanık kümeleme analizi ve OECD ülkelerinin gelişmişlik bakımından kümelendirilmesi

    Fuzzy cluster analysis and clustering OECD countries based on develeopment

    SERRA ATAL

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    İstatistikEskişehir Osmangazi Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF. DR. ZEKİ YILDIZ