Geri Dön

Görsel veri madenciliği tekniklerinin kümeleme analizlerinde kullanımı ve uygulanması

Using visual data mining techniques in clustering analysis and an application

  1. Tez No: 237170
  2. Yazar: METİN VATANSEVER
  3. Danışmanlar: DOÇ. DR. ALİ HAKAN BÜYÜKLÜ
  4. Tez Türü: Yüksek Lisans
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2008
  8. Dil: Türkçe
  9. Üniversite: Yıldız Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 219

Özet

Veri madenciliği, geniş veri yığınları içerisinde, yararlı olma potansiyeline sahip, aralarında bilinmedik ilişkilerin olduğu verilerin keşfedilerek, veri sahibi için hem anlaşılır hem de kullanılabilir bir biçime getirilmesine yönelik geliştirilmiş yöntemler topluluğudur. Verilerin grafiksel bir formda temsil edilmesi veri yapılarının anlaşılmasını kolaylaştırır. Ancak çoğunlukla veri madenciliği teknikleri büyük miktarda veri yığınlarıyla uğraşırlar ki veri görselleştirme teknikleri ekran çözünürlüğü, insan algı sistemi gibi sınırlardan dolayı çokta başarılı olamayabilirler. Tezde bu gibi sınırları ortadan kaldırabilmek için çeşitli yeni görselleştirme teknikleri tanıtılmış ve bu görselleştirme teknikleri çok boyutlu, büyük miktarda veri kayıtlarına sahip verilerle örneklendirilmiştir. Bu yeni görselleştirme teknikleri küme yapılarının ve aşırı değerlerin keşfedilmesinde kullanılmıştır. Hatta bu görselleştirme teknikleri farklı kümeleme algoritmalarının bulduğu küme sonuçlarını değerlendirmek için de kullanılmıştır.Uygulamada, görsel teknikler kullanılarak Türkiye ilçe veri setindeki aşırı değerler ve küme yapıları tespit edilmiştir. Daha sonra bu ilçe veri seti, tek bağlantılı hiyerarşik, tam bağlantılı hiyerarşik, k-ortalamalar ve SOM gibi çoğunlukla kullanılan dört farklı kümeleme algoritmalarıyla kümelenmiştir. Çoğunlukla kullanılan altı küme doğruluk endeksi uygun küme sayısının tespitinde kullanılmıştır. Son olarak da görsel teknikler küme sonuçlarının değerlendirilmesinde kullanılmıştır. Uygulamada ki sonuçlar göstermiştir ki büyük veri setlerinde kullanılan görsel tekniklerin kümeleme çalışmalarında bulunan araştırmacılara aşırı değerlerin tespitinde, kaliteli küme sonuçlarının üretilmesinde ve uygun kümeleme algoritmalarının seçilmesinde yol gösterebilir.

Özet (Çeviri)

Data mining is the process of automatically discovering useful information in large data repositories. Data mining techniques are deployed to scour large database in order to find novel and useful patterns that might otherwise remain unknown. Data mining techniques frequently focus on the discovery of unknow structures such a clusters, trends, associations and correalations and other structures for which a visual data analysis is very appropriate quite likely to yield insight. However, data mining techniques are often applied to massive data sets where visualization may not be very successful because of the limits of both screen resolution, human visual system resolution as well as the limits of available computational resources. In this thesis, we present new visual tecniques for overcoming such limitations and illustrate the visual tecniques with some examples of successful challenges on high-dimensional and large data sets. The visual tecniques are applied to detect cluster structures and outliers. Also the visual tecniques are applied to evaluate the results of a number of different clustering algorithms.In practice, cluster structures and outliers in administrative district data set in Turkey are detected by the visual techniques. Then four widely applicable clustering algorithms such as single link hierarchical, complete link hierarchical, k-means and SOM are used to cluster the data set. Six frequently used cluster validity indices are employed to estimate the right number of clusters in the data set. Finally visual tecniques are used to evaluate the results of a number of different clustering algorithms. Our results show that visual techniques let the researcher involve in the clustering process to detect outliers, to generate high-quality clustering results and to choose the right number of cluster algorithms for large datasets

Benzer Tezler

  1. A knowledge discovery approach to urban analysis the Beyoğlu preservation area as a data mine

    Kent analizinde bir bilgi keşfi yaklaşımı bir veri madeni olarak Beyoğlu kentsel koruma alanı

    AHU SÖKMENOĞLU SOHTORİK

    Doktora

    İngilizce

    İngilizce

    2016

    Mimarlıkİstanbul Teknik Üniversitesi

    Mimarlık Ana Bilim Dalı

    PROF. DR. GÜLEN ÇAĞDAŞ

    PROF. DR. İKBAL SEVİL SARIYILDIZ

  2. Data mining approach based on harris hawks optimization (HHO) algorithm for multiple sclerosis lesions segmentation on brain magnetic resonance images

    Beyin manyetik rezonans görüntülerinde çoklu skleroz lezyonları için harrıs hawks optimizasyonu (HHO) algoritmasına dayalı veri madenciliği yaklaşımı

    AMAL F A ISWIASI

    Doktora

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAltınbaş Üniversitesi

    Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. OĞUZ KARAN

  3. TV ve set üstü cihaz arayüz kullanılabilirlik ölçümü

    Usability evaluation of TV and set-top box interfaces

    AYCAN PEKPAZAR

    Doktora

    Türkçe

    Türkçe

    2021

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ÇİĞDEM ALTIN GÜMÜŞSOY

  4. Veri madenciliğinde kullanılan teknikler ve bir uygulama

    Data mining techniques and an application

    ELİF ÖZGE ÖZDAMAR

    Yüksek Lisans

    Türkçe

    Türkçe

    2002

    İstatistikMimar Sinan Güzel Sanatlar Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF. DR. M. KEMAL YOĞURTÇUGİL

  5. Müşteri ilişkileri yönetiminde iş zekası uygulamaları

    Business intelligence applications in customer relationship management

    AYŞE BİLGİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAnadolu Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. YAŞAR HOŞCAN