Görsel veri madenciliği tekniklerinin kümeleme analizlerinde kullanımı ve uygulanması

Using visual data mining techniques in clustering analysis and an application

PDF İndir

Tez No: 237170
Yazar: METİN VATANSEVER
Danışmanlar: DOÇ. DR. ALİ HAKAN BÜYÜKLÜ
Tez Türü: Yüksek Lisans
Konular: İstatistik, Statistics
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2008
Dil: Türkçe
Üniversite: Yıldız Teknik Üniversitesi
Enstitü: Fen Bilimleri Enstitüsü
Ana Bilim Dalı: İstatistik Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 219

Özet

Veri madenciliği, geniş veri yığınları içerisinde, yararlı olma potansiyeline sahip, aralarında bilinmedik ilişkilerin olduğu verilerin keşfedilerek, veri sahibi için hem anlaşılır hem de kullanılabilir bir biçime getirilmesine yönelik geliştirilmiş yöntemler topluluğudur. Verilerin grafiksel bir formda temsil edilmesi veri yapılarının anlaşılmasını kolaylaştırır. Ancak çoğunlukla veri madenciliği teknikleri büyük miktarda veri yığınlarıyla uğraşırlar ki veri görselleştirme teknikleri ekran çözünürlüğü, insan algı sistemi gibi sınırlardan dolayı çokta başarılı olamayabilirler. Tezde bu gibi sınırları ortadan kaldırabilmek için çeşitli yeni görselleştirme teknikleri tanıtılmış ve bu görselleştirme teknikleri çok boyutlu, büyük miktarda veri kayıtlarına sahip verilerle örneklendirilmiştir. Bu yeni görselleştirme teknikleri küme yapılarının ve aşırı değerlerin keşfedilmesinde kullanılmıştır. Hatta bu görselleştirme teknikleri farklı kümeleme algoritmalarının bulduğu küme sonuçlarını değerlendirmek için de kullanılmıştır.Uygulamada, görsel teknikler kullanılarak Türkiye ilçe veri setindeki aşırı değerler ve küme yapıları tespit edilmiştir. Daha sonra bu ilçe veri seti, tek bağlantılı hiyerarşik, tam bağlantılı hiyerarşik, k-ortalamalar ve SOM gibi çoğunlukla kullanılan dört farklı kümeleme algoritmalarıyla kümelenmiştir. Çoğunlukla kullanılan altı küme doğruluk endeksi uygun küme sayısının tespitinde kullanılmıştır. Son olarak da görsel teknikler küme sonuçlarının değerlendirilmesinde kullanılmıştır. Uygulamada ki sonuçlar göstermiştir ki büyük veri setlerinde kullanılan görsel tekniklerin kümeleme çalışmalarında bulunan araştırmacılara aşırı değerlerin tespitinde, kaliteli küme sonuçlarının üretilmesinde ve uygun kümeleme algoritmalarının seçilmesinde yol gösterebilir.

Özet (Çeviri)

Data mining is the process of automatically discovering useful information in large data repositories. Data mining techniques are deployed to scour large database in order to find novel and useful patterns that might otherwise remain unknown. Data mining techniques frequently focus on the discovery of unknow structures such a clusters, trends, associations and correalations and other structures for which a visual data analysis is very appropriate quite likely to yield insight. However, data mining techniques are often applied to massive data sets where visualization may not be very successful because of the limits of both screen resolution, human visual system resolution as well as the limits of available computational resources. In this thesis, we present new visual tecniques for overcoming such limitations and illustrate the visual tecniques with some examples of successful challenges on high-dimensional and large data sets. The visual tecniques are applied to detect cluster structures and outliers. Also the visual tecniques are applied to evaluate the results of a number of different clustering algorithms.In practice, cluster structures and outliers in administrative district data set in Turkey are detected by the visual techniques. Then four widely applicable clustering algorithms such as single link hierarchical, complete link hierarchical, k-means and SOM are used to cluster the data set. Six frequently used cluster validity indices are employed to estimate the right number of clusters in the data set. Finally visual tecniques are used to evaluate the results of a number of different clustering algorithms. Our results show that visual techniques let the researcher involve in the clustering process to detect outliers, to generate high-quality clustering results and to choose the right number of cluster algorithms for large datasets

Benzer Tezler

Tez No
439597
A knowledge discovery approach to urban analysis the Beyoğlu preservation area as a data mine
Kent analizinde bir bilgi keşfi yaklaşımı bir veri madeni olarak Beyoğlu kentsel koruma alanı
AHU SÖKMENOĞLU SOHTORİK
Doktora
İngilizce
2016
Mimarlık İstanbul Teknik Üniversitesi
Mimarlık Ana Bilim Dalı
PROF. DR. GÜLEN ÇAĞDAŞ
PROF. DR. İKBAL SEVİL SARIYILDIZ
Tez No
769817
Data mining approach based on harris hawks optimization (HHO) algorithm for multiple sclerosis lesions segmentation on brain magnetic resonance images
Beyin manyetik rezonans görüntülerinde çoklu skleroz lezyonları için harrıs hawks optimizasyonu (HHO) algoritmasına dayalı veri madenciliği yaklaşımı
AMAL F A ISWIASI
Doktora
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Altınbaş Üniversitesi
Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. OĞUZ KARAN
Tez No
961173
Taxonomy and visualization of digital architecture knowledge: Proposal for a scientific online encyclopedia
Dijital mimarlık bilgisinin taksonomisi ve görselleştirilmesi: Bilimsel bir çevrim içi ansiklopedi önerisi
ESRANUR KARACİF
Doktora
İngilizce
2025
Mimarlık İstanbul Teknik Üniversitesi
Bilişim Ana Bilim Dalı
DOÇ. DR. ETHEM GÜRER
Tez No
692525
TV ve set üstü cihaz arayüz kullanılabilirlik ölçümü
Usability evaluation of TV and set-top box interfaces
AYCAN PEKPAZAR
Doktora
Türkçe
2021
Endüstri ve Endüstri Mühendisliği İstanbul Teknik Üniversitesi
Endüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. ÇİĞDEM ALTIN GÜMÜŞSOY
Tez No
128382
Veri madenciliğinde kullanılan teknikler ve bir uygulama
Data mining techniques and an application
ELİF ÖZGE ÖZDAMAR
Yüksek Lisans
Türkçe
2002
İstatistik Mimar Sinan Güzel Sanatlar Üniversitesi
İstatistik Ana Bilim Dalı
PROF. DR. M. KEMAL YOĞURTÇUGİL

Geri Dön