Görsel veri madenciliği tekniklerinin kümeleme analizlerinde kullanımı ve uygulanması
Using visual data mining techniques in clustering analysis and an application
- Tez No: 237170
- Danışmanlar: DOÇ. DR. ALİ HAKAN BÜYÜKLÜ
- Tez Türü: Yüksek Lisans
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2008
- Dil: Türkçe
- Üniversite: Yıldız Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 219
Özet
Veri madenciliği, geniş veri yığınları içerisinde, yararlı olma potansiyeline sahip, aralarında bilinmedik ilişkilerin olduğu verilerin keşfedilerek, veri sahibi için hem anlaşılır hem de kullanılabilir bir biçime getirilmesine yönelik geliştirilmiş yöntemler topluluğudur. Verilerin grafiksel bir formda temsil edilmesi veri yapılarının anlaşılmasını kolaylaştırır. Ancak çoğunlukla veri madenciliği teknikleri büyük miktarda veri yığınlarıyla uğraşırlar ki veri görselleştirme teknikleri ekran çözünürlüğü, insan algı sistemi gibi sınırlardan dolayı çokta başarılı olamayabilirler. Tezde bu gibi sınırları ortadan kaldırabilmek için çeşitli yeni görselleştirme teknikleri tanıtılmış ve bu görselleştirme teknikleri çok boyutlu, büyük miktarda veri kayıtlarına sahip verilerle örneklendirilmiştir. Bu yeni görselleştirme teknikleri küme yapılarının ve aşırı değerlerin keşfedilmesinde kullanılmıştır. Hatta bu görselleştirme teknikleri farklı kümeleme algoritmalarının bulduğu küme sonuçlarını değerlendirmek için de kullanılmıştır.Uygulamada, görsel teknikler kullanılarak Türkiye ilçe veri setindeki aşırı değerler ve küme yapıları tespit edilmiştir. Daha sonra bu ilçe veri seti, tek bağlantılı hiyerarşik, tam bağlantılı hiyerarşik, k-ortalamalar ve SOM gibi çoğunlukla kullanılan dört farklı kümeleme algoritmalarıyla kümelenmiştir. Çoğunlukla kullanılan altı küme doğruluk endeksi uygun küme sayısının tespitinde kullanılmıştır. Son olarak da görsel teknikler küme sonuçlarının değerlendirilmesinde kullanılmıştır. Uygulamada ki sonuçlar göstermiştir ki büyük veri setlerinde kullanılan görsel tekniklerin kümeleme çalışmalarında bulunan araştırmacılara aşırı değerlerin tespitinde, kaliteli küme sonuçlarının üretilmesinde ve uygun kümeleme algoritmalarının seçilmesinde yol gösterebilir.
Özet (Çeviri)
Data mining is the process of automatically discovering useful information in large data repositories. Data mining techniques are deployed to scour large database in order to find novel and useful patterns that might otherwise remain unknown. Data mining techniques frequently focus on the discovery of unknow structures such a clusters, trends, associations and correalations and other structures for which a visual data analysis is very appropriate quite likely to yield insight. However, data mining techniques are often applied to massive data sets where visualization may not be very successful because of the limits of both screen resolution, human visual system resolution as well as the limits of available computational resources. In this thesis, we present new visual tecniques for overcoming such limitations and illustrate the visual tecniques with some examples of successful challenges on high-dimensional and large data sets. The visual tecniques are applied to detect cluster structures and outliers. Also the visual tecniques are applied to evaluate the results of a number of different clustering algorithms.In practice, cluster structures and outliers in administrative district data set in Turkey are detected by the visual techniques. Then four widely applicable clustering algorithms such as single link hierarchical, complete link hierarchical, k-means and SOM are used to cluster the data set. Six frequently used cluster validity indices are employed to estimate the right number of clusters in the data set. Finally visual tecniques are used to evaluate the results of a number of different clustering algorithms. Our results show that visual techniques let the researcher involve in the clustering process to detect outliers, to generate high-quality clustering results and to choose the right number of cluster algorithms for large datasets
Benzer Tezler
- A knowledge discovery approach to urban analysis the Beyoğlu preservation area as a data mine
Kent analizinde bir bilgi keşfi yaklaşımı bir veri madeni olarak Beyoğlu kentsel koruma alanı
AHU SÖKMENOĞLU SOHTORİK
Doktora
İngilizce
2016
Mimarlıkİstanbul Teknik ÜniversitesiMimarlık Ana Bilim Dalı
PROF. DR. GÜLEN ÇAĞDAŞ
PROF. DR. İKBAL SEVİL SARIYILDIZ
- Data mining approach based on harris hawks optimization (HHO) algorithm for multiple sclerosis lesions segmentation on brain magnetic resonance images
Beyin manyetik rezonans görüntülerinde çoklu skleroz lezyonları için harrıs hawks optimizasyonu (HHO) algoritmasına dayalı veri madenciliği yaklaşımı
AMAL F A ISWIASI
Doktora
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAltınbaş ÜniversitesiElektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. OĞUZ KARAN
- TV ve set üstü cihaz arayüz kullanılabilirlik ölçümü
Usability evaluation of TV and set-top box interfaces
AYCAN PEKPAZAR
Doktora
Türkçe
2021
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. ÇİĞDEM ALTIN GÜMÜŞSOY
- Veri madenciliğinde kullanılan teknikler ve bir uygulama
Data mining techniques and an application
ELİF ÖZGE ÖZDAMAR
Yüksek Lisans
Türkçe
2002
İstatistikMimar Sinan Güzel Sanatlar Üniversitesiİstatistik Ana Bilim Dalı
PROF. DR. M. KEMAL YOĞURTÇUGİL
- Müşteri ilişkileri yönetiminde iş zekası uygulamaları
Business intelligence applications in customer relationship management
AYŞE BİLGİ
Yüksek Lisans
Türkçe
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAnadolu ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. YAŞAR HOŞCAN