Veri madenciliğinde çeşitli kümeleme algoritmalarının farklı platformlarda karşılaştırmalı analizi
Comperative analysis of several data mining clustering algorithms on different platforms
- Tez No: 363902
- Danışmanlar: YRD. DOÇ. DR. TOLGA AYDIN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2014
- Dil: Türkçe
- Üniversite: Atatürk Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 304
Özet
Veri üretme, veri toplama ve veri kullanımındaki teknolojik gelişmeler sonucu hızlı bir şekilde artan veritabanı boyutları, verileri kısa süre içinde kullanışlı ve anlaşılır bilgilere çevirebilen yeni teknikler ve araçlar gerektirmektedir. Bu gereksinimlere yanıt vermek üzere tanımlanan veri madenciliği, mevcut veri kaynaklarından, kullanıcının farklı sorularına yanıt verecek, kesin, faydalı, anlaşılır, önceden bilinmeyen ve kullanışlı bilgilerin elde edilmesi işlemidir. Veri madenciliğinde yaygın olarak kullanılan yöntemlerden biri kümeleme analizidir. Kümeleme işlemi veri analizi aşamasında örüntü oluşturma aşamasında, veri kaynağındaki tüm verileri kullanmak yerine, benzer özellik gösteren verileri temsil eden kümeleri kullanır. Veri madenciliğinde bir çok kümeleme metodu bulunmaktadır. Bu çalışmada öncelikle veri madenciliği kavramı açıklanarak veri madenciliğinin aşamaları ve kullanım alanları hakkında bilgiler verilmiş ve daha sonra veri madenciliğinde kullanılan kümeleme algoritmaları teorik ve uygulama çerçevelerinde açıklanmaya çalışılmıştır. XLSTAT, R, WEKA ve RapidMiner (YALE) platformları çeşitli kümeleme algoritmalarını çalıştırmak için kullanılmıştır. Literatürde kullanılan kümeleme işlemine uygun bazı veri kümeleri ve bir üniversitenin kütüphane kayıtlarından elde edilen veriler ele alınarak, kümeleme analizi teknikleri uygulanmış ve sonuçlar analiz edilmiştir.
Özet (Çeviri)
Data generation, data collection and rapidly increasing database sizes as a result of technological developments in use of data requires new techniques and tolls that are capable of transforming data into useful understandable information in a short time. One of the commonly-used methods is the clustering analysis in data mining. In the data analysis phase, clustering process employs clusters that represent similar data rather than using the whole data source. In this study, we first explain the data mining concept. Following this, stages and usage areas of data mining are elaborated. Finally, clustering algorithms employed in data mining are analysed both in theoretical and experimental frameworks. XLSTAT, R, WEKA and RapidMiner (YALE) platforms are used to run several clustering algorithms.The data used several clustering data existing in the literature and also data collected from the library records of a university are used as input for several clustering techniques and the results are analysed.
Benzer Tezler
- Hava trafiği yönetimi için ADS-B sistemi uçuşverilerinin veri madenciliği yöntemleriyledeğerlendirilmesi
ADS-B system for air traffic managementevaluation with efficiency methods
MUHAMMET ÇELİK
Yüksek Lisans
Türkçe
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat ÜniversitesiYazılım Mühendisliği Ana Bilim Dalı
PROF. DR. ENGİN AVCI
- Veri madenciliğinde hiyerarşik kümeleme algoritmalarının uygulamalı karşılaştırılması
Comparison of hierarchical clustering algorithms in data mining with applications
YUSUF ALTINOK
Yüksek Lisans
Türkçe
2019
EkonometriMarmara ÜniversitesiEkonometri Ana Bilim Dalı
PROF. DR. AHMET METE ÇİLİNGİRTÜRK
- Evaluation of the relationship between the stability of feature selection techniques and classification performance in data mining
Veri madenciliğinde öznitelik seçim tekniklerinin kararlılıkları ve sınıflandırma performansları arasındaki ilişkinin değerlendirilmesi
MUSTAFA BÜYÜKKEÇECİ
Doktora
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYaşar ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. MEHMET CUDİ OKUR
- Implementation of some medical data in Apriori algorithm
Apriori algoritmasının bazı tıbbı verilere uygulanması
FAWAD SADIQMAL
Yüksek Lisans
İngilizce
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya ÜniversitesiBilgisayar ve Bilişim Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. NILÜFER YURTAY
- Metin madenciliğinde kullanılan yöntemlerin karşılaştırılması: Siyasi parti liderlerinin grup genel toplantı konuşmaları ile bir uygulama
Comparison of techniques and methodologies used in text mining: An application with group meeting speeches of Turkish political part leaders
KEZİBAN SEÇKİN
Yüksek Lisans
Türkçe
2011
Siyasal BilimlerSakarya Üniversitesiİşletme Ana Bilim Dalı
DOÇ. DR. ERMAN COŞKUN