Geri Dön

Kategorisel değişkenler için veri kümelemede ağaç yöntemi ile yeni bir algoritma uygulaması

Application of a novel algorithm with data clustering tree method for categorical variables

  1. Tez No: 231659
  2. Yazar: BURAK ÇAKIR
  3. Danışmanlar: YRD. DOÇ. DR. GÖKHAN SİLAHTAROĞLU
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2008
  8. Dil: Türkçe
  9. Üniversite: Beykent Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Matematik Bilgisayar Ana Bilim Dalı
  12. Bilim Dalı: Bilgi Teknolojileri Bilim Dalı
  13. Sayfa Sayısı: 75

Özet

Veri madenciliğinde veri farklı şekiller ve gürültü içerdiği zaman büyük popülasyonları ayıklama önemli bir problemdir. İyi bir algoritma mekanızması veya metodu kümeleri bulmak açısından etkili olmalıdır. Ayrıca boyut büyüdükçe uzayın karmaşıklığı ve zaman karmaşıklığı önemli hale gelmeye başlar.Bu tez çalışmasında, veri madenciliği alanında kullanılmak üzere kategorisel değişkenlere sahip veri tabanlarında ağaç yöntemiyle veri kümeleme için yeni bir algoritmanın kullanılabilirliğinin gösterilmesi gerçekleştirilmiştir. Ağaç yöntemi kullanarak simgeler sahip oldukları değerlere ayrılmıştır. Bu değerler ve bölümler sayesinde bir veri tabanını mümkün olan en az parçadan en çok parçaya doğru sıralayarak bir ağaç oluşturulması gerçekleştirilmiştir.Çalışmanın birinci bölümünde veri madenciliği, kullanıldığı alanlar ve veri madenciliğinin gelişimi konularına değinilmiştir.İkinci bölümünde veri madenciliğinde kullanılan yöntemler, algoritmalar ve bu tezin konusu olan algoritmaya yakın olanları konu edilmiştir.Tez çalışmasının üçüncü bölümünde ise söz konusu olan algoritma ve uygulanması gösterilmiştir. Kategorisel verilerden oluşan bir veri tabanı ile gerçekleştirilen sonuçlar ele alınmış, aynı kategoride olan diğer algoritmalarla karşılaştırılması gerçekleştirilmiştir. Sentetik bir veri tabanı ile elde edilen sonuçlar gösterilmiştir.Dördüncü bölümde ise, elde edilen bilgiler doğrultusuna, sonuçlar incelenmiş ve algoritmanın uygulanabilirliği hakkında yorumlar yapılmıştır.

Özet (Çeviri)

The major reason that data mining became one of the hottest current technologies of the information age is the wide availability of huge amounts of data and the need for turning such data into useful information and knowledge. As computer systems getting cheaper and computer power increases, the amount of data available to be collected and processed increases. Therefore using techniques that operates very well with large amounts of data becomes an obvious choice. The information and knowledge gained can be used for applications ranging from business management, production control, and market analysis, to engineering design and science exploration.In this study, a new data mining algorithm used and tested for categorical variable. This algorithm improved by Yrd. Doç. Dr. Gökhan SİLAHTAROĞLU. This algorithm to call“A Tree Approach to Clustering Data with Categorical Variables”. In the literature there are different approaches to form tree. To determine the best attribute, used an equal-split parameter. After forming the clusters, used another clustering algorithm such as PAM, CLARA or K-Means to reduce the number of leaves to the number required by the user.

Benzer Tezler

  1. Clustering of divers using data mining techniques

    Dalgıçların veri madenciliği teknikleri kullanılarak sınıflandırılması

    AHMET CÜNEYT YAVUZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGalatasaray Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. SALİH MURAT EGİ

  2. Long term competitive advantage effect on company value with fuzzy logic and machine learning applications

    Bulanık mantık ve makine öğrenmesi uygulamaları ile uzun vadeli rekabet avantajının şirket değeri üzerine etkisi

    ZEKERİYA BİLDİK

    Doktora

    İngilizce

    İngilizce

    2024

    İşletmeİstanbul Teknik Üniversitesi

    İşletme Ana Bilim Dalı

    DOÇ. DR. KAYA TOKMAKÇIOĞLU

  3. New proposed methods for synthetic minority over-sampling technique

    Sentetik azınlık aşırı örnekleme tekniği için yeni önerilen yöntemler

    HAKAN KORUL

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilim ve Teknolojiİstanbul Teknik Üniversitesi

    Veri Mühendisliği ve İş Analitiği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MEHMET ALİ ERGÜN

  4. Derin öğrenme ve büyük veri analitiği yöntemleriKullanarak Covid-19 yayılımının ileriye dönük tahmini

    Forecasting the spread of covid-19 using deep learning and big data analytics methods

    CYLAS KIGANDA

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    PROF. DR. MUHAMMET ALİ AKCAYOL

  5. Comprehensive risk mapping and fire station optimization for forest fire management: An application in Antalya

    Orman yangını yönetimi için kapsamlı risk haritalama ve yangın istasyonu optimizasyonu: Antalya uygulaması

    ZÜHAL ÖZCAN YAVUZ

    Doktora

    İngilizce

    İngilizce

    2024

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. ÖZGÜR KABAK

    DR. ÖĞR. ÜYESİ İNCİ ÇAĞLAYAN