Geri Dön

Veri madenciliği algoritmaları karşılaştırılması

Comparison of data mining algorithms

  1. Tez No: 275428
  2. Yazar: CENGİZ COŞKUN
  3. Danışmanlar: YRD. DOÇ. DR. ABDULLAH BAYKAL
  4. Tez Türü: Yüksek Lisans
  5. Konular: Matematik, Mathematics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2010
  8. Dil: Türkçe
  9. Üniversite: Dicle Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Matematik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 109

Özet

Bu tezde veri madenciliğinin genel bir tanımı yapılmış; veri madenciliği metotları ve algoritmaları hakkında bilgi verilmiş, model oluşturma basamakları ve oluşturulan modellerin karşılaştırılması için kullanılan metriklerden bahsedilmiş ve bu teorik bilgiler ışığında bir veri kaynağı üzerinde veri madenciliğinde yaygın olarak kullanılan birkaç algoritmanın karşılaştırmalı değerlendirmesi yapılmıştır.Çalışmanın teorik kısmında veri madenciliği uygulamasının bir veri kaynağı üzerinde hangi aşamalardan geçtiği üzerinde durulmuş, kullanılmakta olan metotlar ve bu metotlara ait algoritmalar anlatılmış ve oluşturulan modeli değerlendirme kriterleri hakkında bilgi verilmiştir.Çalışmanın uygulama kısmında ise, teorik kısımda anlatılmış olan bilgiler ışığında; J48, NaiveBayes, Lojistik Regresyon ve KStar algoritmalarının karşılaştırması yapılmıştır. Karşılaştırma yapılırken veri önişlemeden başlamak üzere, hangi bilgilerin kullanıldığı, nasıl bir metot izlendiği, algoritmaların oluşturduğu modellerin istatistiksel sonuçları ve bu sonuçların nasıl değerlendirildiği detaylı bir şekilde anlatılmıştır.Yapılan karşılaştırma sonucuna göre eldeki veri üzerinde çalıştırılan dört farklı algoritmadan J48 algoritmasının ürettiği modelin en iyi karşılaştırma ölçütlerine sahip olduğu sonucuna ulaşılmış, ancak modeller arasında belirgin bir farklılık oluşmadığı sonucu da vurgulanmıştır.

Özet (Çeviri)

In this thesis, a theoretical study of metrics and methods of data mining algorithm comparison is documented and a comparison of several well known data mining algorithms is studied. Different kinds of data mining algorithms exist for different methodologies such as association, classification, clustering methods. A comparison of classification algorithms was performed using a breast cancer data including 204,949 records as a case study.In the theoretical phase of the study, a general information about data mining, methodologies used as part of data mining process, preprocessing of the data, and description of comparison metrics is given. Since the main aim of this study is related to the comparison of algorithms, information about data mining and the methods is briefly mentioned and not detailed. The information given is just an overview of the whole process in order to enlighten how the comparison proceeds and on what basics it holds on.In the application phase, a comparison of classification algorithms including J48, NaiveBayes, Logistic Regression and KStar is performed. It starts with the description of the tool, Weka, used for the application of algorithms on the data. Then, data source that was used to train and test the models is described. Structure and semantics of the source is studied in detail. Preprocess of the data and related work is mentioned that includes both the introduction of Arff format and data cleansing and restructuring. At the end, algorithms are applied and results of those algortihms in terms of statistical figures are given and a comparison is performed using those metrics mentioned in the theoretical phase.

Benzer Tezler

  1. An application of adaptive-network-based fuzzy inference system on automated teller machine data and comparison of different data mining algorithms

    Bir bankamatik verilerinin farklı veri madenciliği teknikleri kullanarak karşılaştırılması

    MUSTAFA KARA

    Yüksek Lisans

    İngilizce

    İngilizce

    2011

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ADEM KARAHOCA

  2. Bulanık çıkarsama sistemleri ile veri madenciliği yöntemlerinin sınıflama performansının benzetim çalışması ile karşılaştırılması ve sağlık alanında uygulanması

    A comparison of classification performance of fuzzy inference system with data mining methods using simulation study and application in medicine

    İREM KAR

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    BiyoistatistikAnkara Üniversitesi

    Biyoistatistik Ana Bilim Dalı

    DOÇ. DR. SERDAL KENAN KÖSE

  3. Hava durumu tahmini için veri madenciliği tabanlı bir model geliştirilmesi

    Development of a data mining based model for weather forecasting

    YUNUS EMRE CEBECİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ŞULE ÖĞÜDÜCÜ

  4. Matching of social media accounts by using public information

    Sosyal medya hesaplarının herkese açık bilgilerin kullanılarak eşleştirilmesi

    YAĞIZ ÇETİNKAL

    Yüksek Lisans

    İngilizce

    İngilizce

    2016

    Bilgi ve Belge Yönetimiİzmir Yüksek Teknoloji Enstitüsü

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. SERAP ŞAHİN