Geri Dön

Birkaç veri kümesi ile WEKA ve MATLAB üzerinde kümeleme algoritmalarının karşılaştırılarak incelenmesi

Using couple of datasets, analysis by comparing clustering algorithms between WEKA and MATLAB platforms

  1. Tez No: 483766
  2. Yazar: MUSTAFA TAKAOĞLU
  3. Danışmanlar: PROF. DR. ZAFER ASLAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2016
  8. Dil: Türkçe
  9. Üniversite: İstanbul Aydın Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 160

Özet

Günümüzde teknoloji takip edilmesi zor bir hızla ilerlemektedir. Bu ilerlemenin bir sonucu olarak teknolojiden direkt veya dolaylı olarak etkilenen sektörlerde birçok yeni iş alanları ve alt sektörleri oluşmuştur. Bilişim teknolojilerinin alt dallarından biri olan veri tabanı sistemleri de bu teknolojik gelişimden etkilenmiş ve kendi içerisinde yeni teknolojik dallara sahip olmuştur. Veri tabanı analizi veya veri madenciliği buna örnektir. Önceki zamanlarda verilerin önemli olanları saklanmakta ve geri kalanı oluşturdukları ek depolama maliyetleri yüzünden kullanılmamakta iken, gelişen yapay zeka ve bilimsel esnek hesaplama yöntemleri ile bu önemsiz gibi gözüken veriler ciddi önem kazanmıştır. Veri madenciliği üzerinde bilgi sahibi olan bireyler çalıştıkları sektörler ile paralel olarak; geleceğe yönelik çeşitli tahminler, firmalarının içinde bulundukları durumun anlık incelenmesi, sosyal medya verilerine göre müşteri memnuniyeti ve bunu arttırmak için yapılması gerekenler gibi birçok alanda başarılı sonuçlar elde edebilirler. Daha çok tahmin ve analiz işlemlerinin önem kazandığı bu günlerde, tez çalışmamızda bu işlemlerin kullanıldığı kümeleme algoritmaları ele alınmıştır. Bu tez çalışmasındaki amacımız K-Means kümeleme algoritması, Expectation Maximization kümeleme algoritması ve Hiyerarşik kümeleme algoritmaları üzerinde derinlemesine bilgi sahibi olmak ve edindiğimiz bilgileri uygun yazılım platformları üzerinde denemektir. Bu amaçla, Boğaziçi Üniversitesi Kandilli Rasathanesi ve Deprem Araştırma Enstitüsünden alınan iklim verileri anlatılan kümeleme algoritmaları üzerinde denenmiştir. Kümeleme algoritmalarının her biri MATLAB ve WEKA programları üzerinde uygulanmıştır. Elde edilen sonuçlar üzerinden kullanmış olduğumuz programlar ve algoritmaların karşılaştırılmaları yapılmıştır. Son olarak MATLAB ve WEKA kullanımlarının avantajları ve dezavantajlarından bahsedilmiştir.

Özet (Çeviri)

Nowadays, it is impossible to follow technological developments because of it's rapidly growing trend. As a result of this trend, new branches of business sectors appear. One of the sub branch of technology area which is called as database systems faced with same situation. It is effected by this technological growing trend. Data mining sector had been derivated like this way. Former database systems only cares personal and meta datas and see the other datas as a weight. But today, with the help of artifical intelligence and scientific flexible calculation ways data stacks has become more important than ever. The people who become experienced about data mining and it's usage, can use their abilities in parallel business sectors.For instance, finance sector personnels can perform their datamining skills on predicting the future of their special area. On the other hand, company can measure gladness of their customers according to social media responses. Business men can predict or estimate their current and future position in the global and local market. As a summary, expectation of the employees which includes tech workers and business specialists are using data mining solutions for prediction. And prediction job has always links with clustering algorithms. That's why I choose comparing clustering algorithms over some Boğaziçi University Kandilli Observatory and Earthquake Research Institute values of Turkey as a master thesis of mine. For accomplish this task, I used Matlab and Weka platforms as computer programmes. I choosed mostly used clustering algorithms which are K-Means, Expectation Maximization and Hierarchical Clustering algorithms to compare with each other. With the help of these comparisons, I would like to be experienced about clustering algorithms and their mostly used platforms. Firstly, I defined each algorithm on both platforms and than I opportunity to compare them with each other according to their advantages and disadvantages.

Benzer Tezler

  1. Contextual and time-based developer metrics in software defect prediction

    Yazılım hata tahminlerinde içerik ve zamana göre değişen geliştirici metriklerinin kullanımı

    SELDAĞ KİNİ ÖZCAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ AYŞE TOSUN

  2. Makine öğrenmesi yöntemiyle ağ ataklarının tespiti

    Detection of network attacks with machine learning method

    FEYZAN SARUHAN ÖZDAĞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. DERYA YILTAŞ KAPLAN

  3. Bilgi sistemlerinde fark fonksiyonu tabanlı özellik seçme yönteminin geliştirilmesi

    Development of discernibility function based feature selection method in information systems

    MEHMET HACIBEYOĞLU

    Doktora

    Türkçe

    Türkçe

    2012

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSelçuk Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. AHMET ARSLAN

  4. Comparison of machine learning algorithms for financial evaluations

    Finansal değerlendirmeler için makine öğrenmesi algoritmalarının karşılaştırılması

    WUDAY COLLEY

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGebze Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    ASSOC. DR. MEHMET GÖKTÜRK

  5. Makine öğrenmesi teknikleri ile tahsilat davranışı tahmini: telekomünikasyon sektörü örneği

    Prediction of debt collection behaviour with machine learning techniques: A case study on telecommunication company customers

    ELİF EKİZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. BAŞAR ÖZTAYŞİ