Geri Dön

Yarı gözetimli veri kümeleme problemi üzerine

On semi-supervised data clustering problem

  1. Tez No: 692240
  2. Yazar: BENGİ KANAT COŞKUN
  3. Danışmanlar: PROF. DR. BURAK ORDİN
  4. Tez Türü: Doktora
  5. Konular: Matematik, Mathematics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: Türkçe
  9. Üniversite: Ege Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Matematik Ana Bilim Dalı
  12. Bilim Dalı: Bilgisayar Bilimleri Bilim Dalı
  13. Sayfa Sayısı: 73

Özet

Etiketsiz veri setleri üzerinde tanımlanan gözetimsiz sınıflandırma problemi, veri madenciliğinde çalışılan önemli alanlardan bir tanesidir. Sağlık, mühendislik ve ekonomi gibi alanlarda geniş bir kullanıma sahiptir. Bu problem için geliştirilen pek çok çözüm algoritmasının yanında artımlı yöntemler son yıllarda dikkat çekmektedir. Artımlı yöntemlerin, optimum ya da optimuma yakın değerler verdiği, yapılan çalışmalarda ifade edilmektedir. Burada, çözüm algoritmalarının uygulandığı veri setleri üzerinde herhangi bir etiket, kısıt, vb. bulunmamaktadır. Gerçek yaşam veri setleri göz önüne alındığında, etiketli ve etiketsiz verilerin bir arada olduğu gözlenmektedir. Bu durumda, yarı gözetimli veri kümeleme problemi için geliştirilen çözüm algoritmaları kullanılmaktadır. Bu tez çalışmasında, artımlı yöntemlerin avantajlarından yararlanarak, yarı gözetimli kümeleme probleminin çözümü için daha etkin algoritmaların geliştirilmesi amaçlanmıştır. İlgili problem için iki yeni algoritma önerilmiştir. Önerilen yöntemlerin etkinliği, 10 gerçek yaşam veri seti üzerinde test edilmiş ve sonuçlar, literatürde mevcut olan diğer yöntemlerle karşılaştırılmıştır.

Özet (Çeviri)

Unsupervised classification problem which is defined on unlabeled data set is one of the important areas in data mining. It has a wide usage area especially, in health, engineering, and economy. Besides many solution algorithms for this problem, incremental methods are stood out in recent years. It's expressed in the studies that, optimum or near-optimum values for clustering problem are obtained by using incremental algorithms. There isn't any label, constrain, etc. on the datasets that the solution algorithms are applied to. When real-life data sets are considered, it is observed that labeled and unlabeled data are both together. In this case, solution methods that are evolved for semi-supervised clustering problem are used. In this thesis, it's aimed to develop more effective algorithms for the solution of semi-supervised clustering problem by using the advantages of incremental methods. Hence, for the related problem, two new algorithms are proposed in this study. The efficiency of proposed algorithms is tested on the 10 real-life data sets and the results are compared with the other methods in the literature.

Benzer Tezler

  1. Data mining for regional and graph-structured data objects

    Bölgesel ve çizge-yapılı veri nesneleri için veri madenciliği

    DERYA DİNLER

    Doktora

    İngilizce

    İngilizce

    2019

    Endüstri ve Endüstri MühendisliğiOrta Doğu Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MUSTAFA KEMAL TURAL

    PROF. DR. NUR EVİN ÖZDEMİREL

  2. Towards adaptive brain-computer interfaces: Statistical inference for mental state recognition

    Uyarlanabilir beyin-bilgisayar arayüzlerine doğru: Zihinsel durum tanıma için istatistiksel çıkarım

    MASTANEH TORKAMANI AZAR

    Doktora

    İngilizce

    İngilizce

    2020

    BiyomühendislikSabancı Üniversitesi

    Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MÜJDAT ÇETİN

    Prof. Dr. SELİM SAFFET BALCISOY

  3. Multi-view short-text classification using knowledge bases

    Bilgi tabanı kullanarak çok görüntülü kısa metin sınıflandırma

    MERT ÇALIŞAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. CEMAL OKAN ŞAKAR

  4. On networks and their applications: Stability of gene regulatorynetworks and gene function prediction using autoencoders

    Ağar ve uygulamaları üzerine: Gen düzenleyici ağların kararlılığı veotokodlayıcı (autoencoder) kullanarak genlerin fonksiyonlarınıntahmini

    HAMZA ÇOBAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    BiyofizikKoç Üniversitesi

    Fizik Ana Bilim Dalı

    DOÇ. DR. ALKAN KABAKÇIOĞLU

  5. Günlük hayatta gözetimsiz/yarı gözetimli öğrenme temelli stres düzeyi tespit sistemi

    Unsupervised/semi-supervised learning-based stress level detection system by using unobtrusive wearables in the wild

    OSMAN TUGAY BAŞARAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Elektronik ve Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. CEM ERSOY

    DR. YEKTA SAİD CAN