Yarı gözetimli veri kümeleme problemi üzerine
On semi-supervised data clustering problem
- Tez No: 692240
- Danışmanlar: PROF. DR. BURAK ORDİN
- Tez Türü: Doktora
- Konular: Matematik, Mathematics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: Türkçe
- Üniversite: Ege Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Matematik Ana Bilim Dalı
- Bilim Dalı: Bilgisayar Bilimleri Bilim Dalı
- Sayfa Sayısı: 73
Özet
Etiketsiz veri setleri üzerinde tanımlanan gözetimsiz sınıflandırma problemi, veri madenciliğinde çalışılan önemli alanlardan bir tanesidir. Sağlık, mühendislik ve ekonomi gibi alanlarda geniş bir kullanıma sahiptir. Bu problem için geliştirilen pek çok çözüm algoritmasının yanında artımlı yöntemler son yıllarda dikkat çekmektedir. Artımlı yöntemlerin, optimum ya da optimuma yakın değerler verdiği, yapılan çalışmalarda ifade edilmektedir. Burada, çözüm algoritmalarının uygulandığı veri setleri üzerinde herhangi bir etiket, kısıt, vb. bulunmamaktadır. Gerçek yaşam veri setleri göz önüne alındığında, etiketli ve etiketsiz verilerin bir arada olduğu gözlenmektedir. Bu durumda, yarı gözetimli veri kümeleme problemi için geliştirilen çözüm algoritmaları kullanılmaktadır. Bu tez çalışmasında, artımlı yöntemlerin avantajlarından yararlanarak, yarı gözetimli kümeleme probleminin çözümü için daha etkin algoritmaların geliştirilmesi amaçlanmıştır. İlgili problem için iki yeni algoritma önerilmiştir. Önerilen yöntemlerin etkinliği, 10 gerçek yaşam veri seti üzerinde test edilmiş ve sonuçlar, literatürde mevcut olan diğer yöntemlerle karşılaştırılmıştır.
Özet (Çeviri)
Unsupervised classification problem which is defined on unlabeled data set is one of the important areas in data mining. It has a wide usage area especially, in health, engineering, and economy. Besides many solution algorithms for this problem, incremental methods are stood out in recent years. It's expressed in the studies that, optimum or near-optimum values for clustering problem are obtained by using incremental algorithms. There isn't any label, constrain, etc. on the datasets that the solution algorithms are applied to. When real-life data sets are considered, it is observed that labeled and unlabeled data are both together. In this case, solution methods that are evolved for semi-supervised clustering problem are used. In this thesis, it's aimed to develop more effective algorithms for the solution of semi-supervised clustering problem by using the advantages of incremental methods. Hence, for the related problem, two new algorithms are proposed in this study. The efficiency of proposed algorithms is tested on the 10 real-life data sets and the results are compared with the other methods in the literature.
Benzer Tezler
- Data mining for regional and graph-structured data objects
Bölgesel ve çizge-yapılı veri nesneleri için veri madenciliği
DERYA DİNLER
Doktora
İngilizce
2019
Endüstri ve Endüstri MühendisliğiOrta Doğu Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MUSTAFA KEMAL TURAL
PROF. DR. NUR EVİN ÖZDEMİREL
- Towards adaptive brain-computer interfaces: Statistical inference for mental state recognition
Uyarlanabilir beyin-bilgisayar arayüzlerine doğru: Zihinsel durum tanıma için istatistiksel çıkarım
MASTANEH TORKAMANI AZAR
Doktora
İngilizce
2020
BiyomühendislikSabancı ÜniversitesiElektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. MÜJDAT ÇETİN
Prof. Dr. SELİM SAFFET BALCISOY
- Multi-view short-text classification using knowledge bases
Bilgi tabanı kullanarak çok görüntülü kısa metin sınıflandırma
MERT ÇALIŞAN
Yüksek Lisans
İngilizce
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. CEMAL OKAN ŞAKAR
- On networks and their applications: Stability of gene regulatorynetworks and gene function prediction using autoencoders
Ağar ve uygulamaları üzerine: Gen düzenleyici ağların kararlılığı veotokodlayıcı (autoencoder) kullanarak genlerin fonksiyonlarınıntahmini
HAMZA ÇOBAN
- Günlük hayatta gözetimsiz/yarı gözetimli öğrenme temelli stres düzeyi tespit sistemi
Unsupervised/semi-supervised learning-based stress level detection system by using unobtrusive wearables in the wild
OSMAN TUGAY BAŞARAN
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiElektronik ve Bilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. CEM ERSOY
DR. YEKTA SAİD CAN