A study on some dimensionality reduction algorithms in machine learning
Makine öğrenmesinde bazı boyut indirgeme algoritmalarının incelenmesi
- Tez No: 756148
- Danışmanlar: PROF. DR. SADULLAH SAKALLIOĞLU
- Tez Türü: Yüksek Lisans
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: İngilizce
- Üniversite: Çukurova Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 98
Özet
Son yıllarda, özellikle fizik, kimya, biyoloji ve astronomi gibi uygulamalı bilimlerde, yaşamın ve bilimin birçok alanında veri miktarında bir patlama olmuştur. Deneylerden ve laboratuvar cihazlarından gelen veriler giderek daha karmaşık hale geliyor ve tek bir deney için yüzlerce, binlerce ölçüm rapor ediliyor ve bu da istatistiksel yaklaşımların bu tür yüksek boyutlu verilerle uğraşmasını zorlaştırıyor. Bu yalnızca işlemeyi aşırı derecede yavaşlatmakla kalmaz, aynı zamanda iyi bir çözüm bulmayı da çok daha zor hale getirebilir. Bununla birlikte, verilerin çoğu gereksizdir ve çok fazla bilgi kaybetmeden değişkenlerin sayısını yönetilebilir bir düzeye indirmek mümkündür. Boyut indirgeme teknikleri, bunu sağlayan matematiksel işlemlerdir; istatistik ve makine öğrenimi gibi alanlarda geniş çapta geliştirilmiş ve şu anda sıcak bir araştırma konusu olmuştur. Bu tezde boyut indirgeme konusunu ele aldık ve boyut indirgeme için yaygın olarak kullanılan yaklaşımları tartıştık ve ardından en popüler dört boyut indirgeme algoritmalarından dördünü inceledik: PCA, Çok boyutlu ölçekleme, LLE ve Isomap. Bu algoritmaları gerçek ve yapay veri kümelerine uyguladık ve bu algoritmaların daha iyi anlaşılması için sonuçları tartıştık.
Özet (Çeviri)
In recent decades, there has been an explosion in the amount of data in most fields of life and science, especially in the practical sciences like physics, chemistry, biology, and astronomy. The data coming from experiments and laboratory devices are becoming increasingly complicated, and reports hundreds or thousands of measurements for a single experiment, and that makes statistical approaches facing difficulty in dealing with such high-dimensional data. This not only does make processing extremely slow, but it can also make it much harder to find a good solution. However, much of the data is redundant, and it is possible to reduce the number of variables to a manageable level without losing too much information. Dimensionality reduction techniques are mathematical procedures that enable this reduction; they have been widely developed in fields such as statistics and machine learning, and are now a hot research topic. In this thesis, we discussed dimensionality reduction, the common approaches used for dimensionality reduction, and then went through four of the most popular dimensionality reduction techniques: PCA, Multidimensional scaling, LLE, and Isomap. We applied these algorithms to real and artificial data sets and discussed the results for a better understanding of these algorithms.
Benzer Tezler
- Makine öğrenmesinde boyutsal indirgeme teknikleri ile mobil oyun kullanıcı segmentasyonu
Mobile game user segmentation with dimensionality reduction techniques in machine learning
GÜLEN ARIKAN KOKKAYA
Doktora
Türkçe
2023
İstatistikMarmara ÜniversitesiEkonometri Ana Bilim Dalı
PROF. DR. İLKNUR ESEN YILDIRIM
- BMI prediction from face images
Yüz görüntülerinden vücut kitle indeksi tahmini
GÜLPINAR BÖLÜKBAŞ
Yüksek Lisans
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. MUSTAFA ERSEL KAMAŞAK
- Yinelemeli sinir ağları ile sermaye piyasası yön tahmini üzerine bir çalışma
A study on direction prediction of capital markets with recurrent neural networks
MUHİDDİN ÇAĞLAR EREN
Yüksek Lisans
Türkçe
2022
Endüstri ve Endüstri Mühendisliğiİstanbul Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. ALP ÜSTÜNDAĞ
- Identification of prominent genes and pathways in epilepsy patients by analysis of whole exome sequencing data
Epilepsi hastalarında başlıca gen ve yolakların tüm eksom sekanslama verisi kullanılarak analizi
VOLKAN ERDOĞAN
Yüksek Lisans
İngilizce
2015
BiyoistatistikBoğaziçi ÜniversitesiMoleküler Biyoloji ve Genetik Ana Bilim Dalı
PROF. DR. SERVER HANDE ÇAĞLAYAN
- Emotion recognition in children: Single and multimodal approaches with facial and physiological data
Çocuklarda duygu tanima: Yüz ve fizyolojik verilerle tekli ve çoklu modalite yaklaşimlari
ŞEYMA TAKIR
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. HATİCE KÖSE