Geri Dön

A study on some dimensionality reduction algorithms in machine learning

Makine öğrenmesinde bazı boyut indirgeme algoritmalarının incelenmesi

  1. Tez No: 756148
  2. Yazar: MADAA ALHAJI
  3. Danışmanlar: PROF. DR. SADULLAH SAKALLIOĞLU
  4. Tez Türü: Yüksek Lisans
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: İngilizce
  9. Üniversite: Çukurova Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 98

Özet

Son yıllarda, özellikle fizik, kimya, biyoloji ve astronomi gibi uygulamalı bilimlerde, yaşamın ve bilimin birçok alanında veri miktarında bir patlama olmuştur. Deneylerden ve laboratuvar cihazlarından gelen veriler giderek daha karmaşık hale geliyor ve tek bir deney için yüzlerce, binlerce ölçüm rapor ediliyor ve bu da istatistiksel yaklaşımların bu tür yüksek boyutlu verilerle uğraşmasını zorlaştırıyor. Bu yalnızca işlemeyi aşırı derecede yavaşlatmakla kalmaz, aynı zamanda iyi bir çözüm bulmayı da çok daha zor hale getirebilir. Bununla birlikte, verilerin çoğu gereksizdir ve çok fazla bilgi kaybetmeden değişkenlerin sayısını yönetilebilir bir düzeye indirmek mümkündür. Boyut indirgeme teknikleri, bunu sağlayan matematiksel işlemlerdir; istatistik ve makine öğrenimi gibi alanlarda geniş çapta geliştirilmiş ve şu anda sıcak bir araştırma konusu olmuştur. Bu tezde boyut indirgeme konusunu ele aldık ve boyut indirgeme için yaygın olarak kullanılan yaklaşımları tartıştık ve ardından en popüler dört boyut indirgeme algoritmalarından dördünü inceledik: PCA, Çok boyutlu ölçekleme, LLE ve Isomap. Bu algoritmaları gerçek ve yapay veri kümelerine uyguladık ve bu algoritmaların daha iyi anlaşılması için sonuçları tartıştık.

Özet (Çeviri)

In recent decades, there has been an explosion in the amount of data in most fields of life and science, especially in the practical sciences like physics, chemistry, biology, and astronomy. The data coming from experiments and laboratory devices are becoming increasingly complicated, and reports hundreds or thousands of measurements for a single experiment, and that makes statistical approaches facing difficulty in dealing with such high-dimensional data. This not only does make processing extremely slow, but it can also make it much harder to find a good solution. However, much of the data is redundant, and it is possible to reduce the number of variables to a manageable level without losing too much information. Dimensionality reduction techniques are mathematical procedures that enable this reduction; they have been widely developed in fields such as statistics and machine learning, and are now a hot research topic. In this thesis, we discussed dimensionality reduction, the common approaches used for dimensionality reduction, and then went through four of the most popular dimensionality reduction techniques: PCA, Multidimensional scaling, LLE, and Isomap. We applied these algorithms to real and artificial data sets and discussed the results for a better understanding of these algorithms.

Benzer Tezler

  1. Makine öğrenmesinde boyutsal indirgeme teknikleri ile mobil oyun kullanıcı segmentasyonu

    Mobile game user segmentation with dimensionality reduction techniques in machine learning

    GÜLEN ARIKAN KOKKAYA

    Doktora

    Türkçe

    Türkçe

    2023

    İstatistikMarmara Üniversitesi

    Ekonometri Ana Bilim Dalı

    PROF. DR. İLKNUR ESEN YILDIRIM

  2. BMI prediction from face images

    Yüz görüntülerinden vücut kitle indeksi tahmini

    GÜLPINAR BÖLÜKBAŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. MUSTAFA ERSEL KAMAŞAK

  3. Yinelemeli sinir ağları ile sermaye piyasası yön tahmini üzerine bir çalışma

    A study on direction prediction of capital markets with recurrent neural networks

    MUHİDDİN ÇAĞLAR EREN

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. ALP ÜSTÜNDAĞ

  4. Identification of prominent genes and pathways in epilepsy patients by analysis of whole exome sequencing data

    Epilepsi hastalarında başlıca gen ve yolakların tüm eksom sekanslama verisi kullanılarak analizi

    VOLKAN ERDOĞAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2015

    BiyoistatistikBoğaziçi Üniversitesi

    Moleküler Biyoloji ve Genetik Ana Bilim Dalı

    PROF. DR. SERVER HANDE ÇAĞLAYAN

  5. Emotion recognition in children: Single and multimodal approaches with facial and physiological data

    Çocuklarda duygu tanima: Yüz ve fizyolojik verilerle tekli ve çoklu modalite yaklaşimlari

    ŞEYMA TAKIR

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. HATİCE KÖSE