Sıralı küme örneklemesine dayalı makine öğrenmesi teknikleri
Machine learning techniques based on ranked set sampling
- Tez No: 733103
- Danışmanlar: DOÇ. DR. TUĞBA YILDIZ
- Tez Türü: Yüksek Lisans
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: Türkçe
- Üniversite: Dokuz Eylül Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Veri Bilimi Bilim Dalı
- Sayfa Sayısı: 96
Özet
Son yıllardaki hızlı veri artışı ve bu verileri analiz etmenin giderek zorlaşmasıyla birlikte, günümüzde birçok çalışma alanında makine öğrenmesi kullanılmaktadır. Makine öğrenmesi, insan beyninin öğrenme mantığını esas alarak, çeşitli algoritma ve teknikler geliştirmeyi amaçlayan bilimsel çalışma alanıdır. Makine öğrenmesi algoritmaları, olayları inceler ve nasıl meydana geldiklerini anlamaya çalışır. Bu çabaları sonucunda, elde ettikleri sonuçlar ile genelleme yapma yeteneği kazanırlar. Makine öğrenmesi algoritmalarının bilgileri öğrenmeleri ve ne kadar iyi öğrendiklerinin değerlendirilmesi için; veri kümesi, eğitim ve test seti olarak ikiye ayrılır. Literatürde bu işlem, kullanıcının belirlediği bir oranda rastgele olarak yapılır. Bu tez çalışmasında; veri seti bölme işlemi, literatürde kullanılan yönteme ek olarak, Sıralı Küme Örneklemesi (SKÖ), Uç Değer SKÖ (USKÖ), Medyan SKÖ (MSKÖ) ve Yüzdelik SKÖ (YSKÖ) yöntemleriyle yapılarak, elde edilen sonuçların karşılaştırılması amaçlanmıştır. Farklı çalışma alanlarından seçilen gerçek hayat verileri, belirtilen yöntemler ile eğitim ve test setlerine ayrılmıştır. Eğitim setleri ile makine öğrenmesi algoritmaları eğitilerek, test setleri ile öğrenme başarıları sınanmıştır. Karşılaştırma kriteri olarak; regresyon algoritmalarında hata kareler ortalamasının karekökü (HKOK) değerleri, sınıflandırma algoritmalarında ise doğru sınıflandırma oranları kullanılmıştır.
Özet (Çeviri)
With the rapid increase in data in recent years and the increasing difficulty of analyzing this data, machine learning is used in many fields of study today. Machine learning is a scientific field of study that aims to develop a variety of algorithms and techniques based on the learning logic of the human brain. Machine learning algorithms study events and try to understand how they occur. As a result of these efforts, they gain the ability to generalize with obtained results. For machine learning algorithms to learn information and to evaluate how well they learn; the data set is split into a training and test set. In the literature, this process is performed randomly at a rate determined by the user. In this thesis study, in addition to the method used in the literature, data set splitting is done by Ranked Set Sampling (RSS), Extreme RSS (ERSS), Median RSS (MRSS), Percentile RSS (PRSS) methods. It is aimed to compare the results obtained. Real life data sets selected from different workspaces are split into training and test sets with the specified methods. Machine learning algorithms were trained with training sets and learning achievements were tested with test sets. As a comparison criteria; root mean square error (RMSE) values were used in the regression algorithms, and the accurate classification rate values were used in the classification algorithms.
Benzer Tezler
- Statistical inference based on ranked set sampling
Sıralı küme örneklemesine dayalı istatistiksel çıkarsama
BEKİR ÇETİNTAV
Doktora
İngilizce
2018
İstatistikDokuz Eylül Üniversitesiİstatistik Ana Bilim Dalı
PROF. DR. SELMA GÜRLER
PROF. DR. BERNARD DE BAETS
- Sıralı küme örneklemesine dayalı istatistiksel sonuç çıkarımı
Statistical inference based on ranked set sampling
ÖZGE GÜRER
- On the estimation of population mean based on modified ranked set sampling
Değiştirilmiş sıralı küme örneklemesine dayalı kitle ortalamasının kestirimi
BÜŞRA SEVİNÇ
Yüksek Lisans
İngilizce
2016
İstatistikDokuz Eylül Üniversitesiİstatistik Ana Bilim Dalı
DOÇ. DR. SELMA GÜRLER
- Parameter estimation of probability distributions based on ranked set sampling
Olasılık dağılımlarının sıralı küme örneklemesine dayalı parametre kestirimi
MELEK ESEMEN
Yüksek Lisans
İngilizce
2017
İstatistikDokuz Eylül Üniversitesiİstatistik Ana Bilim Dalı
PROF. DR. SELMA GÜRLER
- Sıralı küme örneklemesi ile uyarlanabilir çekirdek yoğunluk tahmini
Adaptive kernel density estimation with ranked set sampling
ÖZLEM MUHTAR
Yüksek Lisans
Türkçe
2023
İstatistikMuğla Sıtkı Koçman Üniversitesiİstatistik Ana Bilim Dalı
DOÇ. DR. SERDAR DEMİR