A new outlier detection method based on probabilistic outputs of support vector machines in binary classification
İkili sınıflama probleminde aykırı gözlem tespiti için destek vektör makineleri olasılıksal çıktılarına dayalı yeni bir yöntem
- Tez No: 569846
- Danışmanlar: DOÇ. DR. FİLİZ KARDİYEN
- Tez Türü: Yüksek Lisans
- Konular: İstatistik, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: İngilizce
- Üniversite: Gazi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 91
Özet
Hızla büyüyen veri teknolojisi ile, belirli özelliklere sahip bir gözlemin doğru sınıfa atanması bağlamında sınıflandırma Makine Öğrenmesi ve Uygulamalı istatistik alanlarında en önemli ve etkin araçlardan biri haline gelmiştir. Sınıflandırma, biyomedikal çalışmalar, genetik, sosyal bilimler, pazarlama gibi pek çok alanda kullanılmaktadır. Her bir gözlemin sağ-ölü, pozitif-negatif gibi iki kategoriden birine ait olduğu veriye ikili very denir. Destek Vektör Makineleri ilk olarak 1960'ların ortasında Vladimir Vapnik tarafından geliştirilen doğrusal olarak ayrılamayan veriyi sınıflandırmaya yardımcı Kernel fonksiyonlarının da kullanımı ile oldukça esnek bir istatistiksel modeller sınıfıdır. Ancak SVM verinin aykırı gözlem veya yanlış veri gibi kirlenmiş gözlem içermesinden olumsuz yönde etkilenebilir. Bu tez çalışmasında amaç, SVM'nin temiz ve kirli veri için sınıflandırma kesinliğini karşılaştırmak olup, çalışmada Destek Vektör Makinelerinin olasılıksal çıktılarına dayanan (PoC) yeni bir aykırı değer tespit yöntemi önerilmiştir. Önerilen yöntem ile Sağlam Mahalanobis uzaklığı (MCD) yönteminin aykırı gözlem tespit oranları karşılaştırılmıştır. Sonuçlar, önerilen yöntemin daha iyi performans gösterdiğini göstermiştir.
Özet (Çeviri)
With data growing so rapidly, classification has become one of the most important and effective tools in Machine Learning and Applied Statistics, in which a given observation can be predicted in the right class given some features. Classification is used in most sectors such as; Biomedical Studies, Genetics, Social Science, Marketing, etc. Data are said to be binary when each observation falls into one of two categories, such as: alive or dead, positive or negative, etc. Support Vector Machines are a class of statistical models first developed in the mid-1960s by Vladimir Vapnik and they are very flexible due to the incorporation of Kernel Functions which can help separate and classify data that are not linearly separable. However, Support Vector Machines can suffer a lot from unclean data containing, for example, outliers or mislabeled observations. The goal of this thesis is to compare the classification accuracy of the SVM on both clean and contaminated data and also a new method based on the probabilistic outputs of SVM (PoC) is proposed. The outlier detection rate for this new method and the Robust Mahalanobis distance (MCD) are compared. The results show that PoC performs better than MCD at detecting outliers.
Benzer Tezler
- Ridge regresyonda ridge parametresi için önerilen tarama yöntemine dayalı yeni bir tahmin edici
A new estimator based on the search method proposed for the ridge parameter in ridge regression
SELMAN MERMİ
Doktora
Türkçe
2024
İstatistikMuğla Sıtkı Koçman Üniversitesiİstatistik Ana Bilim Dalı
PROF. DR. ÖZGE AKKUŞ
- Robust and efficient density based outlier detection methods for streaming data
Akış verileri için gürbüz ve verimli yoğunluk tabanlı aykırı değer tespit yöntemleri
ALİ DEĞİRMENCİ
Doktora
İngilizce
2022
Elektrik ve Elektronik MühendisliğiAnkara Yıldırım Beyazıt ÜniversitesiElektrik ve Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. ÖMER KARAL
- Adaptive signal processing based intelligent method for fault detection and classification in microgrids
Mikroşebekelerde arıza tespiti ve sınıflandırması için adaptif sinyal işleme tabanlı akıllı yöntem
RESUL AZİZİ
Doktora
İngilizce
2022
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektrik Mühendisliği Ana Bilim Dalı
PROF. DR. ŞAHİN SERHAT ŞEKER
- Özgün paragraf tabanlı çıkarım tekniği kullanarak otomatik çoklu doküman özetleme
Automatic multi-document summarization using original paragraph based extraction technique
METİN TURAN
Doktora
Türkçe
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. AHMET COŞKUN SÖNMEZ
- Robust bootstrap procedures in the presence of outliers
Aykırı değerlerin varlığında dayanıklı bootstrap yöntemleri
UĞUR BİNZAT
Doktora
İngilizce
2024
İstatistikDokuz Eylül Üniversitesiİstatistik Ana Bilim Dalı
DOÇ. DR. ENGİN YILDIZTEPE