Geri Dön

Destek vektör makineleri ile doküman sınıflandırma

Document classification with support vector machine

  1. Tez No: 293207
  2. Yazar: ÜZEYİR FİDAN
  3. Danışmanlar: YRD. DOÇ. DR. ENGİN TAŞ
  4. Tez Türü: Yüksek Lisans
  5. Konular: İstatistik, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2013
  8. Dil: Türkçe
  9. Üniversite: Afyon Kocatepe Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 73

Özet

Bu tezde, çevrimiçi Destek Vektör Makineleri (DVM) kullanılarak doküman sınıflandırma çalışması yapılmıştır. Lasvm algoritması eşli çekirdek yöntemi ile çalışacak şekilde adapte edilmiştir. İlk olarak, seçilen çekirdek fonksiyonun etkileri ve parametreler belirlenmiştir. Bunun için doğrusal bir karar sınırı ile sınıflanacak dokümanlar yüksek boyutlu bir uzaya gömülmüştür. Bu nedenle veri gömme prosedürü ve çekirdek hilesi detayları örneklerle açıklanmıştır. Optimal hiper parametreler belirlendikten sonra eşli eğitim ve test verilerinin farklı kombinasyonları ile deneyler yapılmıştır. DVM modellerinin performansları doğru sınıflandırma oranı ve ROC eğrisi altında kalan alan kriterleri ile değerlendirilmiştir. Sonuçlar, çevrimiçi sınıflandırmanın ikili ve çok sınıflı, sınıflandırma işlemlerine iyi bir alternatif metot olduğunu göstermiştir. Bu doküman sınıflandırma işleminde, eldeki verilerin yüksek boyutlu olması nedeniyle doğrusal eşli çekirdekler, gauss eşli çekirdeklerine göre daha iyi sonuçlar vermiştir.

Özet (Çeviri)

In this thesis, document classification task is studied using an online Support Vector Machine. Lasvm algorithm is adapted as to work with pairwise kernels. At first, the effects of the choice of the kernel function and its parameters are considered. In order to classify documents with a linear decision bound, the data is mapped into a higher dimensional space. Therefore the data mapping procedure and the kernel trick are explained in detail with several examples. After the determination of optimal hyperparameters, experiments are conducted on different combinations of pairwise training and testing data. Performances of the SVM models are compared according to the classification accuracy and area under the ROC curve. Results indicate that online pairwise classification is a good alternative to the methods used in binary and multiclass classification tasks. In this document classification task, linear pairwise kernels achieve better results than the gaussian pairwise kernels because of the high dimensionality of the data at hand.

Benzer Tezler

  1. Makine öğrenmesi kullanarak doküman sınıflandırma

    Document classification using machine learning

    GÜLER ALPARSLAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilişim Sistemleri Ana Bilim Dalı

    PROF. DR. MAHİR DURSUN

  2. Yapay zeka yöntemleri ile uzaktan eğitimdeki sorunların tespiti ve öğrencilerin akademik performanslarının tahmin edilmesi

    Detecting the problems in distance education and predicting the academic performance of students by using artificial intelligence methods

    HALİT IRMAK

    Doktora

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Üniversitesi

    Enformatik Ana Bilim Dalı

    DOÇ. DR. ZÜMRÜT ECEVİT SATI

  3. Prediction of psychological distress in persons through narrative writing by using natural language processing (NLP)

    Doğal dil işleme (NLP) kullanılarak anlatı yazımı yoluyla kişilerde psikolojik sıkıntının öngörülmesi

    BUSE DEMİR

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    İstatistikDokuz Eylül Üniversitesi

    İstatistik Ana Bilim Dalı

    PROF. DR. ÖZLEM EGE ORUÇ

  4. İnşaat sözleşmelerinde hak talebi yönetimi: Kamu projeleri için öneri model

    Claim management in construction contracts: Proposed model for public construction projects

    İSMAİL CENGİZ YILMAZ

    Doktora

    Türkçe

    Türkçe

    2013

    Mimarlıkİstanbul Teknik Üniversitesi

    Mimarlık Ana Bilim Dalı

    PROF. DR. HÜSEYİN ATİLLA DİKBAŞ

  5. Automatic defect detection in fabrics using computer vision techniques

    Bilgisayarla görme teknikleriyle dokuma ürünlerinde otomatik hata tespiti

    ABUBAKAR RABIU

    Yüksek Lisans

    İngilizce

    İngilizce

    2014

    Elektrik ve Elektronik MühendisliğiMelikşah Üniversitesi

    Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. KADİR AŞKIN PEKER