Geri Dön

Genetik algoritma ve K-en yakın komşu kullanarak metin belgelerinin sınıflandırılması

Classification of text documents using genetic algorithm and K-nearest neighbors

  1. Tez No: 520774
  2. Yazar: PARISA LARIBI
  3. Danışmanlar: DOÇ. DR. RIDVAN SARAÇOĞLU
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2018
  8. Dil: Türkçe
  9. Üniversite: Van Yüzüncü Yıl Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 70

Özet

Metin Madenciliği büyük miktardaki metinsel verilerden, önceden bilinmeyen bilgilerin elde edilmesini amaçlayan veri madenciliğinin bir dalıdır. Sınıflandırma, kümeleme ve tahmin, Metin Madenciliğinin önemli bir parçasıdır. Başarılı bir Metin Madenciliği yine başarılı bir sınıflandırma işlemine bağlıdır. Sınıflandırma sisteminin başarısını ve verimini artırmak için genellikle boyut azaltma işlemi gerçekleştirilir. Bu çalışmada metin belgelerinin sınıflandırılmasında boyut azaltma işlemi gerçekleştirilmiştir. Bunun için iki yöntem kullanılmıştır. Bunlardan ilki özellik çıkarımı, diğeri ise özellik seçimidir. Özellik çıkarımı için Temel Bileşen Analizi yöntemi kullanılmıştır. Özellik seçiminden sonra seçilen özellikleri için katsayı ile ağırlıklandırma kullanılmıştır. Özellik seçimi aşaması için ve özellik çıkarımından sonra en iyi kat sayıların seçimi için Genetik Algoritma kullanılmıştır. Deneysel sonuçlara göre özellik seçimi sınıflandırma başarısını kısmen azaltmıştır. Özellik çıkarımı ve bu aşamadan sonra eklenen katsayı ağırlıklandırma işlemi sınıflandırma başarısını önemli ölçüde artırmıştır.

Özet (Çeviri)

Text Mining is a branch of data mining that aims to obtain previously unknown information from large quantities of textual data. Classification, clustering and estimation are some important piece of Text Mining. An important part of a successful Text Mining is the successful classification process. Dimension reduction is usually performed to improve the success and efficiency of the classification system. In this study, the dimension reduction process was performed in the classification of text documents. Two methods have been used for this. One of them is feature selection and the other is feature extraction. Principial Component Analysis method is used for feature extraction. Weighting with coefficients is used for selected features after feature selection. Genetic Algorithm is used for the feature selection phase and for the selection of the best coefficients after feature extraction. According to the experimental results, the feature selection partially reduced the classification success. Feature extraction and coefficient weighting added after this step significantly increased the classification success.

Benzer Tezler

  1. Çizge ve içerik verilerinde kolektif sınıflandırma algoritmalarının karşılaştırılması

    A comparison of collective classification techniques on network and content data

    ÖZGE ATASEVEN

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. YUSUF YASLAN

  2. Drug repositioning for neurodegenerative diseases based on bioinformatics and text mining analysis

    Biyoinformatik ve metin madenciliği analizine dayalı nörodejeneratif hastalıklar için ilaç yeniden konumlandırma

    KÜBRA TEMİZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    BiyomühendislikAdana Alparslan Türkeş Bilim Ve Teknoloji Üniversitesi

    Biyomühendislik Ana Bilim Dalı

    DOÇ. DR. ESRA GÖV

  3. Genetik ve makine öğrenmesi algoritmaları ile kripto varlıklar için al-sat kararı veren model çalışması

    A model study that makes trading decisions for crypto assets using genetic and machine learning algorithms

    BERNA YAMAN ŞAHİN

    Doktora

    Türkçe

    Türkçe

    2024

    Ekonometriİstanbul Üniversitesi

    Ekonometri Ana Bilim Dalı

    PROF. DR. SEMA ULUTÜRK AKMAN

  4. Makine öğrenme yöntemlerini kullanarak spiral test ile parkinson hastalığının tanı tahmini

    Diagnosis of parkinson disease with spiral test using machine learning methods

    MUSTAFA GERGER

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHarran Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ABDÜLKADİR GÜMÜŞÇÜ

  5. Yapay sinir ağlarında öğrenme algoritmalarının analizi

    Analysis of learning algorithms in neural networks

    SEVİNÇ BAKLAVACI