Geri Dön

Makine öğrenmesi teknikleri ile metinlerin otomatik olarak sınıflandırılması

Text categorization with machine learning techniques

  1. Tez No: 201312
  2. Yazar: AYSUN DOĞRUSÖZ
  3. Danışmanlar: YRD. DOÇ. DR. NİLGÜN GÜLER BAYAZIT
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Metin Sınıflama, Vektör Uzay Modeli, Naive Bayes, Çoklu Naive Bayes, Tamamlayıcı Naive Bayes, En Yakın K Komsuluk, Bilgi Kazancı, Oransal Kazanç, Ki-Kare, Text Classification, Vector-Space Model, Naive Bayes, Multinomial Naive Bayes, Complement Naive Bayes, K-Nearest-Neighbor, Information Gain, Gain Ratio, Chi- Square
  7. Yıl: 2007
  8. Dil: Türkçe
  9. Üniversite: Yıldız Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Matematik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 62

Özet

Bu tezin amacı, veri madenciliginin bir alt dalı olan metin madenciligi kapsamında günümüzün en önemli sorunlarından olan metin sınıflama algoritmalarının matematiksel modelinin incelenmesi ve bir uygulamasının yapılmasıdır. Literatürde bu konu ile ilgili birçok çalısma yapılmıstır. Tez çalısmasında bu çalısmalar incelenmis ve sonuçlar yorumlanmıstır. Tez çerçevesinde ilk önce metin madenciligi ve metin sınıflama problemi tanıtılacaktır. Ardından metin sınıflama probleminin matematiksel ifadesi üzerinde durulacaktır. Metin sınıflama problemi uygulanmadan önce problemde kullanılacak olan metinsel verilerin üzerinde yapılan ön islem asamaları incelenecektir. Ön islem asamalarından sonra metinlerden bilgi çıkarımı, vektör uzay modeli ve metinlerin dogru sınıflandırılma yüzdesinin arttırılmasına yönelik gelistirilen özellik seçim algoritmaları ele alınacaktır. Bunun yanı sıra metin sınıflama için gelistirilmis olan sınıflama algoritmalarından bahsedilecek, bu algoritmaların olumlu ve olumsuz yönleri üzerinde durulacak ve algoritmalar kıyaslanacaktır. Tezin son bölümünde ise algoritma performanslarının sayısal sonuçları yer alacaktır. Elde edilen sonuçlardan yola çıkarak özellik seçim algoritmalarının sınıflama yüzdesini ne ölçüde etkiledigi tartısılacaktır. Sonuçlar tablolar yardımı ile yorumlanacak ve öneriler sunulacaktır.

Özet (Çeviri)

The aim of this thesis is to study the mathematical model of text classification algorithms, being one of the most important problems of present time, and then, to apply it to the real life by using the context of text mining which is a sub branch of data mining. There have been a lot of studies in literature about this subject. In this thesis, these previous workings will be studied while their results will be interpreted. In the frame of this thesis, firstly, text mining and the problem of text classification will be introduced. After that, the formulation of classification problem will be explained. Before applying the text classification problem, the pre-calculation processes of text data will be clarified to use in the problem. Following these pre-calculation processes; being aimed at vector-space model, at taking information from text and at increasing the percent of correct classifying, the feature selection algorithms will be discussed. Besides, developed for text classification, the classification algorithms will be illustrated and then compared with each other by presenting their positive and negative sides. In the last section, there are the numerical results of algorithm performances. The influence of feature selection algorithms on the classification percent will be argued by using obtained results. Final results will be interpreted with the help of graphs and presented in tableaus.

Benzer Tezler

  1. Kelime gömme vektörlerinin graf dönüşümü yoluyla metin sınıflandırmada kullanımı

    Use of word embedding vectors in text classification through graph conversion

    ELİF DORUKBAŞI

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKarabük Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. İLKER TÜRKER

  2. Derin öğrenme yöntemleri ile ilişkisel doküman sınıflandırılması

    Relational document classification with deep learning methods

    HALİL İBRAHİM OKUR

    Doktora

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Üniversitesi-Cerrahpaşa

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. AHMET SERTBAŞ

  3. Müşteri yorumları üzerinde metin analitiği çalışmaları ve yorumların makine öğrenmesi algoritmaları ile modellenmesi

    Başlık çevirisi yok

    MUHAMMED IŞIK

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Mühendislik Bilimleriİstanbul Medeniyet Üniversitesi

    Uygulamalı Matematik Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ELİF KARAKAYA

  4. Improved helicopter classification via deep learning and overlapped range-doppler maps

    Derin öğrenme ve örtüşen menzil-doppler görüntüleri ile geliştirilmiş helikopter sınıflandırması

    DENİZ CAN ACER

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. IŞIN ERER

  5. Türkçe metinlerde sözlük tabanlı yaklaşımla duygu analizi ve görselleştirme

    Sentiment analysis and visualization by dictionary based approach in Turkish texts

    ABDOULAYE ISSA BABAN CHAWAI

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMarmara Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ÖNDER DEMİR

    DR. ÖĞR. ÜYESİ BUKET DOĞAN