Geri Dön

Metin sınıflandırma için makine öğrenmesi tekniklerine dayalı bir yöntem geliştirme

A method development based on machine learning techniques for text classification

  1. Tez No: 515169
  2. Yazar: SÜMEYRA NUR ALTAN
  3. Danışmanlar: DOÇ. DR. HASAN BULUT
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2018
  8. Dil: Türkçe
  9. Üniversite: Ege Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 80

Özet

Metin sınıflandırma, metinleri organize etmek amacıyla önceden tanımlanmış kategorilere dahil etme işlemidir. Son yıllarda dijital ortamdaki verinin artması, bu verilerden bilgi çıkarımını ve bilginin kullanılabilirliğinin artırılması üzerine olan çalışmaları hızlandırmıştır. Otomatik Metin sınıflandırma çalışmaları metnin anlamlandırılmasında ve düzenlenmesinde oldukça etkili çözümler sunmaktadır. Bu tez kapsamında metin sınıflandırma problemine makine öğrenmesi yöntemleriyle çözüm getirilmiştir. Metin sınıflandırma işlemi sırasında; doğal dil işleme teknikleriyle metni temsil eden değerler belirlenirken sınıflandırma esnasında makine öğrenmesi metotları kullanılır. Metni temsil eden öznitelikler kelime öznitelik vektörü, varlık isimleri öznitelik vektörü, ve cümle birimleri (part of speech) öznitelik vektörü olmak üzere kategorize edilerek, sınıflandırmaya olan etkileri incelenmiştir. Bununla birlikte sınıflandırma aşamasında farklı makine öğrenmesi algoritmaları birleştirilerek sınıflandırıcı topluluğunun başarıları gözlenmiştir. Öznitelik vektörü olarak kelimeler, cümle birimleri ve varlık isimlerinin birlikte kullanılmasının başarıyı olumlu etkilediği görülmüştür.

Özet (Çeviri)

Text classification is a process of including the text in predefined categories in order to organize it. In recent years, the increase in data in the digital environment has accelerated the work on extracting information from the data and increasing the availability of information. Automatic text classification studies offer very effective solutions in understanding and organizing the text. The problem of text classification is solved by machine learning methods within the scope of this thesis. When machine learning methods are used during text classification, values representing text are determined by natural language processing techniques. The features that represent the text are categorized as word feature vector, name entities feature vector, and part of speech feature vector, meanwhile the effects on classifications of these categorizations have been examined. Additionally, during the classification the success of ensemble methods has been observed by putting different machine learning algorithms together. The use of words, part of speech units and name entities all together as a feature vector was found to have a positive effect on success.

Benzer Tezler

  1. Fake news classification using machine learning and deep learning approaches

    Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması

    SAJA ABDULHALEEM MAHMOOD AL-OBAIDI

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR

  2. Character-level dilated deep neural networks for web attack detection

    Ağ yöresi saldırılarının belirlenmesi için karakter düzeyinde seyreltilmiş derin sinir ağları

    NAZANIN MOARREF

    Doktora

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. MEHMET TAHİR SANDIKKAYA

  3. Application of data mining techniques in software engineering

    Yazılım mühendisliğinde veri madenciliği tekniklerinin uygulanması

    ELİFE ÖZTÜRK KIYAK

    Doktora

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDokuz Eylül Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. DERYA BİRANT

  4. Cancer diagnosis and classification using ML-based natural language processing: A case study at an Iraqi hospital

    ML tabanlı doğal dil işleme kullanılarak kanser tanısı ve sınıflandırılması: Irak'ta bir hastanede bir vaka çalışması

    SAFA MUWAFAQ NAYYEF AL-FARIS

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. MUSTAFA ÖZBAYRAK

  5. Obfuscated JavaScript detection using syntactically and lexically enhanced machine learning

    Perdelenmiş JavaScript kodlarının sözdizimsel ve anlamsal yönden iyileştirilmiş makina öğrenmesi ile tespiti

    EREN KILIÇ

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ MEHMET TAHİR SANDIKKAYA