Metin sınıflandırma için makine öğrenmesi tekniklerine dayalı bir yöntem geliştirme
A method development based on machine learning techniques for text classification
- Tez No: 515169
- Danışmanlar: DOÇ. DR. HASAN BULUT
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2018
- Dil: Türkçe
- Üniversite: Ege Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 80
Özet
Metin sınıflandırma, metinleri organize etmek amacıyla önceden tanımlanmış kategorilere dahil etme işlemidir. Son yıllarda dijital ortamdaki verinin artması, bu verilerden bilgi çıkarımını ve bilginin kullanılabilirliğinin artırılması üzerine olan çalışmaları hızlandırmıştır. Otomatik Metin sınıflandırma çalışmaları metnin anlamlandırılmasında ve düzenlenmesinde oldukça etkili çözümler sunmaktadır. Bu tez kapsamında metin sınıflandırma problemine makine öğrenmesi yöntemleriyle çözüm getirilmiştir. Metin sınıflandırma işlemi sırasında; doğal dil işleme teknikleriyle metni temsil eden değerler belirlenirken sınıflandırma esnasında makine öğrenmesi metotları kullanılır. Metni temsil eden öznitelikler kelime öznitelik vektörü, varlık isimleri öznitelik vektörü, ve cümle birimleri (part of speech) öznitelik vektörü olmak üzere kategorize edilerek, sınıflandırmaya olan etkileri incelenmiştir. Bununla birlikte sınıflandırma aşamasında farklı makine öğrenmesi algoritmaları birleştirilerek sınıflandırıcı topluluğunun başarıları gözlenmiştir. Öznitelik vektörü olarak kelimeler, cümle birimleri ve varlık isimlerinin birlikte kullanılmasının başarıyı olumlu etkilediği görülmüştür.
Özet (Çeviri)
Text classification is a process of including the text in predefined categories in order to organize it. In recent years, the increase in data in the digital environment has accelerated the work on extracting information from the data and increasing the availability of information. Automatic text classification studies offer very effective solutions in understanding and organizing the text. The problem of text classification is solved by machine learning methods within the scope of this thesis. When machine learning methods are used during text classification, values representing text are determined by natural language processing techniques. The features that represent the text are categorized as word feature vector, name entities feature vector, and part of speech feature vector, meanwhile the effects on classifications of these categorizations have been examined. Additionally, during the classification the success of ensemble methods has been observed by putting different machine learning algorithms together. The use of words, part of speech units and name entities all together as a feature vector was found to have a positive effect on success.
Benzer Tezler
- Fake news classification using machine learning and deep learning approaches
Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması
SAJA ABDULHALEEM MAHMOOD AL-OBAIDI
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR
- Character-level dilated deep neural networks for web attack detection
Ağ yöresi saldırılarının belirlenmesi için karakter düzeyinde seyreltilmiş derin sinir ağları
NAZANIN MOARREF
Doktora
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. MEHMET TAHİR SANDIKKAYA
- Application of data mining techniques in software engineering
Yazılım mühendisliğinde veri madenciliği tekniklerinin uygulanması
ELİFE ÖZTÜRK KIYAK
Doktora
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolDokuz Eylül ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. DERYA BİRANT
- Cancer diagnosis and classification using ML-based natural language processing: A case study at an Iraqi hospital
ML tabanlı doğal dil işleme kullanılarak kanser tanısı ve sınıflandırılması: Irak'ta bir hastanede bir vaka çalışması
SAFA MUWAFAQ NAYYEF AL-FARIS
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. MUSTAFA ÖZBAYRAK
- Obfuscated JavaScript detection using syntactically and lexically enhanced machine learning
Perdelenmiş JavaScript kodlarının sözdizimsel ve anlamsal yönden iyileştirilmiş makina öğrenmesi ile tespiti
EREN KILIÇ
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MEHMET TAHİR SANDIKKAYA