Makine öğrenmesi teknikleri ile metinlerin otomatik olarak sınıflandırılması
Text categorization with machine learning techniques
- Tez No: 201312
- Danışmanlar: YRD. DOÇ. DR. NİLGÜN GÜLER BAYAZIT
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Metin Sınıflama, Vektör Uzay Modeli, Naive Bayes, Çoklu Naive Bayes, Tamamlayıcı Naive Bayes, En Yakın K Komsuluk, Bilgi Kazancı, Oransal Kazanç, Ki-Kare, Text Classification, Vector-Space Model, Naive Bayes, Multinomial Naive Bayes, Complement Naive Bayes, K-Nearest-Neighbor, Information Gain, Gain Ratio, Chi- Square
- Yıl: 2007
- Dil: Türkçe
- Üniversite: Yıldız Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Matematik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 62
Özet
Bu tezin amacı, veri madenciliginin bir alt dalı olan metin madenciligi kapsamında günümüzün en önemli sorunlarından olan metin sınıflama algoritmalarının matematiksel modelinin incelenmesi ve bir uygulamasının yapılmasıdır. Literatürde bu konu ile ilgili birçok çalısma yapılmıstır. Tez çalısmasında bu çalısmalar incelenmis ve sonuçlar yorumlanmıstır. Tez çerçevesinde ilk önce metin madenciligi ve metin sınıflama problemi tanıtılacaktır. Ardından metin sınıflama probleminin matematiksel ifadesi üzerinde durulacaktır. Metin sınıflama problemi uygulanmadan önce problemde kullanılacak olan metinsel verilerin üzerinde yapılan ön islem asamaları incelenecektir. Ön islem asamalarından sonra metinlerden bilgi çıkarımı, vektör uzay modeli ve metinlerin dogru sınıflandırılma yüzdesinin arttırılmasına yönelik gelistirilen özellik seçim algoritmaları ele alınacaktır. Bunun yanı sıra metin sınıflama için gelistirilmis olan sınıflama algoritmalarından bahsedilecek, bu algoritmaların olumlu ve olumsuz yönleri üzerinde durulacak ve algoritmalar kıyaslanacaktır. Tezin son bölümünde ise algoritma performanslarının sayısal sonuçları yer alacaktır. Elde edilen sonuçlardan yola çıkarak özellik seçim algoritmalarının sınıflama yüzdesini ne ölçüde etkiledigi tartısılacaktır. Sonuçlar tablolar yardımı ile yorumlanacak ve öneriler sunulacaktır.
Özet (Çeviri)
The aim of this thesis is to study the mathematical model of text classification algorithms, being one of the most important problems of present time, and then, to apply it to the real life by using the context of text mining which is a sub branch of data mining. There have been a lot of studies in literature about this subject. In this thesis, these previous workings will be studied while their results will be interpreted. In the frame of this thesis, firstly, text mining and the problem of text classification will be introduced. After that, the formulation of classification problem will be explained. Before applying the text classification problem, the pre-calculation processes of text data will be clarified to use in the problem. Following these pre-calculation processes; being aimed at vector-space model, at taking information from text and at increasing the percent of correct classifying, the feature selection algorithms will be discussed. Besides, developed for text classification, the classification algorithms will be illustrated and then compared with each other by presenting their positive and negative sides. In the last section, there are the numerical results of algorithm performances. The influence of feature selection algorithms on the classification percent will be argued by using obtained results. Final results will be interpreted with the help of graphs and presented in tableaus.
Benzer Tezler
- Kelime gömme vektörlerinin graf dönüşümü yoluyla metin sınıflandırmada kullanımı
Use of word embedding vectors in text classification through graph conversion
ELİF DORUKBAŞI
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKarabük ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. İLKER TÜRKER
- Derin öğrenme yöntemleri ile ilişkisel doküman sınıflandırılması
Relational document classification with deep learning methods
HALİL İBRAHİM OKUR
Doktora
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Üniversitesi-CerrahpaşaBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. AHMET SERTBAŞ
- Müşteri yorumları üzerinde metin analitiği çalışmaları ve yorumların makine öğrenmesi algoritmaları ile modellenmesi
Başlık çevirisi yok
MUHAMMED IŞIK
Yüksek Lisans
Türkçe
2019
Mühendislik Bilimleriİstanbul Medeniyet ÜniversitesiUygulamalı Matematik Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ELİF KARAKAYA
- Improved helicopter classification via deep learning and overlapped range-doppler maps
Derin öğrenme ve örtüşen menzil-doppler görüntüleri ile geliştirilmiş helikopter sınıflandırması
DENİZ CAN ACER
Yüksek Lisans
İngilizce
2023
Elektrik ve Elektronik Mühendisliğiİstanbul Teknik ÜniversitesiElektronik ve Haberleşme Mühendisliği Ana Bilim Dalı
PROF. DR. IŞIN ERER
- Türkçe metinlerde sözlük tabanlı yaklaşımla duygu analizi ve görselleştirme
Sentiment analysis and visualization by dictionary based approach in Turkish texts
ABDOULAYE ISSA BABAN CHAWAI
Yüksek Lisans
Türkçe
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMarmara ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ÖNDER DEMİR
DR. ÖĞR. ÜYESİ BUKET DOĞAN