Merkez tabanlı metin sınıflandırma
Centroid-based text classification
- Tez No: 571975
- Danışmanlar: DR. ÖĞR. ÜYESİ RIFAT AŞLIYAN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: Türkçe
- Üniversite: Aydın Adnan Menderes Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Matematik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 99
Özet
Son yıllarda bilişim alanındaki büyük ilerlemeden dolayı çok miktarda metin verilerinin işlenmesi ve sınıflandırılması ihtiyacı vardır. Sınıflandırılan verilere çok daha hızlı erişim mümkün olmaktadır. Metin sınıflandırma, dokümanların otomatik olarak önceden belirlenmiş metin kategorilerinin hangisine ait olduğunu belirleme işlemidir. Sınıflandırma yapmak için metin verileri eğitim ve test veri seti olmak üzere iki parçaya bölünür. Eğitim seti ile metotlar eğitilir. Test veri seti ile metotların sınıflandırma başarısı tespit edilir. Sınıflandırılacak dokümanlar ilk olarak ön işlemden geçirilir. Sonra her dokümanın öznitelikleri çıkarılarak doküman vektörleri oluşturulur. Bu vektörler metotlara girdi olarak alınır ve metotlar eğitilir. Böylece metoda bağlı eğitilmiş model elde edilir. Test aşamasında ise verilen bir dokümanın öznitelik vektörüne dönüştürüldükten sonra metot modeli ile hangi sınıfa ait olduğu belirlenir. Bu tezde internet üzerinden elde edilen metin verilerini merkez tabanlı metotlardan Standart Merkez Tabanlı Metot, Yaklaştır-Uzaklaştır Metot, Geniş Mesafe Yaklaştır-Uzaklaştır Metot ve Çekim Modeli ile diğer önemli metotlardan K-En Yakın Komşu, Naive Bayes ve Destek Vektör Makinesi kullanarak uygulamalar yapılmıştır. Bahsi geçen yöntemlerin performansları, Doğruluk ve F1-Ölçüsü metrikleri kullanılarak karşılaştırılmıştır.
Özet (Çeviri)
In recent years, it is necessary to process and classify a lot of text textual data because of great advances in information technology. After text data is classified, it can be accessed very fast. Text classification is the process of automatically assigning the most suitable classes for documents. For classification the textual data is divided by two sets as training and testing sets. For classification, methods are trained with the training sets. With the test sets, we determine how the performance of a method is. The documents for classification are firstly preprocessed. After that, the features of each document are extracted and document vectors are constructed. These vectors are given as inputs for the classification methods and are trained with the methods. In this way, the models of each method are generated according to the training set. After converting the document to the feature vectors, in the testing operation, the document given as an input to categorize is decided which class it belongs to. In this thesis, using the methods as Standard Centroid Based Method, Drag-Push Method, Large Margin Drag Push Method, Gravitational Model, K-Nearest Neighbor, Naive Bayes and Support Vector Machine we have developed the applications with the data sets obtained on the Internet. The performance of these methods are evaluated and compared with each other according to the Accuracy and F1-Score metrics.
Benzer Tezler
- Metin madenciliğinde kümeleme algoritmalarının matematiksel analizi üzerine
On mathematical analysis of clustering algorithms in text mining
OĞUZCAN ULUDAĞ
- Türkçe sözcük anlam belirsizliği giderme
Word sense disambiguation for Turkish
BAHAR İLGEN
Doktora
Türkçe
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. EŞREF ADALI
YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ
- Çağrı merkezine gelen aramaların metin tabanlı sınıflandırılması
Text based classification of incoming calls to the call center
MUAMMER ÖZDEMİR
Yüksek Lisans
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKarabük ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ YASİN ORTAKCI
- A new framework for decentralized social networks: Harnessing blockchain, deep learning, and natural language processing
Merkezsiz sosyal ağlar için yeni bir çerçeve: Blok zinciri, derin öğrenme ve doğal dil işlemeyi kullanmak
AMIR AL KADAH
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya ÜniversitesiYazılım Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ DENİZ BALTA
- Fake news classification using machine learning and deep learning approaches
Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması
SAJA ABDULHALEEM MAHMOOD AL-OBAIDI
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR