Geri Dön

Optimizasyon temelli öznitelik seçme yöntemleri ile desteklenen topluluk öğrenme yaklaşımına dayalı yazar tanıma

Author identification based on the ensemble learning approach supported by optimization-based feature selection methods

  1. Tez No: 678873
  2. Yazar: MERVE GÜLLÜ
  3. Danışmanlar: DOÇ. DR. HÜSEYİN POLAT
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2021
  8. Dil: Türkçe
  9. Üniversite: Gazi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 81

Özet

İnternet ve özellikle sosyal medya aracılığıyla veri arama, kopyalama ve yayma fırsatlarının artması doğru bilgiye ulaşımı azaltmıştır. Veriden doğru bilgiye ulaşma konusunda metin madenciliği alanında yapılan çalışmalardan biri metin yazarı tahminidir. Bir metin, onu yazan kişinin karakteristik özelliklerini taşır ve bu özellikler metnin yazarını tanımlamak için kullanılabilir. Bu çalışmada 54 adet yazar, değişken sayıda ve değişken uzunlukta toplam 46.837 adet köşe yazısı ile bir derlem oluşturulmuştur. Yazarların karakteristik özelliklerini çıkarmak için iki farklı analiz ve iki analizin birleştirilmesi ile oluşturulmuş karma analiz hazırlanmıştır. Analiz sonuçlarının verimliliğini artırmaya yönelik Rastgele Orman Algoritması ile Genetik Algoritma ve Tavuk Sürü Optimizasyon Algoritması yaklaşımlarına dayalı toplamda iki farklı öznitelik seçim yöntemi sunuldu. Yapılan analizler sonucunda en verimli yazar tahmini çözüm önerisi, Topluluk Öğrenimi Algoritmaları ile desteklendi. En iyi performans, Karma Analiz ve sonrasında Genetik Optimizasyon algoritması ile gerçekleştirilen işlemler sonucu oluşturulan on yazarlı veri kümesi üzerinde Torbalama Algoritmasında sınıflandırıcı metot olarak Karar Ağacı kullanımında % 95,74 olarak elde edilmiştir.

Özet (Çeviri)

Accessing accurate information has been reduced by increasing opportunities for searching, copying and disseminating data via the Internet and especially social media. One of the studies conducted in the field of text mining in obtaining correct information from data is the author identification. A text carries the characteristics of the person who wrote it, and these properties can be used to identify the author of the text. In our study, a collection contained 54 authors, and a total of 46 837 texts with different numbers and different sizes, was used. A mixed analysis was prepared by combining two different analyzes and two analyzes to reveal the characteristics of the author. In order to increase the efficiency of the analysis results two different feature selection methods were offered, based on the combination of Random Forest Algorithm with Genetic Algorithm and Chicken Swarm Optimization Algorithm. As a result of the analysis, the most efficient author identification solution was supported with Ensemble Learning Algorithms. The best performance was achieved as 95.74% in the use of Decision Tree as a classifying method in Bagging Algorithm on a data set with ten authors, which was created as a result of operations performed with the Mixed Analysis and afterwards with the Genetic Optimization algorithm.

Benzer Tezler

  1. Analysis of network security using machine learning methods

    Makine öğrenmesi yöntemleri kullanılarak ağ güvenirliği analizi

    MARYAM SALATI

    Doktora

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAnkara Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. İMAN ASKERBEYLİ

  2. Büyük boyutlu veriler için metasezgisel yöntemler ile öznitelik indirgemede yeni bir yaklaşım geliştirilmesi

    Developing a new approach to feature selection with metaheuristic methods for large scale data

    ESİN AYŞE ZAİMOĞLU

    Doktora

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. NİLÜFER YURTAY

  3. Destek vektör regresyonu ile PID kontrolör tasarımı

    Design of PID controller via support vector regression

    KEMAL UÇAK

    Yüksek Lisans

    Türkçe

    Türkçe

    2012

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Kontrol ve Otomasyon Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. GÜLAY ÖKE

  4. Yapay sinir ağları destekli etkinlik ölçümü: Veri zarflama analizi üzerine uygulamalar

    Artificial neural network aided efficiency measurement: Applications on data envelopment analysis

    IRMAK UZUN BAYAR

    Doktora

    Türkçe

    Türkçe

    2022

    İşletmeHacettepe Üniversitesi

    İşletme Ana Bilim Dalı

    DOÇ. DR. KAZIM BARIŞ ATICI

  5. Görünüş tabanlı yüz tanıma yöntemlerinde verimliliği artırmak için öznitelik seçimi

    Feature selection to improve efficiency in appearance based face recognition method

    DERYA ALTINTOP

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolErciyes Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. CELAL ÖZTÜRK