Geri Dön

Metin madenciliği yöntemleri ile yazar tanıma: Divan Edebiyatı örneği

Authorship recognition with text mining methods: The example of Divan literature

  1. Tez No: 523212
  2. Yazar: ALİ OSMAN BİLGİN
  3. Danışmanlar: DR. ÖĞR. ÜYESİ TOLGA BERBER
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Türk Dili ve Edebiyatı, İstatistik, Computer Engineering and Computer Science and Control, Turkish Language and Literature, Statistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2018
  8. Dil: Türkçe
  9. Üniversite: Karadeniz Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: İstatistik ve Bilgisayar Bilimleri Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 87

Özet

Özellikle 21. yy'ın başından itibaren bilişim teknolojilerinin artan hızda gelişmesi ve gündelik hayatın neredeyse her aşamasına entegre olması ile birçok alanda büyük miktarda veri toplanmaya başlanmıştır. Bu verilerin sistematik bir şekilde depolanması, hızlı bir şekilde yönetilmesi ve kolaylıkla analiz edilebilmesi için veri tabanı yönetim sistemleri kullanılmaktadır. Bilişim dünyasındaki bilgilerin büyük çoğunluğu düz metin, e-posta, resim, ses ve video dosyaları gibi sistematik olmayan verilerdir. Geleneksel istatistiki yöntemler ile analiz edilemeyen bu verilerden anlamlı bilgiler çıkarabilmek için veri madenciliği, metin madenciliği, duygu analizi, görüntü ve ses işleme gibi yöntemler kullanılmaktadır. Bu çalışmada incelenen veriler de metin formatında olduğundan metin madenciliği yöntemleri kullanılmıştır. Metin madenciliğinin temel hedefleri metinlerin konularına göre ayrıştırılması, özetinin çıkarılması, başlıklarının eklenmesi ve yazarlarının belirlenmesidir. Bu çalışma ile 25 divan edebiyatı şairine ait eserlerin yazarlarını belirleyen bir sistem geliştirilmiştir. Metin madenciliğinin metin sınıflandırma algoritmalarından yararlanılarak sözcüklerin analiz edilmesine dayanan bu sistemde her bir parametrenin olası değerleri için 20 farklı model kurulmuştur. Her modelin tek tek karşılaştırılması neticesinde %91,45'lık doğruluk ve %90,23'lük f-değerine ulaşılmıştır. Böyle bir çalışmanın uzun vadede yazarı bilinmeyen eserlerin sahiplerinin tespitine dair tahminleri destekleyebileceği düşünülmektedir.

Özet (Çeviri)

Especially since the beginning of the 21st century, with the increasing speed of information technology and integration into almost every phase of everyday life, a large amount of data has been collected in many areas. Database management systems are used to store such data in order to utilize them systematically, manage them quickly, and analyze them easily. The vast majority of data in the information world is non-systematic, such as pictures and audio files, text files in pdf, word and txt. formats, e-mails, and log files kept on web pages. Methods such as data mining, text mining, sentiment analysis, image and sound processing are used to extract significant information from these data, which cannot be analyzed by traditional statistical methods. For this study text mining methods have been used since the data analyzed in this study are in text format. The main target of text mining is to separate the texts according to their subjects in order to summarize them, to add their titles and to determine their authors. In this study, a system has been developed to determine the authors of 25 poetry works belonging to Divan Literature. In this system, which is based on analyzing the words by using the text classification algorithms of text mining, 20 different models have been established for the possible values of each parameter. As a result of our individual comparisons of each model, 91.26% accuracy and 90.23% f-value ratings were achieved. Such this study is thought to be able to support estimates of the identification of authors of unknown works in the long term.

Benzer Tezler

  1. Optimizasyon temelli öznitelik seçme yöntemleri ile desteklenen topluluk öğrenme yaklaşımına dayalı yazar tanıma

    Author identification based on the ensemble learning approach supported by optimization-based feature selection methods

    MERVE GÜLLÜ

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HÜSEYİN POLAT

  2. Elektronik kaynakların lisanslamasında rehber ulusal ilkelerin geliştirilmesi

    Developing guideline national principles for the licensing of electronic resources

    DAMLA YILMAZ

    Doktora

    Türkçe

    Türkçe

    2024

    Bilgi ve Belge YönetimiAnkara Üniversitesi

    Bilgi ve Belge Yönetimi Ana Bilim Dalı

    PROF. DR. SACİT ARSLANTEKİN

  3. Temel eğitimden ortaöğretime geçiş sınavı kazanımlarının veri madenciliği yöntemleri ile değerlendirilmesi

    Evaluation of acquisitions of the transition from primary education to secondary education exam with data mining methods

    ERTAN CAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    Eğitim ve ÖğretimAfyon Kocatepe Üniversitesi

    İnternet ve Bilişim Teknolojileri Yönetimi Ana Bilim Dalı

    DOÇ. DR. UÇMAN ERGÜN

  4. Web tabanlı anket sistemi ile elde edilen verilerin veri madenciliği yöntemi ile analizi

    Data analysis of a web-based survey using data mining methods

    ZEYNEP ELABİAD

    Yüksek Lisans

    Türkçe

    Türkçe

    2013

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Aydın Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. METİN ZONTUL

  5. Tip 2 diyabet hastalığına ilişkin haberlerin metin madenciliği yöntemi ile incelenmesi

    Analyzing the news on type 2 diabetes by text mining method

    SEMA DÖKME YAĞAR

    Doktora

    Türkçe

    Türkçe

    2022

    Sağlık Kurumları YönetimiAnkara Üniversitesi

    Sağlık Kurumları Yönetimi Ana Bilim Dalı

    DOÇ. DR. ÇAĞDAŞ ERKAN AKYÜREK