Metin madenciliği yöntemleri ile yazar tanıma: Divan Edebiyatı örneği
Authorship recognition with text mining methods: The example of Divan literature
- Tez No: 523212
- Danışmanlar: DR. ÖĞR. ÜYESİ TOLGA BERBER
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Türk Dili ve Edebiyatı, İstatistik, Computer Engineering and Computer Science and Control, Turkish Language and Literature, Statistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2018
- Dil: Türkçe
- Üniversite: Karadeniz Teknik Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: İstatistik ve Bilgisayar Bilimleri Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 87
Özet
Özellikle 21. yy'ın başından itibaren bilişim teknolojilerinin artan hızda gelişmesi ve gündelik hayatın neredeyse her aşamasına entegre olması ile birçok alanda büyük miktarda veri toplanmaya başlanmıştır. Bu verilerin sistematik bir şekilde depolanması, hızlı bir şekilde yönetilmesi ve kolaylıkla analiz edilebilmesi için veri tabanı yönetim sistemleri kullanılmaktadır. Bilişim dünyasındaki bilgilerin büyük çoğunluğu düz metin, e-posta, resim, ses ve video dosyaları gibi sistematik olmayan verilerdir. Geleneksel istatistiki yöntemler ile analiz edilemeyen bu verilerden anlamlı bilgiler çıkarabilmek için veri madenciliği, metin madenciliği, duygu analizi, görüntü ve ses işleme gibi yöntemler kullanılmaktadır. Bu çalışmada incelenen veriler de metin formatında olduğundan metin madenciliği yöntemleri kullanılmıştır. Metin madenciliğinin temel hedefleri metinlerin konularına göre ayrıştırılması, özetinin çıkarılması, başlıklarının eklenmesi ve yazarlarının belirlenmesidir. Bu çalışma ile 25 divan edebiyatı şairine ait eserlerin yazarlarını belirleyen bir sistem geliştirilmiştir. Metin madenciliğinin metin sınıflandırma algoritmalarından yararlanılarak sözcüklerin analiz edilmesine dayanan bu sistemde her bir parametrenin olası değerleri için 20 farklı model kurulmuştur. Her modelin tek tek karşılaştırılması neticesinde %91,45'lık doğruluk ve %90,23'lük f-değerine ulaşılmıştır. Böyle bir çalışmanın uzun vadede yazarı bilinmeyen eserlerin sahiplerinin tespitine dair tahminleri destekleyebileceği düşünülmektedir.
Özet (Çeviri)
Especially since the beginning of the 21st century, with the increasing speed of information technology and integration into almost every phase of everyday life, a large amount of data has been collected in many areas. Database management systems are used to store such data in order to utilize them systematically, manage them quickly, and analyze them easily. The vast majority of data in the information world is non-systematic, such as pictures and audio files, text files in pdf, word and txt. formats, e-mails, and log files kept on web pages. Methods such as data mining, text mining, sentiment analysis, image and sound processing are used to extract significant information from these data, which cannot be analyzed by traditional statistical methods. For this study text mining methods have been used since the data analyzed in this study are in text format. The main target of text mining is to separate the texts according to their subjects in order to summarize them, to add their titles and to determine their authors. In this study, a system has been developed to determine the authors of 25 poetry works belonging to Divan Literature. In this system, which is based on analyzing the words by using the text classification algorithms of text mining, 20 different models have been established for the possible values of each parameter. As a result of our individual comparisons of each model, 91.26% accuracy and 90.23% f-value ratings were achieved. Such this study is thought to be able to support estimates of the identification of authors of unknown works in the long term.
Benzer Tezler
- Optimizasyon temelli öznitelik seçme yöntemleri ile desteklenen topluluk öğrenme yaklaşımına dayalı yazar tanıma
Author identification based on the ensemble learning approach supported by optimization-based feature selection methods
MERVE GÜLLÜ
Yüksek Lisans
Türkçe
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. HÜSEYİN POLAT
- Elektronik kaynakların lisanslamasında rehber ulusal ilkelerin geliştirilmesi
Developing guideline national principles for the licensing of electronic resources
DAMLA YILMAZ
Doktora
Türkçe
2024
Bilgi ve Belge YönetimiAnkara ÜniversitesiBilgi ve Belge Yönetimi Ana Bilim Dalı
PROF. DR. SACİT ARSLANTEKİN
- Temel eğitimden ortaöğretime geçiş sınavı kazanımlarının veri madenciliği yöntemleri ile değerlendirilmesi
Evaluation of acquisitions of the transition from primary education to secondary education exam with data mining methods
ERTAN CAN
Yüksek Lisans
Türkçe
2017
Eğitim ve ÖğretimAfyon Kocatepe Üniversitesiİnternet ve Bilişim Teknolojileri Yönetimi Ana Bilim Dalı
DOÇ. DR. UÇMAN ERGÜN
- Web tabanlı anket sistemi ile elde edilen verilerin veri madenciliği yöntemi ile analizi
Data analysis of a web-based survey using data mining methods
ZEYNEP ELABİAD
Yüksek Lisans
Türkçe
2013
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Aydın ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. METİN ZONTUL
- Tip 2 diyabet hastalığına ilişkin haberlerin metin madenciliği yöntemi ile incelenmesi
Analyzing the news on type 2 diabetes by text mining method
SEMA DÖKME YAĞAR
Doktora
Türkçe
2022
Sağlık Kurumları YönetimiAnkara ÜniversitesiSağlık Kurumları Yönetimi Ana Bilim Dalı
DOÇ. DR. ÇAĞDAŞ ERKAN AKYÜREK