Doğal dil işleme ve makine öğrenmesi yöntemleri kullanılarak stilometri analizi ile Türkçe metinlerde eser – yazar eşleştirme

Artifact – author matching in Turkish texts with stylometry analysis using natural language processing and machine learning methods

PDF İndir

Tez No: 832537
Yazar: İBRAHİM DOĞAN
Danışmanlar: DR. ÖĞR. ÜYESİ SEDAT KORKMAZ
Tez Türü: Yüksek Lisans
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2023
Dil: Türkçe
Üniversite: Konya Teknik Üniversitesi
Enstitü: Lisansüstü Eğitim Enstitüsü
Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 97

Özet

Teknolojinin ve internetin yaygınlaşmasıyla birlikte birçok alanda olduğu gibi gazetecilik alanında da değişimler ve gelişmeler meydana gelmiştir. Çevrim içi gazeteler, birçok unsuru içerisinde barındırabilmesi ve daha büyük kitlelere hitap etmesi nedeniyle çok sayıda gazete sahibinin ve bu alanda hizmet veren yazarın yoğun ilgisini üzerine çekmiştir. Bu kapsamda; geleneksel yöntemlerle yayın yapmakta olan gazeteler dijital ortamda hizmet verebilmek için hızla bu değişim sürecine dahil olmuş ve böylelikle internet üzerinden hizmet veren medya kuruluşlarının sayısında kısa süre içerisinde önemli ölçüde artış meydana gelmiştir. Gazetecilik alanında meydana gelen bu gelişmeler, farklı alanlarda eser veren yazarların aynı platform üzerinde okuyucular ile buluşmasına olanak sağlayarak birçok alanda sayısız eser verilmesinde etkili olmuştur. Ancak söz konusu bu olumlu gelişmelerin yanı sıra veri sayısında meydana gelen artış istenilen ve doğru veriye erişimi zorlaştırmıştır. Bunun sonucunda özellikle anlamsız verilerden anlamlı verilerin çıkarılması ve verilerin belirli niteliklere göre sınıflandırılması konuları önem kazanmıştır. Bu çalışmada elektronik ortamda gazete yazarlığı yapan kişilerin yazmış olduğu yazılar sayısal üslup analizi, yapay zekânın bir alt dalı olan doğal dil işleme ile makine öğrenmesi yöntemleri kullanılarak analiz edilmiş ve söz konusu yazıların hangi yazarlar tarafından yazıldığının doğru eşleştirilebilmesi amaçlanmıştır. Veri seti üzerinde veri ön işleme çalışmaları tamamlanarak veri seti optimizasyonu sağlanmış ve daha sonra Zemberek kütüphanesi fonksiyonları kullanılarak doğal dil işleme süreçleri ile öznitelik çıkarma işlemleri gerçekleştirilmiştir. Son olarak çalışmada kullanılan makine öğrenmesi sınıflandırma algoritmalarından hangisinin yazar-eser eşleştirmelerinde daha başarılı olduğuna karar verebilmek için karşılaştırma yapılmış ve model seçiminin buna bağlı olarak belirlenmesi hedeflenmiştir.

Özet (Çeviri)

With the widespread use of technology and the Internet, changes and developments have occurred in many areas, including the field of journalism. Online newspapers have attracted the attention of many newspaper owners and writers who serve in this field due to their ability to incorporate various elements and appeal to larger audiences. In this context, traditional newspapers that were operating with conventional methods quickly became part of this process of change in order to provide services in the digital environment, resulting in a significant increase in the number of media organizations operating on the Internet. These developments in journalism have enabled writers working in different fields to reach readers on the same platform, leading to numerous works being produced in various areas. However, alongside these positive developments, the increase in data volume has made it difficult to access the desired and accurate data. As a result, extracting meaningful data from meaningless data and classifying data according to specific attributes have become important topics. In this study, articles written by individuals who engage in newspaper writing in the electronic environment were analyzed using methods of numerical style analysis, natural language processing (a subfield of artificial intelligence), and machine learning to accurately match the authors of these articles. Data preprocessing was performed on the dataset to optimize it, followed by feature extraction using the functions of the Zemberek library for natural language processing. Finally, a comparison was made among the machine learning classification algorithms used in the study to determine which one was more successful in author-work matching, and the model selection was intended to be determined accordingly.

Benzer Tezler

Tez No
829299
Sarcasm detection from text with context information using deep learning
Derin öğrenme kullanarak bağlam bilgisi ile metinden açılama tespiti
MUHAMMAD USMAN
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Altınbaş Üniversitesi
Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. ABDULLAH ABDU IBRAHIM
Tez No
687202
Doğal dil işleme ile akademik metinlerin kümelenmesi
Clustering academic texts using natural language processing
SALİMKAN FATMA TAŞKIRAN
Yüksek Lisans
Türkçe
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Konya Teknik Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ERSİN KAYA
Tez No
823599
Extreme learning machine and text mining approach in sentiment analysis on massive open online course evaluations
Kitlesel çevrimiçi açık ders değerlendirmelerinde duygu analizinde aşırı öğrenme makinesi ve metin madenciliği yaklaşımı
RUMEYSA ERDOĞAN
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Ankara Yıldırım Beyazıt Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. BAHA ŞEN
DOÇ. DR. FATMA GİZEM KARAOĞLAN YILMAZ
Tez No
890864
Twitter verileri kullanılarak yapay zeka ile ilgili duygu analiz çalışması
Sentiment analysis study on artificial intelligence using twi̇tter data
MERVE HAZAN İŞCAN
Yüksek Lisans
Türkçe
2024
Mühendislik Bilimleri Harran Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ NAGEHAN İLHAN
Tez No
847299
Doğal dil işleme ve derin öğrenme yöntemleri kullanılarak finansal verilerin analizi
Analysis of financial data using natural language processing and deep learning methods
MUSTAFA SAMİ KAÇAR
Doktora
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Konya Teknik Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. HALİFE KODAZ
DR. ÖĞR. ÜYESİ SEMİH YUMUŞAK

Geri Dön