Geri Dön

Doğal dil işleme ve makine öğrenmesi yöntemleri kullanılarak stilometri analizi ile Türkçe metinlerde eser – yazar eşleştirme

Artifact – author matching in Turkish texts with stylometry analysis using natural language processing and machine learning methods

  1. Tez No: 832537
  2. Yazar: İBRAHİM DOĞAN
  3. Danışmanlar: DR. ÖĞR. ÜYESİ SEDAT KORKMAZ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: Türkçe
  9. Üniversite: Konya Teknik Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 97

Özet

Teknolojinin ve internetin yaygınlaşmasıyla birlikte birçok alanda olduğu gibi gazetecilik alanında da değişimler ve gelişmeler meydana gelmiştir. Çevrim içi gazeteler, birçok unsuru içerisinde barındırabilmesi ve daha büyük kitlelere hitap etmesi nedeniyle çok sayıda gazete sahibinin ve bu alanda hizmet veren yazarın yoğun ilgisini üzerine çekmiştir. Bu kapsamda; geleneksel yöntemlerle yayın yapmakta olan gazeteler dijital ortamda hizmet verebilmek için hızla bu değişim sürecine dahil olmuş ve böylelikle internet üzerinden hizmet veren medya kuruluşlarının sayısında kısa süre içerisinde önemli ölçüde artış meydana gelmiştir. Gazetecilik alanında meydana gelen bu gelişmeler, farklı alanlarda eser veren yazarların aynı platform üzerinde okuyucular ile buluşmasına olanak sağlayarak birçok alanda sayısız eser verilmesinde etkili olmuştur. Ancak söz konusu bu olumlu gelişmelerin yanı sıra veri sayısında meydana gelen artış istenilen ve doğru veriye erişimi zorlaştırmıştır. Bunun sonucunda özellikle anlamsız verilerden anlamlı verilerin çıkarılması ve verilerin belirli niteliklere göre sınıflandırılması konuları önem kazanmıştır. Bu çalışmada elektronik ortamda gazete yazarlığı yapan kişilerin yazmış olduğu yazılar sayısal üslup analizi, yapay zekânın bir alt dalı olan doğal dil işleme ile makine öğrenmesi yöntemleri kullanılarak analiz edilmiş ve söz konusu yazıların hangi yazarlar tarafından yazıldığının doğru eşleştirilebilmesi amaçlanmıştır. Veri seti üzerinde veri ön işleme çalışmaları tamamlanarak veri seti optimizasyonu sağlanmış ve daha sonra Zemberek kütüphanesi fonksiyonları kullanılarak doğal dil işleme süreçleri ile öznitelik çıkarma işlemleri gerçekleştirilmiştir. Son olarak çalışmada kullanılan makine öğrenmesi sınıflandırma algoritmalarından hangisinin yazar-eser eşleştirmelerinde daha başarılı olduğuna karar verebilmek için karşılaştırma yapılmış ve model seçiminin buna bağlı olarak belirlenmesi hedeflenmiştir.

Özet (Çeviri)

With the widespread use of technology and the Internet, changes and developments have occurred in many areas, including the field of journalism. Online newspapers have attracted the attention of many newspaper owners and writers who serve in this field due to their ability to incorporate various elements and appeal to larger audiences. In this context, traditional newspapers that were operating with conventional methods quickly became part of this process of change in order to provide services in the digital environment, resulting in a significant increase in the number of media organizations operating on the Internet. These developments in journalism have enabled writers working in different fields to reach readers on the same platform, leading to numerous works being produced in various areas. However, alongside these positive developments, the increase in data volume has made it difficult to access the desired and accurate data. As a result, extracting meaningful data from meaningless data and classifying data according to specific attributes have become important topics. In this study, articles written by individuals who engage in newspaper writing in the electronic environment were analyzed using methods of numerical style analysis, natural language processing (a subfield of artificial intelligence), and machine learning to accurately match the authors of these articles. Data preprocessing was performed on the dataset to optimize it, followed by feature extraction using the functions of the Zemberek library for natural language processing. Finally, a comparison was made among the machine learning classification algorithms used in the study to determine which one was more successful in author-work matching, and the model selection was intended to be determined accordingly.

Benzer Tezler

  1. Sarcasm detection from text with context information using deep learning

    Derin öğrenme kullanarak bağlam bilgisi ile metinden açılama tespiti

    MUHAMMAD USMAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAltınbaş Üniversitesi

    Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. ABDULLAH ABDU IBRAHIM

  2. Doğal dil işleme ile akademik metinlerin kümelenmesi

    Clustering academic texts using natural language processing

    SALİMKAN FATMA TAŞKIRAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKonya Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ERSİN KAYA

  3. Extreme learning machine and text mining approach in sentiment analysis on massive open online course evaluations

    Kitlesel çevrimiçi açık ders değerlendirmelerinde duygu analizinde aşırı öğrenme makinesi ve metin madenciliği yaklaşımı

    RUMEYSA ERDOĞAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAnkara Yıldırım Beyazıt Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. BAHA ŞEN

    DOÇ. DR. FATMA GİZEM KARAOĞLAN YILMAZ

  4. Twitter verileri kullanılarak yapay zeka ile ilgili duygu analiz çalışması

    Sentiment analysis study on artificial intelligence using twi̇tter data

    MERVE HAZAN İŞCAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Mühendislik BilimleriHarran Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ NAGEHAN İLHAN

  5. Doğal dil işleme ve derin öğrenme yöntemleri kullanılarak finansal verilerin analizi

    Analysis of financial data using natural language processing and deep learning methods

    MUSTAFA SAMİ KAÇAR

    Doktora

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKonya Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. HALİFE KODAZ

    DR. ÖĞR. ÜYESİ SEMİH YUMUŞAK