Geri Dön

Stilistik özellikler kullanılarak yazar tanıma işinde yapay sinir ağlarının başarımının değerlendirilmesi: Türkçe köşe yazıları

Performance assessment of artificial neural networks for author attribution by using stylistic features: Turkish articles

  1. Tez No: 455729
  2. Yazar: ÖZLEM YAVANOĞLU
  3. Danışmanlar: DOÇ. DR. EBRU SEZER
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2017
  8. Dil: Türkçe
  9. Üniversite: Hacettepe Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 115

Özet

Günümüzde internetin sağladığı olanakların başında medya kaynaklarının hızlı olması, anonimliği ve her yerden erişiminin sağlanabilmesi gelmektedir. Bireylerin web siteleri, forumlar, e-postalar gibi ortamlarda gerçek kimliklerini kullanma zorunluluğu olmadığı için bu tür ortamlar iyi ya da kötü niyetle gerçek dışı kimlik kullanımı ve aynı zamanda gerçek olan ile olmayan arasında ayrım yapabilmeyi gerektirir. Bu bazen suçluların bazen fikri hakların bazen de basitçe isim benzerliklerinin çözümü içindir. Bir metnin incelenerek, kişilerin yazma alışkanlıkları ya da stilleri (biçimleri) analiz edilerek gerçek yazar(lar)ı hakkında bilgi sahibi olmamıza yazar tanıma çalışmaları yardımcı olmaktadır. Alanyazında yazar tanıma, yazarı belli olmayan ya da yazarından şüphe duyulan bir yazının yazarını belirleme işlemi olarak ifade edilmektedir. Geçmişten günümüze bu alanda farklı çalışmalar gerçekleştirilmiştir. Yazar tanıma, bir sınıflandırma problemi olarak ele alınmakta ve potansiyel şüpheliler grubundan en uygun yazarın belirlenmesi işlemi olarak ifade edilmektedir. Bu tez kapsamında Türkçe yazar tanıma çalışmalarında kullanılmak üzere köşe yazılarından oluşan geniş bir derlem oluşturulmuştur. Oluşturulan derlem siyaset, ekonomi, yaşam ve spor alanlarında yazılar yazan 167 köşe yazarına ait olan köşe yazılarından oluşmaktadır. Elde edilen modellerin başarısının değerlendirilmesi için farklı testler gerçekleştirilmiştir. Yapılan bu testler sonucunda elde edilen doğruluk (accuracy) değerleri 99% ile 74% arasında değişiklik göstermektedir. Ayrıca tez kapsamı içerisinde yazar tanıma çalışmasında kullanılan yazar özelliklerinin metin türü belirlemede ki başarısı değerlendirilmiş ve metin türü tanıma için farklı bir model önerilmiştir. Önerilen model bir yazının (metnin) 'Yaşam', 'Siyaset' ya da 'Ekonomi' alanlarından hangisine ait olduğunu göstermektedir. Yapılan deneyler sonucunda önerilen YSA (Yapay Sinir Ağları) modelinin doğruluk (accuracy) değeri 88% ile 70% arasında bulunmuştur. Yazar tanıma çalışma alanı için önerilen modellerin başarısının değerlendirilmesi için gözetimli öğrenme algoritmalarından biri olan k en yakın komşu (KNN) tercih edilmiştir. KNN ile yapılan deneysel çalışmalar sonucunda elde edilen doğruluk değerleri yazar tanıma için 62% olarak bulunmuştur. Bu tez kapsamında ayrıca farklı ihtiyaçlara cevap vermek ve önerilen yazar tanıma ve yazı türü tanıma modellerinin kararlılığını göstermek için hem yazar hem de yazı türü tanıyan hibrid bir YSA modeli de önerilmiştir.

Özet (Çeviri)

One of the main opportunities that the internet provides today is the rapidity of media resources, anonymity and accessibility from anywhere. Since individuals do not have to use their real identity in places like websites, forums, and e-mails, such places require good or bad intentions to distinguish between real and non-real identity use at the same time. This is sometimes for the solutions of crimes, sometimes for conceptional rights, sometimes for simply the name similarities. By examining a text that contains a crime element and by analyzing people's writing habits or styles (forms), author identificiation efforts help us to know about the true authors of those messages. In literature, author recognition is expressed as the process of determining the author of an article whose author is not known or whose author is suspected. Different works have been carried out on this field from day to day. Author recognition is considered as a classification problem and is expressed as the process of identifying the most appropriate author from the group of potential suspects. Within the scope of this thesis, it is aimed to develop author identification models in order to respond to different needs. Different tests have been carried out to assess the success of the models obtained. Accuracy values obtained from these tests vary between 99% and 74%. In addition, the success of the author features used in the author recognition study in determining the text type is evaluated and a different model for text type recognition is proposed. The proposed model shows whether a text belongs to the fields of 'Life', 'Politics' or 'Economy'. The accuracy of the proposed ANN (Artificial Neural Networks) models are between 88% and 70%. In this thesis, we also propose a hybrid ANN model which recognizes both writer and writing type in order to answer different needs and show the determination of the recommended author recognition and writing type recognition models

Benzer Tezler

  1. 1950 sonrası Türk Resim Sanatı'nda soyutlama eğilimleri ve plastik çözümlemeler

    Abstracti̇on trends and plasti̇c analysi̇es of after 1950 Turki̇sh Pai̇nti̇ng Art

    SABRİYE ÖZTÜTÜNCÜ

    Yüksek Lisans

    Türkçe

    Türkçe

    2013

    Güzel SanatlarAkdeniz Üniversitesi

    Resim Ana Sanat Dalı

    PROF. SADETTİN SARI

  2. Örgütlerde kayırmacılığın örgütsel adalet algılaması üzerindeki etkisi

    The effect of perceived organizational favouritism on organizational justice

    GAMZE SOLMAZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    İşletmePamukkale Üniversitesi

    İşletme Ana Bilim Dalı

    PROF. DR. AYŞE İRMİŞ

  3. Edebiyat çevirilerinin ve çevirmenlerinin görülebilirliğinin/görülemezliğinin çeviribilim bağlamında incelenmesi: Kayboluşlardaki varoluşlar

    An analysis of literary translations' and translators' visibility/invisibility in terms of translation studies

    AYŞE ÖZKAN

    Doktora

    Türkçe

    Türkçe

    2015

    Batı Dilleri ve EdebiyatıYıldız Teknik Üniversitesi

    Batı Dilleri ve Edebiyatları Ana Bilim Dalı

    DOÇ. AYŞE BANU KARADAĞ

  4. Türkistan hanlıkları yazışmalarının dil ve üslup incelemesi

    The state documents from Turkistan khanates: A linguistic and stylistic research

    JANNATKHON ASQAROVA

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    DilbilimAnkara Üniversitesi

    Çağdaş Türk Lehçeleri ve Edebiyatları Ana Bilim Dalı

    PROF. DR. F. SEMA BARUTCU ÖZÖNDER

  5. Rönesans Dönemi İngiliz tiyatrosunda komedyanın dili: William Shakespeare ve Ben Jonson'ın komedyalarının biçembilimsel incelemesi

    The language of comedy in English Renaissance drama: A stylistic analysis of William Shakespeare and Ben Jonson's comedies

    NİHAL DEMİRKOL AZAK

    Doktora

    Türkçe

    Türkçe

    2015

    Batı Dilleri ve EdebiyatıAnkara Üniversitesi

    Batı Dilleri ve Edebiyatları Ana Bilim Dalı

    DOÇ. DR. NAZAN TUTAŞ