Geri Dön

Stilistik özellikler kullanılarak yazar tanıma işinde yapay sinir ağlarının başarımının değerlendirilmesi: Türkçe köşe yazıları

Performance assessment of artificial neural networks for author attribution by using stylistic features: Turkish articles

  1. Tez No: 455729
  2. Yazar: ÖZLEM YAVANOĞLU
  3. Danışmanlar: DOÇ. DR. EBRU SEZER
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2017
  8. Dil: Türkçe
  9. Üniversite: Hacettepe Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 115

Özet

Günümüzde internetin sağladığı olanakların başında medya kaynaklarının hızlı olması, anonimliği ve her yerden erişiminin sağlanabilmesi gelmektedir. Bireylerin web siteleri, forumlar, e-postalar gibi ortamlarda gerçek kimliklerini kullanma zorunluluğu olmadığı için bu tür ortamlar iyi ya da kötü niyetle gerçek dışı kimlik kullanımı ve aynı zamanda gerçek olan ile olmayan arasında ayrım yapabilmeyi gerektirir. Bu bazen suçluların bazen fikri hakların bazen de basitçe isim benzerliklerinin çözümü içindir. Bir metnin incelenerek, kişilerin yazma alışkanlıkları ya da stilleri (biçimleri) analiz edilerek gerçek yazar(lar)ı hakkında bilgi sahibi olmamıza yazar tanıma çalışmaları yardımcı olmaktadır. Alanyazında yazar tanıma, yazarı belli olmayan ya da yazarından şüphe duyulan bir yazının yazarını belirleme işlemi olarak ifade edilmektedir. Geçmişten günümüze bu alanda farklı çalışmalar gerçekleştirilmiştir. Yazar tanıma, bir sınıflandırma problemi olarak ele alınmakta ve potansiyel şüpheliler grubundan en uygun yazarın belirlenmesi işlemi olarak ifade edilmektedir. Bu tez kapsamında Türkçe yazar tanıma çalışmalarında kullanılmak üzere köşe yazılarından oluşan geniş bir derlem oluşturulmuştur. Oluşturulan derlem siyaset, ekonomi, yaşam ve spor alanlarında yazılar yazan 167 köşe yazarına ait olan köşe yazılarından oluşmaktadır. Elde edilen modellerin başarısının değerlendirilmesi için farklı testler gerçekleştirilmiştir. Yapılan bu testler sonucunda elde edilen doğruluk (accuracy) değerleri 99% ile 74% arasında değişiklik göstermektedir. Ayrıca tez kapsamı içerisinde yazar tanıma çalışmasında kullanılan yazar özelliklerinin metin türü belirlemede ki başarısı değerlendirilmiş ve metin türü tanıma için farklı bir model önerilmiştir. Önerilen model bir yazının (metnin) 'Yaşam', 'Siyaset' ya da 'Ekonomi' alanlarından hangisine ait olduğunu göstermektedir. Yapılan deneyler sonucunda önerilen YSA (Yapay Sinir Ağları) modelinin doğruluk (accuracy) değeri 88% ile 70% arasında bulunmuştur. Yazar tanıma çalışma alanı için önerilen modellerin başarısının değerlendirilmesi için gözetimli öğrenme algoritmalarından biri olan k en yakın komşu (KNN) tercih edilmiştir. KNN ile yapılan deneysel çalışmalar sonucunda elde edilen doğruluk değerleri yazar tanıma için 62% olarak bulunmuştur. Bu tez kapsamında ayrıca farklı ihtiyaçlara cevap vermek ve önerilen yazar tanıma ve yazı türü tanıma modellerinin kararlılığını göstermek için hem yazar hem de yazı türü tanıyan hibrid bir YSA modeli de önerilmiştir.

Özet (Çeviri)

One of the main opportunities that the internet provides today is the rapidity of media resources, anonymity and accessibility from anywhere. Since individuals do not have to use their real identity in places like websites, forums, and e-mails, such places require good or bad intentions to distinguish between real and non-real identity use at the same time. This is sometimes for the solutions of crimes, sometimes for conceptional rights, sometimes for simply the name similarities. By examining a text that contains a crime element and by analyzing people's writing habits or styles (forms), author identificiation efforts help us to know about the true authors of those messages. In literature, author recognition is expressed as the process of determining the author of an article whose author is not known or whose author is suspected. Different works have been carried out on this field from day to day. Author recognition is considered as a classification problem and is expressed as the process of identifying the most appropriate author from the group of potential suspects. Within the scope of this thesis, it is aimed to develop author identification models in order to respond to different needs. Different tests have been carried out to assess the success of the models obtained. Accuracy values obtained from these tests vary between 99% and 74%. In addition, the success of the author features used in the author recognition study in determining the text type is evaluated and a different model for text type recognition is proposed. The proposed model shows whether a text belongs to the fields of 'Life', 'Politics' or 'Economy'. The accuracy of the proposed ANN (Artificial Neural Networks) models are between 88% and 70%. In this thesis, we also propose a hybrid ANN model which recognizes both writer and writing type in order to answer different needs and show the determination of the recommended author recognition and writing type recognition models

Benzer Tezler

  1. Tamgacı: Artırımsal ve geri beslemeli Türkçe yazar çözümleme

    Turkish authorship analysis with an incremental and adaptive model

    OĞUZ ASLANTÜRK

    Doktora

    Türkçe

    Türkçe

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. HAYRİ SEVER

  2. A Method for identifying coherent structures in turbulent flows

    Başlık çevirisi yok

    BEDRİ ŞEFİK

    Doktora

    İngilizce

    İngilizce

    1991

    Mühendislik Bilimleriİstanbul Teknik Üniversitesi

    PROF.DR. ERDOĞAN ŞUHUBİ

  3. Virtual agency in Béla Bartók's night music compositions

    Béla Bartók'un gece müziği bestelerinde sanal eylemlilik

    KAAN MUZAFFER BIYIKOĞLU

    Doktora

    İngilizce

    İngilizce

    2023

    Müzikİstanbul Teknik Üniversitesi

    Müzik Ana Bilim Dalı

    DOÇ. DR. ERAY ALTINBÜKEN

  4. İrlanda tiyatrosu ve İrlandalılık: Synge ve Mcdonagh

    Irish theatre and Irishness: Synge and Mcdonagh

    MÜGE ÜNAL

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Sahne ve Görüntü Sanatlarıİstanbul Aydın Üniversitesi

    Drama ve Oyunculuk Ana Sanat Dalı

    PROF. DR. MEHMET BİRKİYE

    DOÇ. DR. SELEN KORAD BİRKİYE

  5. Lingua-stylistic pecularities of translation from Kyrgyz into English on the basis of K. Akhmatov's novel'Arhat'

    K. Akmatov'un 'Arhat' romanının Kırgızca'dan İngilizceye çevirisinde dilbilimsel ve stilistik özellikler

    AYKEL TAŞTANBAYEVA

    Yüksek Lisans

    Kırgızca

    Kırgızca

    2020

    Mütercim-TercümanlıkKırgızistan-Türkiye Manas Üniversitesi

    Mütercim Tercümanlık Ana Bilim Dalı

    DOÇ. DR. SALTANAT MAMBAYEVA