Geri Dön

Computer-aided analysis of english punctuation on a parsed corpus: The special case of comma

İngilizce'de noktalama işaretlerinin cümle yapısına göre notlanmış bir metin veritabanında bilgisayar destekli analizi: Virgülün özel durumu

  1. Tez No: 47985
  2. Yazar: MURAT BAYRAKTAR
  3. Danışmanlar: PROF.DR. VAROL AKMAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Bilgisayarlı Dilbilim, Doğal Dil İşleme, Noktalama, İngilizce, Metin-tabanlı Analiz, Virgül. iv, Computational Linguistics, Natural Language Processing, Punctu ation, English, Corpus-based Analysis, Comma. m
  7. Yıl: 1996
  8. Dil: İngilizce
  9. Üniversite: İhsan Doğramacı Bilkent Üniversitesi
  10. Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Belirtilmemiş.
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 92

Özet

Dilin yazımsal bir öğesi olan noktalama, bilgisayarlı dilbilim alanındaki araş tırmalarda yıllar boyu ihmal edilegelmiştir. Bunun bir nedeni konunun genel zorluğu, diğer bir nedeni de dayanak noktası olabilecek sağlam bir teorinin eksikliğidir. Öte yandan, son yıllarda gerek 'geleneksel' gerekse bilgisayarlı dilbilim alanlarının noktalamaya ilgisi giderek artmıştır; çünkü, noktalama işaretlerini dikkate almadan yazılı dili gerçekten anlayıp işlemenin neredeyse imkansız olduğu ortaya çıkmıştır. Biçim kılavuzları ve genel dilbilgisi kitaplarında verilen kural listeleri dışında noktalama hakkında az bilgiye sahibiz. Bu tür kitaplar noktalama işaretlerinin nasıl kullanılacağına dair bilgiler verirken, bunların uygulamada nasıl kullanıldığı konusunda genelde sessiz kalmaktadırlar. Bu tez, İngilizce'de noktalama uygulamasının, virgülün (noktalama işaretlerinin en önemlisi) özel durumu için, cümle yapısına göre notlanmış bir metin veritabanında incelenmesi amacıyla yapılmış bilgisayar destekli bir deneyin ayrıntılarını içermektedir. Bu deneyde, virgülün değişik kullanımlarını cümlede ortaya çıktığı değişik sözdizimi şablonlarına göre sınıflandırmaya çalıştık. Kullanılan metin veri- tabanı (Penn Treebank) sadece sözdizimi yapısına göre notlanmış cümlelerden oluşup başka hiçbir bilgi içermemekte, bu ise yapısal noktalama işaretlerinin sınıflandırılması için ideal olarak yeterli görünmektedir.

Özet (Çeviri)

Punctuation, an orthographical component of language, has usually been ig nored by most research in computational linguistics over the years. One reason for this is the overall difficulty of the subject, and another is the absence of a good theory. On the other hand, both 'conventional' and computational lin guistics have increased their attention to punctuation in recent years because it has been realized that true understanding and processing of written language will be almost impossible if punctuation marks are not taken into account. Except the lists of rules given in style manuals or usage books, we know little about punctuation. These books give us information about how we should punctuate, but they are generally silent about the actual punctuation practice. This thesis contains the details of a computer-aided experiment to investigate English punctuation practice, for the special case of comma (the most sig nificant punctuation mark) in a parsed corpus. The experiment attempts to classify the various uses of comma according to the syntax-patterns in which comma occurs. The corpus (Penn Treebank) consists of syntactically annotated sentences with no part-of-speech tag information about individual words, and this ideally seems to be enough to classify 'structural' punctuation marks.

Benzer Tezler

  1. Arama sorguları üzerinde görev tabanlı kümeleme

    Task-based clustering on search queries

    ALMILA SELCEN AKGÜN

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ YUSUF YASLAN

  2. The linguistic problems faced by Turkish scholars in writing for publication

    Bilimsel yayın yapma sürecinde Türk akademisyenlerin yaşadığı dilsel sorunlar

    BATUHAN SELVİ

    Doktora

    İngilizce

    İngilizce

    2021

    Eğitim ve ÖğretimGazi Üniversitesi

    Yabancı Diller Eğitimi Ana Bilim Dalı

    PROF. DR. HACER HANDE UYSAL GÜRDAL

  3. İlkokul öğrencilerinin yazılı anlatım becerileri, yazmaya yönelik tutumları ve yazma kaygıları arasındaki ilişki

    The relationship between primary school students' written expression skills, writing attitudes and writing anxiety

    SEZGİN TEMEL

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Eğitim ve ÖğretimKırıkkale Üniversitesi

    İlköğretim Sınıf Öğretmenliği Ana Bilim Dalı

    DOÇ. MEHMET KATRANCI

  4. The effect of teaching writing skills via google docs in a blended learning environment on error correction skills of turkish efl learners

    Harmanlanmış öğrenme ortamında google docs yoluyla yazma becerisi öğretiminin yabancı dil olarak ingilizce öğrenen türk öğrencilerin hata düzeltme becerilerine etkisi

    BERİL NERGİZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Eğitim ve ÖğretimPamukkale Üniversitesi

    Yabancı Diller Eğitimi Ana Bilim Dalı

    DOÇ. DR. ÇAĞLA ATMACA

  5. Makine öğrenme yöntemleri kullanılarak doğal dil işleme tabanlı şair tanıma

    Natural language processing based poet recognition using machine learning methods

    SERKAN KORKMAZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolErciyes Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ FEHİM KÖYLÜ