Computer-aided analysis of english punctuation on a parsed corpus: The special case of comma
İngilizce'de noktalama işaretlerinin cümle yapısına göre notlanmış bir metin veritabanında bilgisayar destekli analizi: Virgülün özel durumu
- Tez No: 47985
- Danışmanlar: PROF.DR. VAROL AKMAN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Bilgisayarlı Dilbilim, Doğal Dil İşleme, Noktalama, İngilizce, Metin-tabanlı Analiz, Virgül. iv, Computational Linguistics, Natural Language Processing, Punctu ation, English, Corpus-based Analysis, Comma. m
- Yıl: 1996
- Dil: İngilizce
- Üniversite: İhsan Doğramacı Bilkent Üniversitesi
- Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Belirtilmemiş.
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 92
Özet
Dilin yazımsal bir öğesi olan noktalama, bilgisayarlı dilbilim alanındaki araş tırmalarda yıllar boyu ihmal edilegelmiştir. Bunun bir nedeni konunun genel zorluğu, diğer bir nedeni de dayanak noktası olabilecek sağlam bir teorinin eksikliğidir. Öte yandan, son yıllarda gerek 'geleneksel' gerekse bilgisayarlı dilbilim alanlarının noktalamaya ilgisi giderek artmıştır; çünkü, noktalama işaretlerini dikkate almadan yazılı dili gerçekten anlayıp işlemenin neredeyse imkansız olduğu ortaya çıkmıştır. Biçim kılavuzları ve genel dilbilgisi kitaplarında verilen kural listeleri dışında noktalama hakkında az bilgiye sahibiz. Bu tür kitaplar noktalama işaretlerinin nasıl kullanılacağına dair bilgiler verirken, bunların uygulamada nasıl kullanıldığı konusunda genelde sessiz kalmaktadırlar. Bu tez, İngilizce'de noktalama uygulamasının, virgülün (noktalama işaretlerinin en önemlisi) özel durumu için, cümle yapısına göre notlanmış bir metin veritabanında incelenmesi amacıyla yapılmış bilgisayar destekli bir deneyin ayrıntılarını içermektedir. Bu deneyde, virgülün değişik kullanımlarını cümlede ortaya çıktığı değişik sözdizimi şablonlarına göre sınıflandırmaya çalıştık. Kullanılan metin veri- tabanı (Penn Treebank) sadece sözdizimi yapısına göre notlanmış cümlelerden oluşup başka hiçbir bilgi içermemekte, bu ise yapısal noktalama işaretlerinin sınıflandırılması için ideal olarak yeterli görünmektedir.
Özet (Çeviri)
Punctuation, an orthographical component of language, has usually been ig nored by most research in computational linguistics over the years. One reason for this is the overall difficulty of the subject, and another is the absence of a good theory. On the other hand, both 'conventional' and computational lin guistics have increased their attention to punctuation in recent years because it has been realized that true understanding and processing of written language will be almost impossible if punctuation marks are not taken into account. Except the lists of rules given in style manuals or usage books, we know little about punctuation. These books give us information about how we should punctuate, but they are generally silent about the actual punctuation practice. This thesis contains the details of a computer-aided experiment to investigate English punctuation practice, for the special case of comma (the most sig nificant punctuation mark) in a parsed corpus. The experiment attempts to classify the various uses of comma according to the syntax-patterns in which comma occurs. The corpus (Penn Treebank) consists of syntactically annotated sentences with no part-of-speech tag information about individual words, and this ideally seems to be enough to classify 'structural' punctuation marks.
Benzer Tezler
- Arama sorguları üzerinde görev tabanlı kümeleme
Task-based clustering on search queries
ALMILA SELCEN AKGÜN
Yüksek Lisans
Türkçe
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ YUSUF YASLAN
- The linguistic problems faced by Turkish scholars in writing for publication
Bilimsel yayın yapma sürecinde Türk akademisyenlerin yaşadığı dilsel sorunlar
BATUHAN SELVİ
Doktora
İngilizce
2021
Eğitim ve ÖğretimGazi ÜniversitesiYabancı Diller Eğitimi Ana Bilim Dalı
PROF. DR. HACER HANDE UYSAL GÜRDAL
- İlkokul öğrencilerinin yazılı anlatım becerileri, yazmaya yönelik tutumları ve yazma kaygıları arasındaki ilişki
The relationship between primary school students' written expression skills, writing attitudes and writing anxiety
SEZGİN TEMEL
Yüksek Lisans
Türkçe
2018
Eğitim ve ÖğretimKırıkkale Üniversitesiİlköğretim Sınıf Öğretmenliği Ana Bilim Dalı
DOÇ. MEHMET KATRANCI
- The effect of teaching writing skills via google docs in a blended learning environment on error correction skills of turkish efl learners
Harmanlanmış öğrenme ortamında google docs yoluyla yazma becerisi öğretiminin yabancı dil olarak ingilizce öğrenen türk öğrencilerin hata düzeltme becerilerine etkisi
BERİL NERGİZ
Yüksek Lisans
İngilizce
2022
Eğitim ve ÖğretimPamukkale ÜniversitesiYabancı Diller Eğitimi Ana Bilim Dalı
DOÇ. DR. ÇAĞLA ATMACA
- Makine öğrenme yöntemleri kullanılarak doğal dil işleme tabanlı şair tanıma
Natural language processing based poet recognition using machine learning methods
SERKAN KORKMAZ
Yüksek Lisans
Türkçe
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolErciyes ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ FEHİM KÖYLÜ