Person name recognition in Turkish financial texts by using local grammar approach
Türçe finans metinlerinde yerel dilbilgisi yaklaşımı kullanarak kişi ismi tanıma
- Tez No: 201983
- Danışmanlar: DR. TUĞBA TAŞKAYA TEMİZEL, PROF. DR. NAZİFE BAYKAL
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Yerel Dilbilgisi, Varlık ?smi, Varlık ?smi Tanıma, Özel ?sim, Türkçe Rapor Etme Eylemleri, Local Grammar, Named Entity, Named Entity Recognition, Proper Noun, Turkish Reporting Verbs
- Yıl: 2007
- Dil: İngilizce
- Üniversite: Orta Doğu Teknik Üniversitesi
- Enstitü: Enformatik Enstitüsü
- Ana Bilim Dalı: Bilişim Sistemleri Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 161
Özet
Varlık ismi tanıma varlıkların (örneğin, kisi ismi, organizasyon ismi, yer ismi, zaman deyimi, tarih deyimi ve yüzde deyimi) bulunup, anlamsal açıdan sınıflandırılmasıdır. Varlık ismi tanımanın iki temel amacı vardır. Birincisi varlıkların bulunup, tanınmasıdır. ?kinci ise bu varlıkların sınıflandırılmasıdır. Son zamanlarda, yerel dilbilgisi yaklasımı diğer varlık tanıma tekniklerine (örneğin, olasılıksal yaklasım, sembolik yaklasım ve hibrit yaklasım) olan üstünlüğü isaretlenmemis derlemler üzerinde çalısması açısından kanıtlanmıstır. Yerel dilbilgisi yaklasımı varlık tanıma esnasında diğer varlık tanıma sistemlerinin aksine hiç bir genel sözlük, isim, organizasyon yada yer sözlüğüne ihtiyaç duymamaktadır. Sonuç olarak yerel dilbilgisi yaklasımı daha önce görülmemis metinlerde en az maliyet ile varlıkları tanımakta ve sınıflandırmaktadır. Diğer varlık tanıma sistemleri yerel dilbilgisi yaklasımının aksine örüntü olusturmadan önce bazı anlamsal ve yapısal analizlere ihtiyaç duymaktadır. Biz bu tezde isaretlenmemis büyük bir Türkçe finansal haber derleminde daha önce H.N. Traboulsi tarafından Reuters'ın bir finansal haber derlemine denenmis ve basarılı olmus yerel dilbilgisi yaklasımı kullanarak kisi isimlerinin tanınmasında kullanabileceğimiz örüntüleri olusturmaya çalıstık. Kısacası, yerel dilbilgisi yaklasımının sıklık analizi, uygunluk analizi ve esdizimlik analizi kullanarak Türkçe'ye uygulanabilirliğini arastırdık. Bunun yanı sıra, bu tezin önemli bir asamasını olusturan ve daha önce hiç çalısılmamıs Türkçe rapor etme eylemlerinin bir listesinin olusturulmasını da gerçeklestirdik.
Özet (Çeviri)
Named entity recognition (NER) is the task of identifying the named entities (NEs) in the texts and classifying them into semantic categories such as person, organization, and place names and time, date, monetary, and percent expressions. NER has two principal aims: identification of NEs and classification of them into semantic categories. The local grammar (LG) approach has recently been shown to be superior to other NER techniques such as the probabilistic approach, the symbolic approach, and the hybrid approach in terms of being able to work with untagged corpora. The LG approach does not require using any dictionaries and gazetteers, which are lists of proper nouns (PNs) used in NER applications, unlike most of the other NER systems. As a consequence, it is able to recognize NEs in previously unseen texts at minimal costs. Most of the NER systems are costly due to manual rule compilation especially in large tagged corpora. They also require some semantic and syntactic analyses to be applied before pattern generation process, which can be avoided by using the LG approach. In this thesis, we tried to acquire LGs for person names from a large untagged Turkish financial news corpus by using an approach successfully applied to a Reuter?s financial English news corpus recently by H. N. Traboulsi. We explored its applicability to Turkish language by using frequency, collocation, and concordance analyses. In addition, we constructed a list of Turkish reporting verbs. It is an important part of this study because there is no major study about reporting verbs in Turkish.
Benzer Tezler
- Ortak bilgi tabanları kullanarak türkçe metinlerden varlık ismi çıkarımı
Entity extraction from turkish texts using collaborative knowledge bases
DOĞAN KÜÇÜK
Yüksek Lisans
Türkçe
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. NURSAL ARICI
- Financial named entity recognition for turkish news texts
Türkçe haber metinlerinde finansal varlık ismi tanıma
DUYGU DİNÇ
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ALİ HİKMET DOĞRU
PROF. DR. PINAR KARAGÖZ
- La Transformation des Fonctions Sociales et de la Perception de Galerie d'Art comme Lieu d'Interaction et Espace de Consommation: Le Cas Des Galeries d'Art à Istanbul
Bir etkileşim ve tüketim mekanı olarak sanat galerisi algısının ve sosyal işlevlerinin dönüşümü: İstanbul'daki sanat galerileri olgusu
DİCLE KOYLAN
Yüksek Lisans
Fransızca
2013
SosyolojiGalatasaray ÜniversitesiSosyoloji Ana Bilim Dalı
PROF. DR. ALİ ERGUR
- Kredi kartları riskleri ve güvenlik önlemlerinin sigortacılık açısından incelenmesi
Research on the risks of credit cards and security implementations in the view of insurance
AYŞEGÜL BÖLÜKBAŞI