Automatic knowledge extraction for filling in biography forms from Turkish texts
Türkçe metinlerden biyografi formları doldurmak için otomatik bilgi çıkarımı
- Tez No: 342777
- Danışmanlar: YRD. DOÇ. DR. ZEYNEP ORHAN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2009
- Dil: İngilizce
- Üniversite: Fatih Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 106
Özet
Bu çalışma, Türkçe metinlerden biyografi formları oluşturmak için otomatik bilgi çıkarımı projesinin nasıl yapıldığını anlatmaktadır. Çalışmanın verimini ve sonuçların kalitesini arttırmak için, altı biyografi kategorisi seçilmistir. Bu kategoriler; Cumhurbaşkanları, Devlet adamları, Yazarlar, Şairler, Oyuncular ve Şarkıcılar olmak üzere okuyucular tarafından en sık incelenen biyografi türleridir.Yapılan incelemeler sonucu bu biyografilerde en çok vurgulanan altı tane alan belirlenmiştir. Bu alanlar; Doğum Tarihi. Ölüm tarihi, Eğitim,Tecrübe, Eserler ve Ödüller bilgilerini içermektedir.Belirtilen alanlar için düzenli ifadeler ile kurallar oluşturarak bilgi çıkarımı yapılmıştır. Bu kuralların herbiri belirlenmiş olan alanlar için özel olarak oluşturulup, kuralların Türkçe metinler üzerinde uygulanması ile herbir alan için bilgi çıkarımı yapılmıştır.Çıkarımı yapılan bilginin doğruluğunu ölçmek için özel bir test platformu oluşturulmuştur. Bu platformdan çıkan sonuçlara göre, otomatik biyografi formu oluşturma projesi, özellikle Türkçe ile oluşturulacak formlar için ileri seviyede geliştirilebilir ve gelecek vaadeden bir projedir.
Özet (Çeviri)
This study represents the idea on building an automatic knowledge extraction for filling in biography forms from Turkish Texts. There are six biography categories, chosen to be analysed in this study: Presidents, Politicians, Authors, Poets, Actors, and Singers, which are found to be the most frequently read biography types by the users.Analyzing these biographies led to the observation that the most important emphasis is put on six particular fields; these fields are Date of Birth, Date of Death, Education, Experience, Contributions, and Rewards. Information for the fields to be filled is extracted by creating rules of regular expressions. The rules are tailored according to the structure of desired data blocks. Information is then extracted for each field by running these regular expression rules on Turkish texts.A separate testing platform is designed to evaluate the accuracy of extracted data. Results of the testing platform have shown this study to be a promising process to be further developed especially for Turkish language forms.
Benzer Tezler
- Open domain factoid question answering system
Tek yanıtlı sorular için açık alanlı soru yanıtlama sistemi
FARHAD SOLEİMANİAN GHAREHCHOPOGH
Doktora
İngilizce
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. İLYAS ÇİÇEKLİ
- Parça yerleştirme algoritmalarının postal oluşturma problemine uygulanması
Başlık çevirisi yok
FİLİZ BUNYAK
Yüksek Lisans
Türkçe
1996
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiDOÇ.DR. FÜSUN TUNALI (SEÇUK)
- Uzman sisten ve otomotiv sektöründeki bir uygulama
Expert system and an application in the automotive sector
HÜSEYİN BURGUT
Yüksek Lisans
Türkçe
1999
Makine Mühendisliğiİstanbul Teknik ÜniversitesiMakine Mühendisliği Ana Bilim Dalı
YRD. DOÇ. DR. SERDAR TÜMKOR
- Semantic concept recognition from structured and unstructured inputs within cyber security domain
Siber güvenlik alanında yapısal ve düz metinden anlamsal konsept çıkarımı
ALP GÖKHAN HOŞSUCU
Yüksek Lisans
İngilizce
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik ÜniversitesiBilişim Sistemleri Bölümü
PROF. DR. NAZİFE BAYKAL
- Nesneye dayalı yazılımları servis odaklı modüllere ayrıştırma için öğrenme tabanlı bir yöntem
A learning-based method for extracting service-oriented modules in object-oriented software
URAL ERDEMİR
Doktora
Türkçe
2014
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Bilimleri Ana Bilim Dalı
DOÇ. DR. FEZA BUZLUCA