Geri Dön

Automatic knowledge extraction for filling in biography forms from Turkish texts

Türkçe metinlerden biyografi formları doldurmak için otomatik bilgi çıkarımı

  1. Tez No: 342777
  2. Yazar: İLKNUR DEMİRCİ
  3. Danışmanlar: YRD. DOÇ. DR. ZEYNEP ORHAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2009
  8. Dil: İngilizce
  9. Üniversite: Fatih Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 106

Özet

Bu çalışma, Türkçe metinlerden biyografi formları oluşturmak için otomatik bilgi çıkarımı projesinin nasıl yapıldığını anlatmaktadır. Çalışmanın verimini ve sonuçların kalitesini arttırmak için, altı biyografi kategorisi seçilmistir. Bu kategoriler; Cumhurbaşkanları, Devlet adamları, Yazarlar, Şairler, Oyuncular ve Şarkıcılar olmak üzere okuyucular tarafından en sık incelenen biyografi türleridir.Yapılan incelemeler sonucu bu biyografilerde en çok vurgulanan altı tane alan belirlenmiştir. Bu alanlar; Doğum Tarihi. Ölüm tarihi, Eğitim,Tecrübe, Eserler ve Ödüller bilgilerini içermektedir.Belirtilen alanlar için düzenli ifadeler ile kurallar oluşturarak bilgi çıkarımı yapılmıştır. Bu kuralların herbiri belirlenmiş olan alanlar için özel olarak oluşturulup, kuralların Türkçe metinler üzerinde uygulanması ile herbir alan için bilgi çıkarımı yapılmıştır.Çıkarımı yapılan bilginin doğruluğunu ölçmek için özel bir test platformu oluşturulmuştur. Bu platformdan çıkan sonuçlara göre, otomatik biyografi formu oluşturma projesi, özellikle Türkçe ile oluşturulacak formlar için ileri seviyede geliştirilebilir ve gelecek vaadeden bir projedir.

Özet (Çeviri)

This study represents the idea on building an automatic knowledge extraction for filling in biography forms from Turkish Texts. There are six biography categories, chosen to be analysed in this study: Presidents, Politicians, Authors, Poets, Actors, and Singers, which are found to be the most frequently read biography types by the users.Analyzing these biographies led to the observation that the most important emphasis is put on six particular fields; these fields are Date of Birth, Date of Death, Education, Experience, Contributions, and Rewards. Information for the fields to be filled is extracted by creating rules of regular expressions. The rules are tailored according to the structure of desired data blocks. Information is then extracted for each field by running these regular expression rules on Turkish texts.A separate testing platform is designed to evaluate the accuracy of extracted data. Results of the testing platform have shown this study to be a promising process to be further developed especially for Turkish language forms.

Benzer Tezler

  1. Open domain factoid question answering system

    Tek yanıtlı sorular için açık alanlı soru yanıtlama sistemi

    FARHAD SOLEİMANİAN GHAREHCHOPOGH

    Doktora

    İngilizce

    İngilizce

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. İLYAS ÇİÇEKLİ

  2. Uzman sisten ve otomotiv sektöründeki bir uygulama

    Expert system and an application in the automotive sector

    HÜSEYİN BURGUT

    Yüksek Lisans

    Türkçe

    Türkçe

    1999

    Makine Mühendisliğiİstanbul Teknik Üniversitesi

    Makine Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. SERDAR TÜMKOR

  3. Semantic concept recognition from structured and unstructured inputs within cyber security domain

    Siber güvenlik alanında yapısal ve düz metinden anlamsal konsept çıkarımı

    ALP GÖKHAN HOŞSUCU

    Yüksek Lisans

    İngilizce

    İngilizce

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilişim Sistemleri Bölümü

    PROF. DR. NAZİFE BAYKAL

  4. Nesneye dayalı yazılımları servis odaklı modüllere ayrıştırma için öğrenme tabanlı bir yöntem

    A learning-based method for extracting service-oriented modules in object-oriented software

    URAL ERDEMİR

    Doktora

    Türkçe

    Türkçe

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    DOÇ. DR. FEZA BUZLUCA