Geri Dön

An infrastructure model for collecting electronic data to develop large scale corpus

Büyük ölçekli derlem geliştirmek amacıyla elektronik veri toplamak için bir altyapı modeli

  1. Tez No: 276572
  2. Yazar: FATMA KIZILAY
  3. Danışmanlar: PROF. DR. YALÇIN ÇEBİ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2009
  8. Dil: İngilizce
  9. Üniversite: Dokuz Eylül Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 94

Özet

Dokuz Eylül Üniversitesi Bilgisayar Mühendisliği Bölümünde, Doğal Dil İşleme alanında farklı çalışmalar yürütülmektedir. Doğal Dil İşleme çalışmalarında dilin dilbilgisi kuralları belirlenmeli ve derlem olarak adlandırılan metin örnekleri hazırlanmalıdır. Bu örnekler dilin dilbilgisi kurallarını karşılamak zorundadır.Bu çalışmada, büyük ölçekli derlem için altyapı tasarlanmış ve gerçekleştirilmiştir. Gazete, rapor dergi, kitap, meclis tutanağı ve resmi gazete gibi 6 farklı doküman tipini destekleyen bir veri tabanı modeli tasarlanmıştır.Veri tabanı modeline bağlı olarak gerçekleştirilen uygulama ile 5 gazeteden 195256 makale indirilmiştir ve bu dokümanların üst verileri daha sonar yapılacak çalışmalar için depolanmıştır.

Özet (Çeviri)

In the Dokuz Eylül University Computer Engineering Department, different studies on Natural Language Processing (NLP) have been carried out. For NLP research grammatical rules of the language must be determined and a text sample of that language, which is called as corpus, must be prepared. These sample texts should satisfy the grammar rules of language.In this study, an infrastructure for a large scale corpus is designed and implemented. A database model, which supports 6 different document type such as newspaper, report, magazine, book, parliamentary report and official gazette, is designed.By implementing the developed application depending on the database model, 195256 articles were downloaded from 5 newspapers, and their metadata was stored for future use.

Benzer Tezler

  1. Bütünleşik kent bilgi sistemlerine yönelik ulusal konumsal 3 boyutlu veri standartlarının geliştirilmesi

    Development of national spatial 3 dimensional geo-data standards for integrated urban information systems

    SERPİL ATEŞ AYDAR

    Doktora

    Türkçe

    Türkçe

    2023

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    Geomatik Mühendisliği Ana Bilim Dalı

    PROF. DR. TAHSİN YOMRALIOĞLU

  2. Elektriksel adres dağıtımında yeni bir yaklaşım

    A new approach to electrical address distribution

    SEVBAN YENİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Coğrafyaİstanbul Teknik Üniversitesi

    Bilişim Uygulamaları Ana Bilim Dalı

    PROF. DR. DURSUN ZAFER ŞEKER

  3. Bilişim çağında toplu gözetim ve yasal mevzuat düzenlemeleri

    Mass surveillance and legislation arrangements in the information age

    İSMAİL CEM BAKIR

    Yüksek Lisans

    Türkçe

    Türkçe

    2020

    Bilim ve Teknolojiİstanbul Teknik Üniversitesi

    Bilişim Uygulamaları Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ÇİÇEK ERSOY

  4. Türkiye'de su hakkı

    The right to water in Turkey

    YILDIZ AKEL ÜNAL

    Doktora

    Türkçe

    Türkçe

    2021

    HukukGalatasaray Üniversitesi

    Kamu Hukuku Ana Bilim Dalı

    PROF. DR. ERDOĞAN BÜLBÜL

  5. Applications of multi-agent systems in transportation

    Ulaşımda çoklu ajan sistemlerinin uygulamaları

    İLHAN TUNÇ

    Doktora

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Mekatronik Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET TURAN SÖYLEMEZ