Geri Dön

Prosodic, morphological and lexical feature extraction of Turkish broadcast news data

Türkçe haber verisinden bürünsel, biçimsel ve sözcüksel özelliklerin çıkarımı

  1. Tez No: 361002
  2. Yazar: İZEL D. REVİDİ
  3. Danışmanlar: DOÇ. DR. ÜMİT GÜZ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2014
  8. Dil: İngilizce
  9. Üniversite: Işık Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Elektronik Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 129

Özet

Cümle bölütlemesi otomatik konuşma tanıma sisteminden çıkan sözcüklerin içeriğini zenginleştirmeyi hedefleyen sürecin bir parçasıdır. Cümle bölütlemesi, gelen kelime akışının bütün bir cümle olarak tanımlanması görevini üstlenir ve konuşma anlamının çıkarılması sürecinin bir önceki aşamasını oluşturur. Cümle sınırlarının bulunması ile birlikte cümle üzerinde sözdizimi ve/veya anlamsal analiz yapılabilmektedir. Genellikle otomatik konuşma tanıma sisteminden alınan çıktılarda başlık, paragraf, noktalama, büyük/küçük harf gibi bilgileri içeren metin işaretleri yer almamaktadır. Ancak konuşma hali hazırda enerji, duraklama bilgisi, kelimenin geçiş süresi gibi bürünsel özellikleri; kelimenin yüklem, isim veya sıfat olması gibi biçimsel özellikleri ve sözcüksel özellikleri barındırmaktadır. Bu bürünsel, biçimsel ve sözcüksel özellikler cümle bölütlemesinin yapılabilmesi için tamamlayıcı bir bilgi sağlamaktadır. Yapılan çalışmadaki amacımız daha önceki çalışmalarda yapılmış bürünsel özelliklerin çıkarımı ve kullanımına ek olarak; biçimsel ve sözcüksel özellikler açık kaynak kodlu araçlar ile Türkçe Konuşma Dili üzerinde çıkarımı ve kullanımıdır.

Özet (Çeviri)

Sentence segmentation from speech is part of a process that aims at enriching the unstructured stream of words that are the output of standard speech recognizers. Its role is to find the sentence units in this stream of words. Sentence segmentation is a preliminary step toward speech understanding. Once the sentence boundaries are detected, further syntactic and/or semantic analysis can be performed on these sentences. Usually, speech recognizer output lacks the textual cues to these entities (such as headers, paragraphs, sentence punctuation, and capitalization). However, speech provides extra non-lexical cues, related to features like pitch, energy, pause and word durations as prosodic features; verb, noun or adjective as a morphological features and also lexical features. These prosodic, morphological and lexical features are provides a complementary information for segmentation of speech into sentences. Our goal is examine feature the extraction and use of prosodic information which has been done in previous works, in addition to lexical features and morphological for spoken language processing of Turkish with open source tools.

Benzer Tezler

  1. Co-training using prosodic, lexical and morphological information for automatic sentence segmentation of Turkish spoken language

    Bürünsel, sözcüksel ve biçimbilgisel bilgiyi kullanan eş-eğitim ile Türkçe konuşma dilinin otomatik cümle bölütlemesi

    DOĞAN DALVA

    Doktora

    İngilizce

    İngilizce

    2018

    Elektrik ve Elektronik MühendisliğiIşık Üniversitesi

    Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ÜMİT GÜZ

    DOÇ. DR. HAKAN GÜRKAN

  2. Scrambling and information structure in Turkish

    Başlık çevirisi yok

    KÜBRANUR TOPLAR

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    DilbilimSyracuse University
  3. Clitic/affix interactions a corpus-based study of person marking in the mukri variety of central kurdish

    Klitik - ek etkileşimleri orta kürtçe'nin mukri ağzında kişi işaretleme üzerine derlem tabanlı bir çalışma

    ERGİN ÖPENGİN

    Doktora

    İngilizce

    İngilizce

    2013

    DilbilimUniversité Sorbonne Nouvelle (Paris III)

    Dilbilim Ana Bilim Dalı

    PROF. DR. FRANCOİSE JACQUESSON

    PROF. DR. GEOFFREY HAİG

  4. Prosodic domains and the syntax-prosody mapping in Turkish

    Türkçe'de ezgi birimleri ve sözdizim-ezgi eşleşmesi

    SEDA KAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2009

    DilbilimBoğaziçi Üniversitesi

    Dilbilim Ana Bilim Dalı

    YRD. DOÇ. DR. MELTEM KELEPİR-WOOD