Geri Dön

An Unsupervised approach for automatic language identification

Otomatik dil tanımada gözetimsiz yaklaşım

  1. Tez No: 139373
  2. Yazar: TUBA İSLAM
  3. Danışmanlar: DOÇ. DR. LEVENT ARSLAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2003
  8. Dil: İngilizce
  9. Üniversite: Boğaziçi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 59

Özet

ÖZET OTOMATİK DİL TANIMADA GÖZETİMSİZ YAKLAŞIM Günümüzde insanlara kendi dillerinde hizmet sunabilmek için farklı dillerde iletişim kurabilen sistemlere duyulan gereksinim giderek artmaktadır. Otomatik Dil Tanıma uygulaması çok dilli sistemlerde ön işlem olarak yer almaktadır. Geleneksel sistemlerde modellerin eğitimi öncesinde ses verisi zahmetli ve zaman alıcı bir etiketleme aşamasından geçerek konuşmalardaki fonem şuurları belirlenmektedir. Bu tezde izlenen yöntem etiketlenmiş veritabanına veya dillere ait linguistik bilgiye ihtiyaç duymaksızın geliştirilen otomatik dil tanıma sistemine ait gözetimsiz bir yaklaşım içermektedir. Bu yöntem paralel olarak işleyen iki ayrı daldan oluşmaktadır; dile özgü Gauss karışımlar kullanılarak gerçekleştirilen en yalan komşu karışım seçimi yöntemi ve dile özgü ağ yapılan kullanılarak gerçekleştirilen tek dilde eğitilmiş fonem tanıma yöntemi. Elde edilen sonuçlarla önceki çalışmalar karşılaştırıldığında en kötü durumda başarımın yüzde 24.3 azaldığı, en iyi durumda ise yüzde 13.9 arttığı görülmüştür. Önerilen yöntem kullanılarak kabul edilebilir bir başarıma sahip gürbüz bir dil tanıma sistemi geliştirilmiştir.

Özet (Çeviri)

IV ABSTRACT AN UNSUPERVISED APPROACH FOR AUTOMATIC LANGUAGE IDENTIFICATION Today, the need for multi-language communication applications, which can serve people from different nations in their native languages, has gained an increasing importance. Automatic Language Identification has a significant role in the pre-process phase of multi-language systems. The conventional systems require difficult and time- consuming labeling process of phoneme boundaries of the utterances in the speech corpus. In our work, we propose an unsupervised method in order to built an automatic language identification system that does not require labeled speech database or linguistic information of the target languages. The method comprises two branches processing in parallel; nearest neighbor selection method using language-dependent Gaussian mixtures, and mono-lingual phoneme recognition method using language-dependent network files. The performance of the system is compared with the previous studies and 24.3 per cent of decrease and 13.9 per cent of increase is observed respectively in the worst and best cases. With the proposed method, a robust system with a tolerable performance is built that can easily integrate any language into the LID application.

Benzer Tezler

  1. Türkçe sözcük anlam belirsizliği giderme

    Word sense disambiguation for Turkish

    BAHAR İLGEN

    Doktora

    Türkçe

    Türkçe

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. EŞREF ADALI

    YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ

  2. Corpus-based semantic kernels for supervised and semi-supervised text classification

    Eğiticili ve yarı-eğiticili metin sınıflandırması için derlem tabanlı anlambilimsel çekirdekler

    AYŞE BERNA ALTINEL

    Doktora

    İngilizce

    İngilizce

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. BANU DİRİ

    YRD. DOÇ. DR. MURAT CAN GANİZ

  3. Supervised, semi-supervised and unsupervised methods in discriminative language modeling for automatic speech recognition

    Otomatik konuşma tanıma için ayırıcı dil modellemede gözetimli, yarı-gözetimli ve gözetimsiz yöntemler

    ERİNÇ DİKİCİ

    Doktora

    İngilizce

    İngilizce

    2016

    Elektrik ve Elektronik MühendisliğiBoğaziçi Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MURAT SARAÇLAR

  4. Abstract meaning representation of Turkish

    Türkçenin soyut anlam temsilleri

    KADRİYE ELİF ORAL

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. GÜLŞEN ERYİĞİT

  5. Emotion aware artificial intelligence for cognitive systems

    Bilişsel sistemler için duygu farkındalıklı yapay zeka

    DEĞER AYATA

    Doktora

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. YUSUF YASLAN

    PROF. DR. MUSTAFA ERSEL KAMAŞAK