An Unsupervised approach for automatic language identification
Otomatik dil tanımada gözetimsiz yaklaşım
- Tez No: 139373
- Danışmanlar: DOÇ. DR. LEVENT ARSLAN
- Tez Türü: Yüksek Lisans
- Konular: Elektrik ve Elektronik Mühendisliği, Electrical and Electronics Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2003
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 59
Özet
ÖZET OTOMATİK DİL TANIMADA GÖZETİMSİZ YAKLAŞIM Günümüzde insanlara kendi dillerinde hizmet sunabilmek için farklı dillerde iletişim kurabilen sistemlere duyulan gereksinim giderek artmaktadır. Otomatik Dil Tanıma uygulaması çok dilli sistemlerde ön işlem olarak yer almaktadır. Geleneksel sistemlerde modellerin eğitimi öncesinde ses verisi zahmetli ve zaman alıcı bir etiketleme aşamasından geçerek konuşmalardaki fonem şuurları belirlenmektedir. Bu tezde izlenen yöntem etiketlenmiş veritabanına veya dillere ait linguistik bilgiye ihtiyaç duymaksızın geliştirilen otomatik dil tanıma sistemine ait gözetimsiz bir yaklaşım içermektedir. Bu yöntem paralel olarak işleyen iki ayrı daldan oluşmaktadır; dile özgü Gauss karışımlar kullanılarak gerçekleştirilen en yalan komşu karışım seçimi yöntemi ve dile özgü ağ yapılan kullanılarak gerçekleştirilen tek dilde eğitilmiş fonem tanıma yöntemi. Elde edilen sonuçlarla önceki çalışmalar karşılaştırıldığında en kötü durumda başarımın yüzde 24.3 azaldığı, en iyi durumda ise yüzde 13.9 arttığı görülmüştür. Önerilen yöntem kullanılarak kabul edilebilir bir başarıma sahip gürbüz bir dil tanıma sistemi geliştirilmiştir.
Özet (Çeviri)
IV ABSTRACT AN UNSUPERVISED APPROACH FOR AUTOMATIC LANGUAGE IDENTIFICATION Today, the need for multi-language communication applications, which can serve people from different nations in their native languages, has gained an increasing importance. Automatic Language Identification has a significant role in the pre-process phase of multi-language systems. The conventional systems require difficult and time- consuming labeling process of phoneme boundaries of the utterances in the speech corpus. In our work, we propose an unsupervised method in order to built an automatic language identification system that does not require labeled speech database or linguistic information of the target languages. The method comprises two branches processing in parallel; nearest neighbor selection method using language-dependent Gaussian mixtures, and mono-lingual phoneme recognition method using language-dependent network files. The performance of the system is compared with the previous studies and 24.3 per cent of decrease and 13.9 per cent of increase is observed respectively in the worst and best cases. With the proposed method, a robust system with a tolerable performance is built that can easily integrate any language into the LID application.
Benzer Tezler
- Türkçe sözcük anlam belirsizliği giderme
Word sense disambiguation for Turkish
BAHAR İLGEN
Doktora
Türkçe
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. EŞREF ADALI
YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ
- Corpus-based semantic kernels for supervised and semi-supervised text classification
Eğiticili ve yarı-eğiticili metin sınıflandırması için derlem tabanlı anlambilimsel çekirdekler
AYŞE BERNA ALTINEL
Doktora
İngilizce
2016
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. BANU DİRİ
YRD. DOÇ. DR. MURAT CAN GANİZ
- Supervised, semi-supervised and unsupervised methods in discriminative language modeling for automatic speech recognition
Otomatik konuşma tanıma için ayırıcı dil modellemede gözetimli, yarı-gözetimli ve gözetimsiz yöntemler
ERİNÇ DİKİCİ
Doktora
İngilizce
2016
Elektrik ve Elektronik MühendisliğiBoğaziçi ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. MURAT SARAÇLAR
- Abstract meaning representation of Turkish
Türkçenin soyut anlam temsilleri
KADRİYE ELİF ORAL
Yüksek Lisans
İngilizce
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. GÜLŞEN ERYİĞİT
- Emotion aware artificial intelligence for cognitive systems
Bilişsel sistemler için duygu farkındalıklı yapay zeka
DEĞER AYATA
Doktora
İngilizce
2019
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. YUSUF YASLAN
PROF. DR. MUSTAFA ERSEL KAMAŞAK