İstatistiksel doğal dil işlemede derin öğrenme yöntemleri kullanılarak çevrimiçi Türkçe akademik derlem çözümlenmesi
Analysing Turkish academical corpus using deep learning methods in statistical natural language
- Tez No: 565656
- Danışmanlar: PROF. DR. MEHMET TEKEREK
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2019
- Dil: Türkçe
- Üniversite: Kahramanmaraş Sütçü İmam Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Enformatik Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 62
Özet
Doğal dil, insanları diğer canlılardan ayıran ve insanların iletişim kurmasını sağlayan en temel özelliklerden biridir. Dil, insanın duygu ve düşüncelerini ifade etmede kullandığı ve kültürlerin nesiller boyunca aktarılmasını sağlayan bir araçtır. Günlük hayatta karşılaşılan yazılar ve sesler birer doğal dil örneğidir. Doğal dilde birçok kelime zamanla yok olurken diğer taraftan yeni kelimeler de türetilmektedir. Bu yüzden doğal dil işleme (DDİ) süreci insan için bile karmaşık yapıya sahipken, bilgisayar ortamında işlenmesi de zor olmaktadır. İnsanların dili nasıl kullandığını dil bilim alanı incelemektedir. Dil bilimciler ve bilgisayar bilimcilerinin ortak çalışmasını gerektiren doğal dil işleme çalışmaları, insan bilgisayar etkileşiminde önemli rol oynamaktadır. Doğal dil işleme çalışmaları, yapay zekâ teknolojilerinin, dil bilimi alanında kullanılması ile artmıştır. Yapay zekâ çalışma alanlarından olan derin öğrenme yöntemleri ile doğal dile yakın seviyede platformlar geliştirilmektedir. Dili anlama, makine çevirisi ve sözcük etiketleme için geliştirilen platformlar derin öğrenme yöntemlerinden faydalanmaktadır. Derin öğrenme mimarilerinden olan tekrarlayan sinir ağları (Recurrent Neural Network - RNN), metin veya ses verileri gibi sıralı verileri işlemede tercih edilmektedir. Bu çalışmada bir RNN türü olan iki yönlü uzun-kısa vadeli bellek (Bidirectional Long Short - Term Memory - BLSTM) kullanılarak Türkçe sözcük etiketleme modeli önerilmiştir. Önerilen sözcük etiketleme modeli, doğal dil araştırmacılarına, kendi analizlerini gerçekleştirme ve kullanabilme imkânı verecek bir platform ile sunulmaktadır. İki yönlü LSTM kullanılarak geliştirilen platformun geliştirilme aşamasında uzman görüşü ile geri bildirimler alınarak, sözcük etiketleyicinin hata oranı azaltılmıştır.
Özet (Çeviri)
Natural language is one of the most fundamental features that distinguish people from other living things and enable people to communicate each other. Language is a tool that enables people to express their feelings and thoughts and to transfers cultures through generations. Texts and audio are examples of natural language in daily life. In the natural language, many words disappear in time, on the other hand new words are derived. Therefore, while the process of natural language processing (NLP) is complex even for human, it is difficult to process in computer system. The area of linguistics examines how people use language. NLP, which requires the collaboration of linguists and computer scientists, plays an important role in human computer interaction. Studies in NLP have increased with the use of artificial intelligence technologies in the field of linguistics. With the deep learning methods which are one of the artificial intelligence study areas, platforms close to natural language are being developed. Developed platforms for language comprehension, machine translation and part of speech (POS) tagging benefit from deep learning methods. Recurrent Neural Network (RNN), one of the deep learning architectures, is preferred for processing sequential data such as text or audio data. In this study, Turkish POS tagging model has been proposed by using Bidirectional Long-Short Term Memory (BLSTM) which is an RNN type. The proposed POS tagging model is provided to natural language researchers with a platform that allows them to perform and use their own analysis. In the development phase of the platform developed by using BLSTM, the error rate of the POS tagger has been reduced by taking feedback with expert opinion.
Benzer Tezler
- Türkçe'de varlık ismi tanıma
Named entity recognition in Turkish
ASIM GÜNEŞ
Yüksek Lisans
Türkçe
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. AHMET CÜNEYD TANTUĞ
- Fake news classification using machine learning and deep learning approaches
Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması
SAJA ABDULHALEEM MAHMOOD AL-OBAIDI
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR
- Essays on estimation methods
Tahmin yöntemleri üzerine makaleler
YASİN KÜTÜK
Doktora
İngilizce
2019
Ekonometriİstanbul Teknik Üniversitesiİktisat Ana Bilim Dalı
PROF. DR. BÜLENT GÜLOĞLU
- Automatic generation of scientific terminology with deep learning
Derin öğrenme ile otomatik bilim terimleri sözlüğü oluşturulması
İPEK NUR KARAMAN
Yüksek Lisans
İngilizce
2021
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. İLYAS ÇİÇEKLİ
DR. GÖNENÇ ERCAN
- Çok doymamış yağ asitleri bakımından zengin alg ilave edilen yemlerin levrek (Dicentrarchus albrax L., 1758)'de büyüme performansı ve vücut komposizyonuna etkisi
Effects of pufa (Polyunsaturated fatty acids) enriched algae added diets on growth and body composition of sea bass (Dicentrarchus labrax L., 1758)
KAMİL MERT ERYALÇIN
Yüksek Lisans
Türkçe
2006
Su Ürünleriİstanbul ÜniversitesiSu Ürünleri Yetiştiriciliği Ana Bilim Dalı
PROF. DR. ERDAL ŞENER