Analysis of SCODE word embeddings based on substitute distributions in supervised tasks
SCODE kelime gömülerinin gözetimli görevlerde incelenmesi
- Tez No: 367642
- Danışmanlar: DOÇ. DR. DENİZ YURET
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2014
- Dil: İngilizce
- Üniversite: Koç Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 46
Özet
Doğal dil işleme ile ilgilenen bilim insanlarının ilgi alanlarından biri de kelimeleri temsil edebilecekleri modeller bulmaktır. Kelime gömüleri her kelimeyi düşük boyutlarda, gerçel değerli, yoğun vektörler olarak gösterir ve en yaygın yöntemlerden biri haline gelmiştir. Kelime gömüleri klasik kategoriksel gösterimlerine yerine bir seçenek olarak görülmektedir. Kelime gömüleri bir kelimenin sözdizimsel ve anlamsal özelliklerini bir vektörün boyutlarında temsil eder. Bu temsillerin Varlık İsmi Tanımlama, Sözdizimsel Analiz gibi gözetimli doğal dil işleme görevlerinde başarılı olduğu gösterilmiştir. Bu çalışmada, bir kelime gömü yöntemini gözetimli doğal dil işleme görevlerinde inceliyorum. Yöntem, kelimeleri bir küre üzerinde temsil eder, öyle ki aynı bağlamda gözlenen kelimeler bu küre üzerinde yakın şekilde konumlandırılır. Bağlamların benzerliği ise o bağlamda gözlenebilecek kelimelerin olasılıksal dağılımları kullanılarak yapılır. Kelime gömülerini Varlık İsmi Tanımlama, Gruplama ve Bağlılık Ayrıştırması görevlerinde karşılaştırdım. İncelediğim yöntem en az diğerleri kadar başarılı ya da onlardan daha başarılı sonuçlar almıştır. Yöntem başarını çok dilli incelemelerde de sürdürmüştür ve Bağlılık Ayrıştırması görevinde bilinen en iyi sonuçları elde etmiştir.
Özet (Çeviri)
One of the interests of the Natural Language Processing (NLP) community is to find representations for lexical items using large amount of unlabeled data. Inducing low-dimensional, continuous, dense word vectors, or word embeddings, have become the principal technique to find representations for words. Word embeddings address the issues of the classical categorical representation of words by capturing syntactic and semantic information of words in the dimensions of a vector. These representations are shown to be successful across NLP tasks including Named Entity Recognition, Part-of-speech Tagging, Parsing, and Semantic Role Labeling. In this work, I analyze a word embedding method in supervised Natural Language Processing (NLP) tasks. The framework maps words on a sphere such that words co-occurring in similar contexts lie closely. The similarity of contexts is measured by the distribution of substitutes that can fill them. I compared word embeddings, including more recent representations, in Named Entity Recognition (NER), Chunking, and Dependency Parsing. I examine the framework in a multilingual setup as well. The results show that the examined method achieves as good as or better results compared to the other word embeddings. The framework is consistent in improving the baseline systems across languages and achieves state-of-the-art results in multilingual dependency parsing.
Benzer Tezler
- Analysis of context embeddings in word sense induction
Bağlam gömülerinin sözcük anlamı tümevarımda incelenmesi
OSMAN BAŞKAYA
Yüksek Lisans
İngilizce
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKoç ÜniversitesiBilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
DOÇ. DR. DENİZ YURET
- bi-TEZAT: biLSTM yöntemiyle türkçe şikayet metinlerinde zaman ifadelerinin tespit edilmesi
Bi-TEZAT: extract temporal expressions on turkish complaint texts via biLSTM
ENSAR EMİRALİ
Yüksek Lisans
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. MİNE ELİF KARSLIGİL YAVUZ
- Türkçe metinlerde farklı temsil modelleri ve öğrenme yöntemleri ile duygu analizi karşılaştırması
Comparison of sentiment analysis with different representation models and learning methods in Turkish texts
KADRİYE MARANGOZ
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBursa Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MUSTAFA ÖZGÜR CİNGİZ
- Kitlesel çevrimiçi ders platformlarında kurslara yapılan yorumların metin madenciliği kullanılarak duygu analizi
Sentiment analysis of comments on courses on massive online course platforms using text mining
RAMAZAN DAŞGIN
Yüksek Lisans
Türkçe
2023
Yönetim Bilişim SistemleriAksaray ÜniversitesiYönetim Bilişim Sistemleri Ana Bilim Dalı
DOÇ. DR. KEMAL ADEM
- Analysis of gender bias in legal texts using natural language processing methods
Hukuki metinlerdeki cinsiyetçi önyargının doğal dil işleme metotlarıyla analizi
NURULLAH SEVİM
Yüksek Lisans
İngilizce
2023
Elektrik ve Elektronik Mühendisliğiİhsan Doğramacı Bilkent ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ AYKUT KOÇ