Geri Dön

Kelime vektör temsilleriyle cümle üretme

Sentence generation with word vectors

  1. Tez No: 728958
  2. Yazar: SAMET YILMAZ
  3. Danışmanlar: PROF. DR. BAHAR KARAOĞLAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: Türkçe
  9. Üniversite: Ege Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Uluslararası Bilgisayar Ana Bilim Dalı
  12. Bilim Dalı: Bilgi Teknolojileri Bilim Dalı
  13. Sayfa Sayısı: 81

Özet

Metinlerin işlenmesiyle çıkarılan dil modelleri, doğal dilin özelliklerini ve metindeki kelimelerin birbirleriyle olan ilişkilerini içermektedir. Kelime vektörleri de anlamsal olarak özellikler barındıran, kelime uzayındaki gösterimlerdir. Dil modelleri ve kelime vektörlerinin sağladığı bu özellikler sayesinde DDİ'deki problemlere çözüm sağlayan modeller geliştirilebilir. Metin üretimi, DDİ'nin başlıca çalışma alanlarından biridir. Metin üretiminde karşılaşılan bir zorluk ise sıralama işlemidir. Özellikle dil öğretimi ve makine çevirisi çalışmalarında sırasız bir şekilde verilen kelimelerin dizilerek anlamlı, uyumlu bir cümle oluşturması gereklidir. Bu tez çalışmasında da karışık bir şekilde verilen kelimelerin sıralanması üzerine çalışılmıştır. Bunun için iki farklı dil modeli kullanılarak sıralama yapılmıştır. Bir kelimenin, hangi kelime veya kelimelerden sonra gelebileceğine dair olasılıksal değerleri verebilen istatiksel dil modeli ve sinir ağı tabanlı dil modeli bu amaç doğrultusunda çalışmada uygulanmaktadır. Elde edilen bu olasılıksal değerler kullanılarak, ışın araması algoritması ile dizilim yapılmıştır. Her iki modelden elde edilen farklı sonuçlar karşılaştırılmalı olarak verilmiştir.

Özet (Çeviri)

Languages models extracted by proccessing texts include the features of natural language and relations between words. Also, word vectors are space representations that comprise the semantic features. Solutions are created to solve challenges in NLP (Natural Language Processing) thanks to these features provided by language models and word vectors. Text generation is one of the main study fields of NLP. Word ordering is a challenge in text generation. It needs to generate a meaningful and coherent sentence from a given bag of words especially in language teaching and machine translation. The subject of this thesis is word reordering (aka sentence linearization) of given bag of words. Two different language models are used to reorder words. Statistical language model and neural based language model which gives probabilistic values of word sequences are implemented in line with this objective. Beam search is used for ordering task with this probabilistic values. Comparative results from two different models are presented.

Benzer Tezler

  1. From words to sentences: Advancing Turkish emotion analysis through emotion enrichment

    Kelimelerden cümlelere: Duygu zenginleştirme ile Türkçe duygu analizini geliştirme

    HANDE AKA UYMAZ

    Doktora

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİzmir Ekonomi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. SENEM KUMOVA METİN

  2. Fake news classification using machine learning and deep learning approaches

    Makine öğrenimi ve derin öğrenme yaklaşımlarını kullanarak sahte haber sınıflandırması

    SAJA ABDULHALEEM MAHMOOD AL-OBAIDI

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ TUBA ÇAĞLIKANTAR

  3. Derin öğrenme yöntemleri ile zaman serisi tahmini

    Time series classification with deep learning methods

    HAKAN GÜNDÜZ

    Doktora

    Türkçe

    Türkçe

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ZEHRA ÇATALTEPE

  4. Multiword expression detection using word vector representations

    Sözcük temsilleri kullanarak çok sözcüklü ifade tespiti

    TANSU TAŞÇIOĞLU

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİzmir Ekonomi Üniversitesi

    Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı

    DOÇ. DR. SENEM KUMOVA METİN

  5. Effective and explainable mechanisms for natural language interface in databases

    Veritabanlarında doğal dil arayüzü için etkili ve açıklanabilir mekanizmalar

    AKİFHAN KARAKAYALI

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ÖZGÜR ULUSOY