Solving Turkish math word problems by sequence-to-sequence encoder-decoder models
Türkçe matematik problemlerini kodlayıcı-kod çözücü dizi-dizi modelleriyle çözme
- Tez No: 761306
- Danışmanlar: PROF. DR. TUNGA GÜNGÖR
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 84
Özet
Matematiksel kelime problemlerini (MWP) çözmenin, doğal dil metinleri ve matematiksel denklemler arasındaki anlamsal boşluk nedeniyle zorlu bir görev olduğu söylenebilir. Görevin temel amacı, yazılı bir matematik problemini girdi olarak almak ve bu problemi çözmek için çıktı olarak uygun bir denklem üretmektir. Bu tez, metindeki semantik anlamlarına dayalı olarak MWP'leri otomatik olarak çözmek için diziden diziye (seq2seq) bir sinir modelini açıklamaktadır. Seq2seq modeli, eğitim verilerinde mevcut olmayan denklemleri üretebilme avantajına sahiptir. Giriş sırasını kodlamak ve problem semantiğini kavramak için çift yönlü bir kodlayıcı ve çıkış sembollerinin semantik anlamlarını izlemeye ve denklemi çıkarmaya yarayan bir kod çözücü içerir. Bu tezde, geçitli tekrarlayan birimler (GRU) ve uzun-kısa vadeli bellek (LSTM) seq2seq modelleri dahil olmak üzere, önceden eğitilmiş çeşitli dil modelleri ve nöral modellerin başarılarını araştırıyoruz. Araştırmamız, önceden eğitilmiş dil modellerini ve nöral modelleri kullanan bu doğal dil işleme (NLP) görevi hakkında Türkçe'de herhangi bir çalışma olmaması açısından yenidir. MWP görevi için nöral modelleri uygulamak için tasarlanmış bir Türkçe veri seti de bulunmamaktadır. Veri eksikliğinden dolayı, iyi bilinen İngilizce MWP veri setlerini makine çeviri sistemi kullanarak Türkçe'ye çevirdik. Literatüre katkı sağlamak için manuel ayarlamalar yaptık ve bir derlem oluşturduk. Türkçe sondan eklemeli ve gramer açısından üzerinde çalışılması zor bir dil olmasına rağmen, sistemimiz derlemdeki soruların %71'ini doğru yanıtlar.
Özet (Çeviri)
It can be argued that solving math word problems (MWP) is a challenging task due to the semantic gap between natural language texts and mathematical equations. The main purpose of the task is to take a written math problem as input and produce a proper equation as output for solving that problem. This thesis describes a sequence-to-sequence (seq2seq) neural model for automatically solving MWPs based on their semantic meanings in the text. The seq2seq model has the advantage of being able to generate equations that do not exist in the training data. It comprises a bidirectional encoder to encode the input sequence and comprehend the problem semantics, and a decoder with attention to track semantic meanings of the output symbols and extract the equation. In this thesis, we investigate the successes of several pre-trained language models and neural models, including gated recurrent units (GRU) and long short-term memory (LSTM) seq2seq models. Our research is novel in the sense that there exist no studies in Turkish on this natural language processing (NLP) task that utilize the pre-trained language models and neural models. There is also no Turkish dataset designed to implement the neural models for MWP task. Due to the lack of data, we translated the well-known English MWP datasets into Turkish using a machine translation system. We performed manual adjustments, and built the corpora to contribute to the literature. Although Turkish is an agglutinative and grammatically challenging language to work on, our system correctly answers 71% of the questions in the corpora.
Benzer Tezler
- Öğrenme güçlüğü olan öğrenciler ile düşük ve ortalama başarılı olan öğrencilerin matematik problemi çözerken kullandıkları bilişsel stratejiler ile üstbilişsel işlevler arasındaki ilişkilerin incelenmesi
An examination of the relationships between cognitive strategies and metacognitive functions used during mathematical problem solving by the students with learning disabilities, low achieving, and average achieving
UFUK ÖZKUBAT
Doktora
Türkçe
2019
Eğitim ve ÖğretimGazi ÜniversitesiÖzel Eğitim Ana Bilim Dalı
PROF. DR. EMİNE RÜYA ÖZMEN
- Cisim genişlemeleri ve origami çizimleri
Field extensions and origami constructions
BURCU ŞANSAN
Yüksek Lisans
Türkçe
2019
Matematikİstanbul Teknik ÜniversitesiMatematik Mühendisliği Ana Bilim Dalı
DOÇ. DR. ERGÜN YARANERİ
- Matematik öğretiminde, bilgisayar ve teknolojinin kullanımı üzerine bir inceleme
An Investigation about the usage of technology and computer in mathematics education
SEMRA ERTEM
Yüksek Lisans
Türkçe
1999
Eğitim ve ÖğretimDokuz Eylül ÜniversitesiEğitim Bilimleri Ana Bilim Dalı
PROF. DR. HÜSEYİN ALKAN
- Vatandaşlık yeterlikleri bağlamında ortaokul ekonomi okuryazarlığı standartlarının belirlenmesi ve öğretim programlarındaki yerinin incelenmesi
Determination of the middle school economic literacy standards in the context of citizenship competencies and investigation of the place of these standards in curricula
GÜLTEN YILDIRIM
- Üç boyutlu modellemede ışın izleme yöntemi
Başlık çevirisi yok
KEMAL YÜKSEK
Yüksek Lisans
Türkçe
1994
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiDOÇ.DR. FÜSUN TUNALI