Geri Dön

Türkçe derlemler için sözdizimsel görselleştirme ve sorgulama aracı

Syntactic visualization and query tool for Turkish corpora

  1. Tez No: 432072
  2. Yazar: CEM AGAN
  3. Danışmanlar: DOÇ. DR. BANU DİRİ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Dilbilim, Computer Engineering and Computer Science and Control, Linguistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2016
  8. Dil: Türkçe
  9. Üniversite: Yıldız Teknik Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 61

Özet

Derlemler bir dilin sözdizimsel ve anlambilimsel özelliklerinin keşfedilmesi ve elde edilen bulgulardan birçok araştırma alanında faydalanılması açısından önemli bilgi kaynaklarıdır. Derlemlere elle veya çözümleyici araçlar tarafından eklenen dilbilimsel açıklamalar (biçimbirimsel, sözdizimsel ve anlamsal) bu derlemlerdeki birimler ve bunlar arasındaki ilişkileri ortaya koyar. Derlemler üzerinde araştırma yapılırken bu ilişkilerin takip edilmesini kolaylaştırmak için görselleştirme araçlarına başvurulur. Bunlar iç içe geçmiş olan karmaşık ilişkileri diyagramlar şeklinde özetler. Derlem araştırmalarında faydalanılan bir diğer araç türü ise sorgulama araçlarıdır. Derlem içersinden istenilen sözdizimsel koşulları sağlayan cümle yapılarının çıkartılmasında bu araçlardan faydalanılır. İngilizce ve diğer bazı Batı dillerindeki derlemler için geliştirilmiş bu tür araçlar bulunmasına karşın, Türkçe derlemler için henüz böyle araçlara rastlanamamaktadır. Bu çalışmada Türkçe derlemler için sözdizimsel görselleştirme ve sorgulama imkanı sağlayan bir aracın geliştirilmesi üzerine çalışılmıştır. Bunun için mevcut çözümleyici araçlar kullanılarak bir test derlemi oluşturulmuş ve bu derlemdeki cümleler için sözdizimsel ilişkileri ve cümle yapılarını gösteren diyagramlar üreten bir araç geliştirilmiştir. Daha sonra araç yardımıyla derlemden elde edilen tüm yapılar bir graf veritabanına aktarılmıştır. Araca eklenen bir sorgulama modülü sayesinde isim ve fiil kökünden anahtar sözcükleri içeren öntanımlı cümle yapılarının sorgulanması sağlanmıştır. Ayrıca, graf veritabanının web arayüzü ile daha karmaşık ve detaylı sorguların nasıl yapılabileceği araştırılıp derlem üzerinde örnek sorgular gerçekleştirilmiştir.

Özet (Çeviri)

A corpus is an important source in terms of discovering syntactic and semantic features of a language and making use of these findings in various research areas. Annotations (morphologic, syntactic or semantic) which are added to a corpus manually or by analyzing tools show the relations between units in the corpus. When making research on a corpus, visualization tools are used to ease the following of these relations. These tools summarize the complex relations as diagrams. Another tools used in corpus research are query tools. These are made use of in extraction of sentence structures laying down desired syntactic conditions. Although there are such tools for corpora in English and some other Western Languages, it can not be run across such tools for Turkish corpora. In this work, we worked on developing a tool enabling syntactic visualization and querying for Turkish corpora. To achieve this, we first built a test corpus by the help of current analyzer tools and developed a tool that generates diagrams showing syntactic relations and sentence structures. After, the structures gotten out of the corpora were transferred to a graph database. By the help of a query module added to the tool it's enabled to query predefined sentence structures including noun or verb keywords. Besides we researched on how it can be queried more complex and detailed queries through the web user interface of the graph database and gave some example queries on the corpus.

Benzer Tezler

  1. Learning word representations with deep neural networks for Turkish

    Türkçe için derin sinir ağları ile sözcük gösteriminin öğrenilmesi

    ENES BURAK DÜNDAR

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. AHMET İBRAHİM ETHEM ALPAYDIN

  2. İngilizceden Türkçeye istatiksel bilgisayarlı çeviri sistemlerinde paralel derlem boyutu ve kalitesinin etkileri

    The effect of parallel corpus quality vs size in English to-Turkish statistical machine translation

    ERAY YILDIZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. BANU DİRİ

    YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ

  3. Türkçe sözcük anlam belirsizliği giderme

    Word sense disambiguation for Turkish

    BAHAR İLGEN

    Doktora

    Türkçe

    Türkçe

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. EŞREF ADALI

    YRD. DOÇ. DR. AHMET CÜNEYD TANTUĞ

  4. Derin öğrenme yöntemleri ile Türkçede bağlılık ayrıştırma

    Dependency parsing with deep learning methods in Turkish

    MÜCAHİT ALTINTAŞ

    Doktora

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. AHMET CÜNEYD TANTUĞ

  5. Corpus-driven semantic relations extraction for Turkish language

    Derlem tabanlı anlamsal sözlük oluşturma

    TUĞBA YILDIZ

    Doktora

    İngilizce

    İngilizce

    2014

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. BANU DİRİ