Geri Dön

Sense distinction using computational methods in Turkish dictionaries

Türkçe sözlüklerde hesaplama metodları kullanarak anlam ayrımı

  1. Tez No: 489403
  2. Yazar: BURAK ERTOPCU
  3. Danışmanlar: PROF. DR. ERCAN SOLAK
  4. Tez Türü: Yüksek Lisans
  5. Konular: Dilbilim, Linguistics
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2017
  8. Dil: İngilizce
  9. Üniversite: Işık Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 47

Özet

Doğal Dil İşleme(NLP) herhangi bir dili bilgisayar bazlı sistemlerle işlemekle ilgili çalışma alanlarının genel ismidir. NLP çalışmalarında, sözcüksel ve anlamsal kaynaklar olarak sözlüklere ihtiyaç duyulmaktadır. Bunun sebebi, bazı durumlarda sözcük ile uygun anlamını eşleştirme gereksinimi bulunmasıdır. Türkçe için;“Güncel Türkçe Sözlük”ve“Kubbealtı Lugatı”gibi elektronik sözlükler bulunmaktadır. Ancak, bu iki sözlük de birçok sözcük için benzer ve çoklanmış sözcük anlamı içermektedir. Türk Dil Kurumu(TDK)'nun Güncel Türkçe Sözlüğü 86.382 adet sözcük içermektedir. Tek bir sözcük için ondan fazla anlam karşılığı bulunabilir. Bu sebeple, hangi anlamların açıklayıcı ve/veya gerekli hangilerinin ise gereksizce çoklanmış olduğunu bulmak oldukça zorlaşabilir. Sözcüklerin anlamıyla ilgili yaşanan bu ayrıştırma problemine“Anlam Ayrımı Problemi”denir. Bu problem, NLP çalışmaları için minimal ve verimli bir sözlük üretmede önemli bir husustur. Özellikle Türkçe için, kelimelerin anlamları içerisinden en aydınlatıcı olanını seçmek pek kolay değildir. Bu çalışmanın amacı, anlam ayrımı kararlarını hesaplamaya dayalı bazı metodlar kullanarak kolaylaştırmaktır. Biz bu çalışmada, en çok bilinen Türkçe Sözlük'lerden ikisinin(Kubbe Altı Lugatı ve TDK Güncel Türkçe Sözlük) üzerinde Levenshtein Mesafe Alogritması, Kosinüs Benzerliği ve Jaccard Benzerliği gibi hesaplamaya dayalı bazı metodlar kullanarak sözcük anlamlarının benzerliklerini analiz etmeye odaklandık.

Özet (Çeviri)

NLP(Natural Language Processing) refers to general name of the study elds related with processing languages by using computer-based systems. In NLP studies, dictionaries are required as lexical and semantic resources. Because in some cases, there are necessities to match the words with their correct senses for all possible words. There are some electronic dictionaries for Turkish such as“Contemporary Turkish Dictionary(CTD)”and“Kubbealtı Turkish Dictionary”. However, both of these two dictionaries cover similar and redundant senses for several words. There are 86.382 words exist in CTD that written by Turkish Linguistic Society( TDK). There can be more than ten senses for a single word in some cases. By that reason, it can be hard to determine which meanings are explanatory and/or required and which of them are multiplexed needlessly. This problem of nding distinguishing senses of the words is called as“Sense Distinction Problem”. The aim of this study is to simplify the sense distinction decisions by using some computational methods. In this study, we focused on to analyse the similarities of word senses by using some computational methods such as; Edit Distance, Cosine Similarity and Jaccard Index Similarity on two well-known Turkish Dictionaries Contemporary Turkish Dictionary (CTD) and Kubbealtı Dictionary (KD).

Benzer Tezler

  1. Hesaplamalı tasarım yaklaşımları: Bütünleşik bir tasarım önerisi

    Computational design approaches: An integrated design proposal

    YEKTA İPEK

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    Mimarlıkİstanbul Teknik Üniversitesi

    Mimarlık Ana Bilim Dalı

    PROF. DR. GÜLEN ÇAĞDAŞ

  2. U-Mut: autolisple bilgisayar destekli uzman-mutfak tasarımı

    U-Mut: a computer aided expert-kitchen design written in autolisp

    MANOLYA KAVAKLI

    Yüksek Lisans

    Türkçe

    Türkçe

    1990

    Mimarlıkİstanbul Teknik Üniversitesi

    PROF.DR. NİGAN BAYAZIT

  3. Açık ocak üretim yöntemi ile üretim yapacak olan bir maden ocağının üretim planlamasının optimizasyonu

    Production scheduling optimisation of an open pit mine

    KÜRŞAT HASÖZDEMİR

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Maden Mühendisliği ve Madencilikİstanbul Teknik Üniversitesi

    Maden Mühendisliği Ana Bilim Dalı

    PROF. DR. SELAMET GÜRBÜZ ERÇELEBİ

  4. Performance evaluation of saliency map methods on remotely sensed RGB images

    Uzaktan algılanmış RGB görüntülerinde dikkat çekerlik haritası metotlarının performans değerlendirmesi

    SELEN SÖNMEZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2016

    CoğrafyaOrta Doğu Teknik Üniversitesi

    Jeodezi ve Coğrafi Bilgi Teknolojileri Ana Bilim Dalı

    PROF. DR. UĞUR HALICI

  5. Topology and bandwidth adaptation in optical WDM backbone networks with dynamic traffic

    Değişken veri trafikli optik WDM omurga ağlarında topoloji ve bant genişliği uyarlama

    AYŞEGÜL GENÇATA

    Doktora

    İngilizce

    İngilizce

    2003

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Kontrol ve Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. MEHMET BÜLENT ÖRENCİK