De Re De Dicto ambiguities in Turkish: Disambiguation by LLMs and processing by humans
Türkçe'de De Re De Dicto muğlaklıklarının dil modelleri tarafından çözümlenmesi ve insanlar tarafından anlaşılması
- Tez No: 839181
- Danışmanlar: DR. ÖĞR. ÜYESİ ÜMİT ATLAMAZ, DR. ÖĞR. ÜYESİ ÖMER FARUK DEMİROK
- Tez Türü: Yüksek Lisans
- Konular: Dilbilim, Linguistics
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: İngilizce
- Üniversite: Boğaziçi Üniversitesi
- Enstitü: Sosyal Bilimler Enstitüsü
- Ana Bilim Dalı: Dilbilim Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 146
Özet
Bu çalışma, Türkçedeki De Re De Dicto muğlaklıklarını farklı açılardan incelemeyi amaçlamaktadır: Biçimsel anlambilim, hesaplamalı dilbilim ve psikodilbilim. Biçimsel anlambilim perspektifinden, De Re De Dicto belirsizliklerinin bileşimsel anlamlarını açıklamayı amaçlayan farklı açıklamaların bir araştırması sağlanmaktadır. Serbest kelime sırası ve isteğe bağlı olarak bilgi yapısıyla etkileşime giren açık olmayan belirteç belirteci ile Türkçe, De Re De Dicto belirsizlikleri için ilginç bir durum teşkil ediyor çünkü bunların çözümü birçok faktöre yakından bağlı: Konuşma bağlamında söylem ve söylem dışı unsurlar, bilgi yapısı , söyleyenin dünya bilgisi ve inanç halleri. Hesaplamalı dilbilim açısından, hızla büyüyen büyük dil modellerinin (LLM'ler) dünya bilgisi ile birlikte sözdizimsel ve morfolojik ipuçlarını tanımadaki yeteneklerini test etmek için doğal dil çıkarımı (NLI) için Türkçe bir meydan okuma veri seti sunulmaktadır. Bu amaçla, 743 cümle üçlüsünün çekirdek verileri manuel olarak oluşturulmuş ve anadili Ingilizce olan kişiler tarafından açıklanmıştır: Bir potansiyel olarak De Re De Dicto belirsiz cümle, bir De Re tefsiri ve bir De Dicto tefsiri. Daha sonra bu tohum verileri, bu görev için özel olarak oluşturulmuş bir doğal dil büyütme algoritması kullanılarak artırıldı. CNLI-TR'nin yoklama yeteneklerini değerlendirmek ve Türkçe için mevcut diğer tek NLI veri seti olan NLI-TR ile karşılaştırmak için bir deney yapılmıştır. Psikolinguistik bakış açısından, De Re'nin bir cümle işleme perspektifinden bileşimsel olarak tutunmasının“daha zor”olduğuna dair teorik iddiaların olup olmadığını araştırmak için kendi hızınızda bir okuma deneyi yapıldı. Belirsizliği giderici bağlamların ardından, katılımcılara De Re De Dicto belirsiz cümleleri gösterildi ve belirsizliği giderici bağlamlara paralel olarak belirli okumaları hedefleyen anlama soruları soruldu. De Re De Dicto belirsiz cümlelerin okuma süresi ve anlama sorularının yanıt süresi, anlamlı ve güvenilir bir işleme farkı olup olmadığını keşfetmek için belirsizliği giderici bağlamlarda karşılaştırıldı.
Özet (Çeviri)
This study aims to investigate De Re De Dicto ambiguities in Turkish from different points of views: Formal semantics, computational linguistics and psycholinguistics. From the formal semantics perspective, a survey of different accounts that aim to explain compositional semantics of De Re De Dicto ambiguities is provided. With free word order and optionally non-overt accusative marker interacting with information structure, Turkish poses an interesting case for De Re De Dicto ambiguities as their resolution is closely tied to many factors: Discourse and non-discourse elements in the conversational context, information structure, world knowledge, and belief states of the utterer. From the computational linguistics perspective, a challenge data set in Turkish for natural language inference (NLI) is offered to test swiftly growing large language models' (LLMs) abilities in recognizing syntactic and morphological cues along with the world knowledge. For this purpose, a seed data of 743 sentence triplets were manually created and annotated by native speakers: One potentially De Re De Dicto ambiguous sentence, one De Re paraphrase and one De Dicto paraphrase. Then this seed data was augmented using a natural language augmentation algorithm specifically created for this task. An experiment was conducted to assess probing abilities of CNLI-TR and compare it with NLI-TR, the only other available NLI data set for Turkish. From the psycholinguistics perspective, a self-paced reading experiment was conducted to investigate whether theoretical claims that De Re is“harder”to compositionally derive hold from a sentence processing perspective. Following disambiguating contexts, participants were shown De Re De Dicto ambiguous sentences and were asked comprehension questions targeting specific readings parallel to disambiguating contexts. Reading time of De Re De Dicto ambiguous sentences and response time of comprehension questions were compared across disambiguating contexts to explore whether there was a significant and credible processing difference.
Benzer Tezler
- Turkish indefinites: Scope and specificity
Türkçe belgisiz isimler: Açı ve belirlilik
ECEM BAYKUŞ
Yüksek Lisans
İngilizce
2022
DilbilimBoğaziçi ÜniversitesiDilbilim Ana Bilim Dalı
DOÇ. DR. ELENA GUERZONI
- Kazak Türklerinin kültüründe keçeden yapılmış yaygılarla ilgili söz varlığı
Vоcabulary оn felt carpets in the culture оf Kazakh peоple
BAYAN NIYETBAYEVA
Yüksek Lisans
Türkçe
2021
Türk Dili ve EdebiyatıArdahan ÜniversitesiTürk Dili ve Edebiyatı Ana Bilim Dalı
PROF. DR. AYABEK BAINIYAZOV
- Dikey dairesel silindirik açık su havuzlarında hidrodinamik kuvvetler
Hydrodynamic forces for vertical axis circular cylinder containing a concertric cylindrical hole in finite depth
MÜKERREM ERTEN(İLKIŞIK)
- Kentsel arkeolojik alanların korunmasına yönelik planlama yaklaşımları: Yenikapı arkeolojik alan yönetim ve yönlendirme rehberi
Urban planning approaches for the conservation of archaeological sites: Yenikapi archaeological site management guide
AYŞE YIKICI
Yüksek Lisans
Türkçe
2010
Şehircilik ve Bölge PlanlamaMimar Sinan Güzel Sanatlar ÜniversitesiŞehir ve Bölge Planlama Ana Bilim Dalı
YRD. DOÇ. DR. DİLEK ERDEN ERBEY