Geri Dön

Dil modellerinin türkçe dilinde performanslarının iyileştirilmesi için farklı istem formatlarının kullanımı

The use of different prompt formats to improve the performance of language models in the turkish language

  1. Tez No: 955958
  2. Yazar: ERAY NURTEKİN
  3. Danışmanlar: DR. ÖĞR. ÜYESİ EMİR ÖZTÜRK
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: Türkçe
  9. Üniversite: Trakya Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Veri Bilimi ve Analitiği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 60

Özet

Dil modelleri, etkin ince-ayarlama metotları ile herkes tarafından eğitilebilmekte ve özelleştirilerek farklı alanlarda kullanılabilmektedir. Dil modellerinin başarımı için genellikle kayıp veya doğruluk metrikleri kontrol kabul edilse de istem formatlarının seçimi de bu başarımı etkilemektedir. Bu çalışmada Llama2, Llama3 ve Mistral7B gibi büyük dil modellerinin yanı sıra küçük dil modeli olan Phi3 ile farklı iki veriseti üzerinde çeşitli yaygın olarak kullanılan istem formatlarının ve özelleştirilmiş Türkçe istem formatları ile birlikte denenmesi ile eğitilmiş ve başarım sonuçları karşılaştırılmıştır. Elde edilen bulgular ve sonuçlar neticesinde, yalnızca model mimarisinin değil, kullanılan istem formatının yapısının da başarım üzerinde kritik bir rol oynadığını göstermiş ve istem formatının değişikliğinin dil modellerinde performansı etkilediği gözlenmiştir. Bunlarla birlikte özelleştirilmiş istem formatı kabul edilebilir kayıp değerlerinde en iyi metrik sonuçlarını elde etmiştir.

Özet (Çeviri)

Language models can be trained and customized by anyone using effective finetuning methods, making them versatile tools across various domains. While metrics like loss and accuracy are commonly used to assess the performance of language models, the choice of prompt formats also plays a crucial role. In this study, large language models such as Llama2, Llama3 and Mistral7B, as well as the smaller Phi3 model, were trained and evaluated on two different datasets using both commonly used prompt formats and customized Turkish prompt formats. Based on the findings and results obtained, it has been demonstrated that not only the model architecture but also the structure of the prompt format plays a critical role in performance, and that changes in prompt formats can affect the performance of language models. Furthermore, the customized prompt format achieved the best metric results within acceptable loss values.

Benzer Tezler

  1. Türkçe klinik metinlerin derin öğrenme yaklaşımları ile sınıflandırılması

    Classification of Turkish clinical notes using deep learning techniques

    HAZAL TÜRKMEN

    Doktora

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolEge Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. OĞUZ DİKENELLİ

  2. Arapça, Türkçe ve İngilizce dillerindeki e-ticaret verilerinden duygu analizi ile müşteri memnuniyet tespiti

    Prediction of customers' interests with sentiment analysis from e-commerce data in Arabic,Turkish and English

    PINAR SAVCI

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolFırat Üniversitesi

    Yazılım Mühendisliği Ana Bilim Dalı

    DOÇ. DR. BİHTER DAŞ

  3. Türkçe metinlerde duygu analizi yapılarak saldırgan içeriklerin tespit edilmesi

    Detecting offensive content by performing senti̇ment analysis in turkish texts

    ŞEYMA ŞAHİNER YILMAZ

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Bilim ve TeknolojiGazi Üniversitesi

    Yönetim Bilişim Sistemleri Ana Bilim Dalı

    PROF. DR. HADİ GÖKÇEN

    DR. ÖĞR. ÜYESİ İLYAS ÖZER

  4. Performance comparison of large language models for Turkish natural language processing in higher education

    Yükseköğretimde Türkçe doğal dil işleme için büyük dil modellerinin performans karşılaştırması

    EGECAN ÇETİN

    Yüksek Lisans

    İngilizce

    İngilizce

    2025

    Elektrik ve Elektronik Mühendisliğiİzmir Ekonomi Üniversitesi

    Elektrik ve Elektronik Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ AYÇA TOPALLI

  5. Automated response generation for corporate chatbot systems

    Kurumsal chatbot sistemleri için otomatik cevap üretme

    ABDULLAH ŞAMİL GÜSER

    Yüksek Lisans

    İngilizce

    İngilizce

    2020

    BankacılıkBoğaziçi Üniversitesi

    Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. MUSTAFA LEVENT ARSLAN