Geri Dön

GPT modelleri kullanılarak ironi tespiti ve sınıflandırması

Irony detection and classification using GPT models

  1. Tez No: 860780
  2. Yazar: MUSTAFA ULVİ AYTEKİN
  3. Danışmanlar: PROF. DR. OSMAN AYHAN ERDEM
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: Türkçe
  9. Üniversite: Gazi Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 74

Özet

Her geçen gün daha da önemli hale gelmeye devam eden bir yapay zeka alanı olan doğal dil işlemeye özellikle son yıllarda geliştirilen ön eğitimli büyük dil modelleriyle katkılar sağlanmaya devam edilmektedir. Görünenden farklı bir anlam barındıran ironik metinlerin tespiti ve sınıflandırılması görevleri, doğal dil işleme alanında daha iyi çözüm aranmaya devam edilmesi gereken görevlerdendir. Son yıllarda geliştirilmiş ve araştırmacıların kullanımına açık durumda olan son Generative Pre-trained Transformer (GPT) modellerinin ironi tespiti ve sınıflandırması görevlerindeki başarısı sıfır denemede öğrenme ve birkaç denemede öğrenme yöntemleri kullanılarak incelenmiştir. Aynı zamanda GPT metin gömme modelleri, başarısı çeşitli çalışmalarla kanıtlanmış metin gömme modeli olan GloVe ile çeşitli makine öğrenmesi ve derin öğrenme metotları kullanılarak karşılaştırılmıştır. Semantic Evaluation 2018 çalıştayı kapsamında hazırlanan SemEval-2018 Task 3 veri kümesinin kullanıldığı bu çalışmada, ironi tespiti görevinde en iyi sonuç text-davinci-003 modelinde birkaç denemede öğrenme yöntemiyle elde edilen %68,9 F1 değeridir. İroni sınıflandırma görevinde ise text-embedding-ada-002 metin gömme modeli Gaussian Naive Bayes (GNB) algoritması ile birlikte kullanıldığında %48,5 F1 değeriyle en iyi sonucu elde etmiştir. Elde edilen bu sonuçlar en başarılı modellerle karşılaştırılabilir derecede başarılı sonuçlar elde etmiştir.

Özet (Çeviri)

Natural language processing (NLP) is an area of artificial intelligence that continues to become increasingly important daily. Scientists have been developing large pre-trained language models in recent years, contributing to the field continuously. Detecting and classifying ironic texts with a different meaning than what is apparent is one of the tasks for which better solutions should be sought in NLP. The success of the latest Generative Pre-trained Transformer (GPT) models, which have been developed in recent years and are available to researchers, in irony detection and classification tasks have been examined using zero-shot learning and few-shot learning methods. In addition, GPT text embedding models were compared with GloVe, a proven text embedding model, using various machine learning and deep learning methods. This study used the SemEval-2018 Task 3 dataset prepared for the Semantic Evaluation 2018 Workshop. The best result in binary classification, which we can also call the irony detection task, is a 68.9% F1 score obtained by the text-davinci-003 model with the few-shot learning method. In the multiclass classification, the text-embedding-ada-002 text embedding model achieved the best result with a 48.5% F1 score when used with the Gaussian Naive Bayes algorithm. Our study revealed successful results comparable to the models that achieved the best results.

Benzer Tezler

  1. Knowledge graph augmented multi-hop question answering using large language models

    Büyük dil modelleri kullanılarak bilgi grafiği destekli çok adımlı soru cevaplama

    BARIŞ DENİZ SAĞLAM

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Enformatik Ana Bilim Dalı

    PROF. DR. ALTAN KOÇYİĞİT

  2. Classification of mobile application reviews using deep language models

    Mobil uygulama değerlendirmelerinin derin dil modelleri kullanılarak sınıflandırılması

    EMRE EREN

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ FATMA BAŞAK AYDEMİR

  3. Bilimsel materyaller için soru- cevap sohbet robotu tasarımı ve uygulaması geliştirilmesi

    Question-answer chatbot design and application development for scientific materials

    HALİL HAKAN SARIÇİÇEK

    Yüksek Lisans

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolAnkara Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. İMAN ASKERBEYLİ

  4. Can ai code like a human: A critical analysis of ai's understanding in code generation

    Yapay zekaların kodlama becerisi insanla rekabet edilir mi? Yapay Zekanın kod üretimindeki anlayışı ve eleştirel bir bakış

    SAMİ AKKUŞ

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolOrta Doğu Teknik Üniversitesi

    Bilişsel Bilim Ana Bilim Dalı

    PROF. DR. HÜSEYİN CEM BOZŞAHİN

  5. Detecting offensive language from social media using word embedding and language models

    Kelime temsil ve dil modelleri kullanarak sosyal medyadan saldırgan dil algılama

    RAGHAD BİRECİKLİ

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolÇukurova Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. SELMA AYŞE ÖZEL