Geri Dön

Extracting meaningful ınformation from student surveys with NLP

NLP kullanarak öğrenci anketlerinden anlamli bilgiler çikarmak

  1. Tez No: 944069
  2. Yazar: KAJAL POURJALIL
  3. Danışmanlar: YRD. DOÇ. EMİNE EKİN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Mühendislik Bilimleri, Engineering Sciences
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2025
  8. Dil: İngilizce
  9. Üniversite: Işık Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 60

Özet

Bu tez, dönem sonu anketleri aracılığıyla toplanan iki dilli öğrenci geri bildirimlerini analiz etmek ve özetlemek için NLP tekniklerini uyguladı. İngilizce ve Türkçe dillerinde açık uçlu yanıtlar içeren veri kümesi, diller arası dilsel nüansları koruyabilen bir modele ihtiyaç duymuştu. Metin üretimi için özel olarak eğitilmiş Llama 2-7b-hf modeli, tutarlı ve bağlamsal olarak uygun özetler üretebilme yeteneği nedeniyle seçilmişti. Veri ön işleme aşaması, bölüm, dönem, ders adı ve şube numarası gibi üstverileri düzenlemeyi, yorumları kelime sayılarına göre ayırmayı ve gizliliği sağlamak için kişisel kimlik bilgilerini kaldırmayı içermekteydi. On kelimeden kısa yorumlar, Transformers kütüphanesinden bir ardışık düzen kullanılarak gruplandırılıp özetlenirken, daha uzun yorumlar ayrıntılı özetleme için üstveri odaklı istemlerle ince ayar yapılmıştı. Analizi daha da geliştirmek amacıyla,“cardiffnlp/twitter-roberta-base-sentiment”modeli kullanılarak duygu sınıflandırması gerçekleştirilmiş ve geri bildirimler olumsuz, tarafsız ve olumlu olmak üzere üç farklı kategoriye ayrılmıştı. Değerlendirme metrikleri arasında uzman incelemeleri, bağlamsal uygunluk ve veri kümesinin duygu dağılımıyla mantıksal tutarlılık yer almıştı. Önceki modellere kıyasla, Llama 2 modeli, yorumların genel niyetini ve tonunu koruyarak daha eksiksiz ve tutarlı özetler üretmede üstün performans sergilemişti. Sonuç olarak, bu araştırma, LLM'lerin çok dilli eğitim verilerini işlemedeki etkinliğini ve ders içeriğini geliştirmek için uygulanabilir içgörüler sağlamadaki potansiyelini net bir şekilde vurgulamıştı. Bu çalışmanın sonuçları, gelecekteki araştırmalar için de yol gösterici olacaktı.

Özet (Çeviri)

This thesis applied NLP techniques to analyze and summarize bilingual student feedback collected via end-of-semester surveys. The dataset, which contained open-ended responses in both English and Turkish, required a model adept at preserving linguistic nuances across languages. The Llama 2-7b-hf model, which had been trained explicitly for text generation, was selected for its capability to produce coherent and contextually relevant summaries. Data preprocessing involved organizing metadata such as department, semester, course name, and section number, segregating comments by word count, and removing personal identifiers to ensure privacy. Shorter comments (fewer than ten words) were grouped and summarized using a pipeline from the Transformers library, while longer comments were fine-tuned with metadata-specific prompts for detailed summarization. To further enhance analysis, sentiment classification was performed using the“cardiffnlp/twitter-roberta-base-sentiment”model, categorizing feedback into negative, neutral, and positive sentiments. Evaluation metrics included expert reviews, contextual relevance, and logical consistency with the dataset's sentiment distribution. Compared to previous models, the Llama 2 model demonstrated superior performance in generating complete, coherent summaries while preserving the overall intent and tone of the comments. Ultimately, this research highlighted the effectiveness of LLMs in processing multilingual educational data and their potential to provide actionable insights for improving course content and student experiences.

Benzer Tezler

  1. Veri madenciliği ve eğitim sektöründe bir uygulama

    Data mining and an application in educational sector

    ŞENGÜL CAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2017

    İşletmeCelal Bayar Üniversitesi

    İşletme Ana Bilim Dalı

    PROF. DR. CENGİZ YILMAZ

  2. Veri madenciliği ve veri madenciliğinde kullanılan K-Means algoritmasının öğrenci veri tabanında uygulanması

    Data mining and K-Means algorithm in data mining and an application to a student database

    ŞENOL ZAFER ERDOĞAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2004

    İşletmeİstanbul Üniversitesi

    İşletme Ana Bilim Dalı

    YRD. DOÇ. DR. MEHPARE TİMOR

  3. Veri madenciliğinde genetik algoritmalar

    Genetic algorithms in datamining

    ÖZLEM EVRİM GÜNDOĞDU

    Yüksek Lisans

    Türkçe

    Türkçe

    2007

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKocaeli Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. NEVCİHAN DURU

  4. Veritabanları üzerinde veri madenciliği uygulaması

    Data mining application on databases

    HÜSEYİN GÜRÜLER

    Yüksek Lisans

    Türkçe

    Türkçe

    2005

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMuğla Üniversitesi

    İstatistik ve Bilgisayar Bilimleri Ana Bilim Dalı

    DR. MEHMET KARAHASAN

  5. Bilişim alanında öğrenim gören lise öğrencilerine yönelik üniversite tercihlerinin yapay zeka yöntemleri ile analizi

    Analysis of university preferences for high school students studying in informatics with artificial intelligence methods

    ESMA TÜRK

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolTekirdağ Namık Kemal Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ ERKAN ÖZHAN