Geri Dön

Instruction-based fine-tuning of open-source LLMs for predicting customer purchase behaviors

Açık kaynaklı LLM'lerin müşteri satın alma davranışlarını tahmin etmek için talimat bazlı ince ayarı

  1. Tez No: 929398
  2. Yazar: HALİL İBRAHİM ERGÜL
  3. Danışmanlar: PROF. DR. SELİM SAFFET BALCISOY
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2024
  8. Dil: İngilizce
  9. Üniversite: Sabancı Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Veri Bilimi Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 81

Özet

Bu çalışmada, finansal işlem verilerinden tüccar kategorilerini tahmin etmede olasılıklı temel modeller, CNN, LSTM ve ince ayar yapılmış büyük dil modelleri (LLM'ler) dahil olmak üzere çeşitli tahmin modellerinin performansı değerlendirilmiştir. Banka A'dan alınan veri setleri eğitim için, Banka B'den alınan veri setleri ise test için kullanılarak, müşteri verilerinin doğal dil formatına dönüştürülerek eğitildiği ince ayar yapılmış Mistral Instruct modelinin üstün tahmin yetenekleri ortaya konulmuştur. Bu çalışmanın metodolojisi, geniş önceden eğitilmiş bilgi birikimini finansal işlemler alanına uyarlamak için Mistral'ı LoRA (Büyük Dil Modellerinin Düşük Dereceli Adaptasyon Uyarlaması) aracılığıyla talimat ince ayarı yapmayı içermektedir. Mistral modeli, geleneksel sıralı modellerin çok ötesine geçerek, banka işlem verilerindeki üç önemli tüccar kategorisinde—market, giyim ve benzin istasyonları—daha yüksek F1 puanları elde etmiştir, ki bu, hedefli pazarlama kampanyaları için kritik öneme sahiptir. Bu performans, modelin geliştirilmiş semantik yeteneği ve uyarlanabilirliğine bağlanmakta olup, azınlıkta olan kategorileri daha iyi yönetmesini ve daha yüksek doğrulukla tahmin etmesini sağlamaktadır. Bu bulgular, LLM'lerin insan davranışını tahmin etme potansiyelini ve finansal karar alma süreçlerinde devrim yaratma olasılığını vurgulamaktadır.

Özet (Çeviri)

In this study, the performance of various predictive models, including probabilistic baseline, CNN, LSTM, and fine-tuned LLMs, in forecasting merchant categories from financial transaction data have been evaluated. Utilizing datasets from Bank A for training and Bank B for testing, the superior predictive capabilities of the fine-tuned Mistral Instruct model, which was trained using customer data converted into natural language format have been demonstrated. The methodology of this study involves instruction fine-tuning Mistral via LoRA (Low-Rank Adaptation of Large Language Models) to adapt its vast pre-trained knowledge to the specific domain of financial transactions. The Mistral model significantly outperforms traditional sequential models, achieving higher F1 scores in the three key merchant categories of bank transaction data—grocery, clothing, and gas stations— that is crucial for targeted marketing campaigns. This performance is attributed to the model's enhanced semantic understanding and adaptability which enables it to better manage minority classes and predict transaction categories with greater accuracy. These findings highlight the potential of LLMs in predicting human behavior and revolutionizing financial decision-making processes

Benzer Tezler

  1. Uçtan uca derin öğrenme yaklaşımlarıyla Türkçe eşgönderge çözümlemesi

    Neural end to end Turkish coreference resolution

    TUĞBA PAMAY ARSLAN

    Doktora

    Türkçe

    Türkçe

    2025

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. GÜLŞEN ERYİĞİT

  2. Large language models for biomedical relation extraction and explanation

    Biyomedikal metinlerde ilişki çıkarımı ve açıklanması için büyük dil modelleri

    NUR BENGİSU ÇAM

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ARZUCAN ÖZGÜR TÜRKMEN

  3. Türk musikisinde keman eğitimi için bir metod arştırması

    Başlık çevirisi yok

    ZEYNEP BARUT

    Sanatta Yeterlik

    Türkçe

    Türkçe

    1995

    Eğitim ve Öğretimİstanbul Teknik Üniversitesi

    DOÇ. MUTLU TORUN

  4. A support vector machine-based approach for southbound communication detection in SDN using openflow

    Openflow kullanarak SDN'de güney yönlü iletişim tespiti için destek vektör makinesi tabanlı bir yaklaşım

    ALİ GÖKHAN AVRAN

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ GÖKHAN SEÇİNTİ