Türkçe bilimsel yayınlar üzerinde birkaç atış ve transfer öğrenme yöntemlerinin değerlendirilmesi
Evaluation of few shot and transfer learning methods on Turkish scientific publications
- Tez No: 807963
- Danışmanlar: DR. ÖĞR. ÜYESİ GÜLŞAH TÜMÜKLÜ ÖZYER
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: Türkçe
- Üniversite: Atatürk Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 92
Özet
Doğal dil işleme insan dilinin makineler tarafından anlamlandırılmasını amaçlayan çalışma alanıdır. Bu amaçla duygu analizi, metin sınıflandırma gibi alt alanlar kullanılarak çıkarımlar yapılmaktadır. Bu çalışmada Türkçe bilimsel yayınlar üzerinde metin sınıflandırma görevi ele alınmıştır. Bu alanda yapılan çalışmalar incelendiğinde sınıflandırma yöntemlerinin çok sayıda etiketli veriye ihtiyaç duyduğu gözlemlenmiştir. Veri etiketlemenin maliyeti ve zorlukları göz önüne alınarak etiketli veri sayısının az olduğu durumlarda çıkarım yapılabilmesi için çözüm olarak birkaç atış öğrenme yöntemi ele alınmış ve bu amaçla TARS modeli kullanılmıştır. Bu çalışmada oluşturulan Türkçe bilimsel yayınlar üzerinde geleneksel yöntemler, birkaç atış öğrenme ve transfer öğrenme yöntemleri kullanılarak başarım değerlendirilmesi yapılmıştır. En yüksek performans bilimsel yayın başlığı ile kategori sınıflandırma görevinde transfer öğrenme yöntemi olan GPT-2 modeli ile elde edilmiştir. Kullanılan sınıf sayısı başarımı etkilemiştir ve disiplin sınıflandırmada kullanılan sınıf sayısının fazla olması model performanslarını düşürmüştür. Az sayıda etiketli veri kullanılarak birkaç atış öğrenme yöntemi ile diğer modellerle karşılaştırılabilir makul sonuçlar elde edilmiştir
Özet (Çeviri)
Natural language processing is the field of study that aims to make sense of human language by machines. For this purpose, inferences are made using sub-fields such as sentiment analysis and text classification. In this study, text classification task on Turkish scientific publications is discussed. When the studies in this field are examined, it is observed that classification methods require many labelled data. Considering the cost and difficulties of data labelling, few shot learning methods were considered as a solution for inference when the number of labelled data is small and TARS model was used for this purpose. In this study, performance evaluation was performed on the Turkish scientific publications created by using traditional methods, few shot learning and transfer learning methods. The highest performance was obtained with the GPT-2 model, which is a transfer learning method, in the category classification task with the title of scientific publication. The number of classes used affected the performance and the high number of classes used in discipline classification decreased the model performances. Reasonable results comparable to other models were obtained with few shot learning methods using a small number of labelled data.
Benzer Tezler
- Tommaso Campanella ve Thomas More'un ütopyalarının karşılaştırılması
Comparing Thomas More and Tommaso Campanella's utopias
MAHMUT AVCI
Yüksek Lisans
Türkçe
2006
FelsefeAtatürk ÜniversitesiFelsefe ve Din Bilimleri Ana Bilim Dalı
YRD. DOÇ. DR. OSMAN ELMALI
- Kitle medyaları ve sanat
Art and mass media
MUKADDER ÇAĞLAR
Sanatta Yeterlik
Türkçe
1998
Güzel SanatlarDokuz Eylül ÜniversitesiResim Ana Sanat Dalı
PROF. DR. ADEM GENÇ
- Bir disiplin olarak sosyal çalışmanın doğuşu ve kurumsallaşması: ABD örneği
The birth and institutionalization of social work as a discipline: The case of USA
ALİ KILIÇASLAN
Yüksek Lisans
Türkçe
2022
Sosyal Hizmetİstanbul ÜniversitesiSosyoloji Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MEHMET ALİ AKYURT
- Yeni Cami'nin akustik açıdan performans değerlendirmesi
Evaluation of the acoustical performance of the New Mosque
EVREN YILDIRIM
Yüksek Lisans
Türkçe
2003
Mimarlıkİstanbul Teknik ÜniversitesiMimarlık Ana Bilim Dalı
PROF. DR. SEVTAP YILMAZ DEMİRKALE
- Los Personajes y los temas en las novelas de unamuno
Başlık çevirisi yok
HALE GÖKNAR
Doktora
İspanyolca
1989
DilbilimAnkara Üniversitesiİspanyol Dili ve Edebiyatı Ana Bilim Dalı
PROF. DR. MUZAFFER ARIKAN