Geri Dön

Uzun belge sınıflandırması için transfer öğrenme kullanımı

Using transfer learning for long document classification

  1. Tez No: 779200
  2. Yazar: EYAD ALİSMAİL
  3. Danışmanlar: DR. ÖĞR. ÜYESİ GÜLŞAH TÜMÜKLÜ ÖZYER
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: Türkçe
  9. Üniversite: Atatürk Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 80

Özet

Mevcut metin sınıflandırma algoritmaları genellikle metin uzunluğu açısından sınırlamalara sahiptir ve uzun metinler için zayıf sınıflandırma sonuçları vermektedir. Şimdiye kadar çeşitli makine öğrenmesi ve doğal dil işleme algoritmaları geliştirilmiş ve metin sınıflandırma için birçok algoritmik model önerilmiştir. Ancak sinir ağlarının sınırlı ezberleme ve unutma yeteneğinin yanı sıra uzun metinlerin baş ve son kısımları arasındaki zayıf bağımlılık, uzun metinlerin sınıflandırılmasında mevcut metin işleme yöntemlerinin performansını olumsuz etkilemektedir. Bu problemin çözülmesi için uzun metnin birkaç parçaya kesmesi önerilmiştir. Tez çalışmayla amaç uzun veri setleri derin transfer makine öğrenme yaklaşımlarının performanslarını incelemektir. Uzun metinli ve büyük veri setinin diğer problemi ise, insanlar tarafından büyük veri için kategoriler vermek zordur, çok zaman ve çaba gerektirir. Bu problemin çözülmesi için sıfır atış algoritması önerilmiştir.

Özet (Çeviri)

Existing text classification algorithms often have limitations in terms of text length and give poor classification results for long texts. Various machine learning and natural language processing algorithms have been developed so far, and many algorithmic models have been proposed for text classification. However, the limited memorization and forgetting ability of neural networks, as well as the weak dependency between the beginning and the end parts of long texts, negatively affect the performance of existing text processing methods in the classification of long texts. To solve this problem, it is proposed to cut the long text into several parts. The aim of the study is to examine the performances of deep transfer machine learning approaches on long data sets. The other problem of long text and big data set is that it is difficult for people to give categories for big data, it takes a lot of time and effort. A zero-shot algorithm has been proposed to solve this problem.

Benzer Tezler

  1. Prediction of COVID 19 disease using chest X-ray images based on deep learning

    Derin öğrenmeye dayalı göğüs röntgen görüntüleri kullanarak COVID 19 hastalığının tahmini

    ISMAEL ABDULLAH MOHAMMED AL-RAWE

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. ADEM TEKEREK

  2. Classification of abnormal respiratory sounds using deep learning techniques

    Solunum seslerinin derin öğrenme yöntemleri ile sınıflandırılması

    AHAMADI ABDALLAH IDRISSE

    Yüksek Lisans

    İngilizce

    İngilizce

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilgisayar Bilimleri Ana Bilim Dalı

    DOÇ. DR. OKTAY YILDIZ

  3. Detection of air bubbles from tire sherography images using machine learning and deep learning techniques

    Makina öğrenmesi ve derin öğrenme teknikleri kullanarak, lastik sherografı resimlerinden lastik katmanları arasındaki hava kabarcıklarının tespitinin yapılması

    NAGMY ALI ABDULGANI SALEH

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolKocaeli Üniversitesi

    Mekatronik Mühendisliği Ana Bilim Dalı

    PROF. DR. HÜSEYİN METİN ERTUNÇ

  4. Sınırlı denetim ve anlamsal temsiller ile işaret dili öğrenimi

    Learning sign languages with limited supervision and semantic representations

    YUNUS CAN BİLGE

    Doktora

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. NAZLI İKİZLER CİNBİŞ

  5. Cloud detection and information cloning technique for multi temporal satellite images

    Çok zamanlı uydu görüntüleri için bulut belirleme ve klonlama yöntemi

    KAAN KALKAN

    Doktora

    İngilizce

    İngilizce

    2017

    Jeodezi ve Fotogrametriİstanbul Teknik Üniversitesi

    Geomatik Mühendisliği Ana Bilim Dalı

    PROF. DR. MİTHAT DERYA MAKTAV