Geri Dön

Named entity recognition with neural networks and pretrained word embeddings

Sinir ağları ve önceden eğitimli kelime yerleştirmeleri ile adlı varlık tanıma

  1. Tez No: 842680
  2. Yazar: KARTAL ÇAĞLAR GÜRCAN
  3. Danışmanlar: DR. ÖĞR. ÜYESİ SERDAR ARSLAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: İngilizce
  9. Üniversite: Çankaya Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 72

Özet

NER (Adlandırılmış Varlık Tanıma), metin içindeki adlar, yerler ve kuruluşlar gibi temel bilgi öğelerini tanımlayan ve sınıflandıran doğal dil işlemenin kritik bir bileşenidir. Sinir ağları, bu yerleştirmeleri kullanarak, zengin bağlamsal çeşitlilikler içeren anlamlı semantik temsiller aracılığıyla, geniş bir yapılandırılmamış metin yelpazesi içindeki kelimeler arasındaki karmaşık ilişkiler hakkında daha fazla bilgi elde eder. Bu araştırmanın temel amacı, Word2Vec, GloVe, FastText ve BERT gibi son teknoloji sözcük yerleştirme yeteneklerini kullanarak NER sistemlerinin hassasiyetini ve sağlamlığını arttırmaktır. Kelime yerleştirmeler, kelimeleri semantik ve sözdizimsel ortaklıkların yakalandığı yüksek boyutlu bir alana dönüştürdükleri ve makine öğrenimi modellerinin yapılandırılmamış metin girdisini başarılı bir şekilde ele almasına ve analiz etmesine olanak tanıdığı için bu süreçte önemli bir rol oynar. Bu araştırma, bu hedefi gerçekleştirmek için Koşullu Rastgele Alan (CRF) katmanıyla birlikte eklenen çift yönlü uzun kısa süreli bellek (BiLSTM) ağı gibi sıralı etiketleme görevlerinde popüler bir tasarım önermektedir. Bu iki öğenin birleştirilmesi, modelin, yapılandırılmamış metinsel verilerdeki yerel ve küresel bağımlılıkları yakalayarak, kesin varlık tanıma için gerekli bağlamı doğru bir şekilde temsil etmesini sağlar, böylece girdi metni içindeki varlıkların tanımlanmasını ve sınıflandırılmasını değerlendirip geliştirir

Özet (Çeviri)

NER (Named Entity Recognition) is a critical component of natural language processing that identifies and categorizes essential information elements inside text such as names, places, and organizations. Utilizing these embeddings, neural networks obtain a greater knowledge of the complex relationships between words within the vast range of unstructured text, through meaningful semantic representations that include rich contextual variations. The main goal of this research is to increase the precision and robustness of NER systems by utilizing the capabilities of cutting-edge word embeddings, such as Word2Vec, GloVe, FastText, and BERT. Word embeddings play an essential role in this process given that they turn words into a high-dimensional space where semantic and syntactic commonalities are captured, allowing machine learning models to successfully handle and analyze unstructured textual input. This research suggests a popular design in sequence labeling tasks—the Bi-directional Long Short-Term Memory (BiLSTM) network—added with a Conditional Random Field (CRF) layer to accomplish this goal. Combining these two elements enables the model to accurately represent the context necessary for precise entity recognition by capturing local and global dependencies in unstructured textual data, thereby assessing and improving the identification and classification of entities within the input text.

Benzer Tezler

  1. bi-TEZAT: biLSTM yöntemiyle türkçe şikayet metinlerinde zaman ifadelerinin tespit edilmesi

    Bi-TEZAT: extract temporal expressions on turkish complaint texts via biLSTM

    ENSAR EMİRALİ

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. MİNE ELİF KARSLIGİL YAVUZ

  2. Information extraction from radiology reports

    Radyoloji raporlarından bilgi çıkarma

    ABUBAKAR AHMAD ABDULLAHI

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMarmara Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. MURAT CAN GANİZ

  3. Natural language processing applications for cybersecurity

    Siber güvenlik için doğal dil işleme uygulamaları

    AHMET ÇAĞRI SARIYILDIZ

    Yüksek Lisans

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DR. ŞAFAK DURUKAN ODABAŞI

  4. Türkçe'de varlık ismi tanıma

    Named entity recognition in Turkish

    ASIM GÜNEŞ

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. AHMET CÜNEYD TANTUĞ

  5. Named entity recognition in turkish using deep learning methods and joint learning

    Türkçe varlık isimlerinin tanınması için derin öğrenme ve birlikte öğrenme

    ARDA AKDEMİR

    Yüksek Lisans

    İngilizce

    İngilizce

    2018

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. TUNGA GÜNGÖR