Named entity recognition with neural networks and pretrained word embeddings
Sinir ağları ve önceden eğitimli kelime yerleştirmeleri ile adlı varlık tanıma
- Tez No: 842680
- Danışmanlar: DR. ÖĞR. ÜYESİ SERDAR ARSLAN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2023
- Dil: İngilizce
- Üniversite: Çankaya Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 72
Özet
NER (Adlandırılmış Varlık Tanıma), metin içindeki adlar, yerler ve kuruluşlar gibi temel bilgi öğelerini tanımlayan ve sınıflandıran doğal dil işlemenin kritik bir bileşenidir. Sinir ağları, bu yerleştirmeleri kullanarak, zengin bağlamsal çeşitlilikler içeren anlamlı semantik temsiller aracılığıyla, geniş bir yapılandırılmamış metin yelpazesi içindeki kelimeler arasındaki karmaşık ilişkiler hakkında daha fazla bilgi elde eder. Bu araştırmanın temel amacı, Word2Vec, GloVe, FastText ve BERT gibi son teknoloji sözcük yerleştirme yeteneklerini kullanarak NER sistemlerinin hassasiyetini ve sağlamlığını arttırmaktır. Kelime yerleştirmeler, kelimeleri semantik ve sözdizimsel ortaklıkların yakalandığı yüksek boyutlu bir alana dönüştürdükleri ve makine öğrenimi modellerinin yapılandırılmamış metin girdisini başarılı bir şekilde ele almasına ve analiz etmesine olanak tanıdığı için bu süreçte önemli bir rol oynar. Bu araştırma, bu hedefi gerçekleştirmek için Koşullu Rastgele Alan (CRF) katmanıyla birlikte eklenen çift yönlü uzun kısa süreli bellek (BiLSTM) ağı gibi sıralı etiketleme görevlerinde popüler bir tasarım önermektedir. Bu iki öğenin birleştirilmesi, modelin, yapılandırılmamış metinsel verilerdeki yerel ve küresel bağımlılıkları yakalayarak, kesin varlık tanıma için gerekli bağlamı doğru bir şekilde temsil etmesini sağlar, böylece girdi metni içindeki varlıkların tanımlanmasını ve sınıflandırılmasını değerlendirip geliştirir
Özet (Çeviri)
NER (Named Entity Recognition) is a critical component of natural language processing that identifies and categorizes essential information elements inside text such as names, places, and organizations. Utilizing these embeddings, neural networks obtain a greater knowledge of the complex relationships between words within the vast range of unstructured text, through meaningful semantic representations that include rich contextual variations. The main goal of this research is to increase the precision and robustness of NER systems by utilizing the capabilities of cutting-edge word embeddings, such as Word2Vec, GloVe, FastText, and BERT. Word embeddings play an essential role in this process given that they turn words into a high-dimensional space where semantic and syntactic commonalities are captured, allowing machine learning models to successfully handle and analyze unstructured textual input. This research suggests a popular design in sequence labeling tasks—the Bi-directional Long Short-Term Memory (BiLSTM) network—added with a Conditional Random Field (CRF) layer to accomplish this goal. Combining these two elements enables the model to accurately represent the context necessary for precise entity recognition by capturing local and global dependencies in unstructured textual data, thereby assessing and improving the identification and classification of entities within the input text.
Benzer Tezler
- bi-TEZAT: biLSTM yöntemiyle türkçe şikayet metinlerinde zaman ifadelerinin tespit edilmesi
Bi-TEZAT: extract temporal expressions on turkish complaint texts via biLSTM
ENSAR EMİRALİ
Yüksek Lisans
Türkçe
2022
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. MİNE ELİF KARSLIGİL YAVUZ
- Information extraction from radiology reports
Radyoloji raporlarından bilgi çıkarma
ABUBAKAR AHMAD ABDULLAHI
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMarmara ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. MURAT CAN GANİZ
- Natural language processing applications for cybersecurity
Siber güvenlik için doğal dil işleme uygulamaları
AHMET ÇAĞRI SARIYILDIZ
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBahçeşehir ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ŞAFAK DURUKAN ODABAŞI
- Türkçe'de varlık ismi tanıma
Named entity recognition in Turkish
ASIM GÜNEŞ
Yüksek Lisans
Türkçe
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. AHMET CÜNEYD TANTUĞ
- Named entity recognition in turkish using deep learning methods and joint learning
Türkçe varlık isimlerinin tanınması için derin öğrenme ve birlikte öğrenme
ARDA AKDEMİR
Yüksek Lisans
İngilizce
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. TUNGA GÜNGÖR