Geri Dön

Character-level tagging

Karakter seviyesinde etiketleme

  1. Tez No: 434269
  2. Yazar: ONUR KURU
  3. Danışmanlar: DOÇ. DR. DENİZ YURET
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2016
  8. Dil: İngilizce
  9. Üniversite: Koç Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 60

Özet

Bu tezde dilden bağımsız, karakter seviyesinde etiketleme yapan bir model tarif et- tim ve bu modeli Varlık İsmi Tanıma, Sözcük Türü Etiketleme ve Yüzeysel Çözümleme üzerinde değerlendirdim. Bu modelde bir cümle, kelimeler yerine karakter dizisi olarak temsil edildi. Model, karakterleri girdi olarak alan ve her karakter için etiket olasılık dağılımı üreten, üst üste yığılmış çift yönlü Geri Dönüşümlü Yapay Sinir Ağları'ndan oluşmaktadır. Daha sonra bu olasılık dağılımları, Viterbi algoritması kullanılarak kelime seviyesindeki etiketlere çevirildi. Model, sadece işaretli veri kümesi kullan- makta olup, elle belirlenmiş öznitekliklere ve harici kaynaklardan gelen bilgilere (diğer sözdizimsel işaretleyicilerin çıktısı, isim listeleri) ihtiyaç duymamaktadır. Bu tezde tarif edilen model, Varlık İsmi Tanima'da 7 dilde elde edilen en iyi sonuçlara yakın, Sözcük Türü Etiketleme'de 4 dilde geçmiş sistemlerden daha iyi ve İngilizce Yüzeysel Çözümleme'de rekabetçi sonuçlar vermiştir.

Özet (Çeviri)

I describe and evaluate a language-independent character-level tagger for sequence labeling problems: Named Entity Recognition (NER), Part-of-Speech (POS) tagging and Chunking. Instead of words, a sentence is represented as a sequence of charac- ters. The model consists of stacked bidirectional LSTMs which input characters and output tag probabilities for each character. These probabilities are then converted to consistent word level phrase tags using a Viterbi decoder. The model uses only labeled data and does not rely on hand-engineered features or other external resources like syntactic taggers or Gazetteers. The model is able to achieve close to state-of-the-art NER performance in seven languages, performs as well as or better than previous work in four languages for POS tagging and yields competitive results for English Chunking dataset.

Benzer Tezler

  1. Identification of verbal multiword expressions using deep learning architectures and representation learning methods

    Çok sözcüklü fiil ifadelerinin derin öğrenme mimarileri ve gösterim öğrenme metotları ile saptanması

    BERNA ERDEN

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolBoğaziçi Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. TUNGA GÜNGÖR

  2. İş ve Sosyal Güvenlik Hukuku bakımından dijital platform çalışanlarının hukuki statüsü

    Legal status of digital platform workers in terms of Labour and Social Security Law

    HAZAL TOLU YILMAZ

    Doktora

    Türkçe

    Türkçe

    2022

    HukukGalatasaray Üniversitesi

    Özel Hukuk Ana Bilim Dalı

    PROF. DR. ENVER MURAT ENGİN

  3. Character-level dilated deep neural networks for web attack detection

    Ağ yöresi saldırılarının belirlenmesi için karakter düzeyinde seyreltilmiş derin sinir ağları

    NAZANIN MOARREF

    Doktora

    İngilizce

    İngilizce

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. MEHMET TAHİR SANDIKKAYA

  4. Read mapping methods optimized for multiple gpgpus

    Çoklu gpgpu sistemleri için eniyilenmiş dizi hizalama yöntemleri

    AZITA NOURI

    Yüksek Lisans

    İngilizce

    İngilizce

    2016

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİhsan Doğramacı Bilkent Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    YRD. DOÇ. DR. CAN ALKAN

  5. An attention based deep neural network architecture for identification of phishing URLS through character level n-gram embeddings

    Kimlik avcısı URL tespitinde karakter n-gram düzeyinde özyerleşiklerden yararlanan dikkate dayalı bir derin sinir ağı mimarisi

    FIRAT COŞKUN DALGIÇ

    Yüksek Lisans

    İngilizce

    İngilizce

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolHacettepe Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. MURAT AYDOS

    DOÇ. DR. AHMET SELMAN BOZKIR