Geri Dön

Utilizing coarse-grained data in low-data settings for event extraction

Olay bilgisi çıkarma sistemleri için az veri senaryosunda az detaylı veri kullanmak

  1. Tez No: 728326
  2. Yazar: OSMAN MUTLU
  3. Danışmanlar: PROF. DR. DENİZ YURET, DR. ÖĞR. ÜYESİ ALİ HÜRRİYETOĞLU
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: İngilizce
  9. Üniversite: Koç Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 45

Özet

Olay bilgisi çıkarma sistemleri için metin verisi işaretlemesi yapmak hem zor, hem pahalı, hem de hata yapmaya oldukça açıktır. Bu tezde, yeni detaylı işaretleme yapmak yerine, çok daha kolay şekilde elde edilebilen daha az detaylı (döküman ve cümle etiketlemesi) veri kullanmanın fizibilitesini ölçüyoruz. Döküman ve cümle etiketlerini kullanmak için çok amaçlı modelimizi, ana işimiz olan kelime sınıflandırmasının yanında döküman ve cümle ikili sınıflandırması yan işleri ile eğitiyoruz. Bu amaçta, değişen veri rejimleri içeren birtakım deneyler icra ediyoruz. Deneylerin sonuçları bu eklenen daha az detaylı verinin daha iyi performans ve stabiliteye yol açtığını gösterirken, aynı zamanda orijinal veriye sadece içinde hiçbir şekilde olay bilgisi bulundurmayan negatif dökümanlar eklemenin göz ardı edilemeyecek katkısını da gözler önüne seriyor.

Özet (Çeviri)

Annotating text data for event information extraction systems is hard, expensive, and error-prone. We investigate the feasibility of integrating coarse-grained data (document or sentence labels), which is far more feasible to obtain, instead of annotating more documents. We utilize a multi-task model with two auxiliary tasks, document and sentence binary classification, in addition to the main task of token classification. We perform a series of experiments with varying data regimes for the aforementioned integration. Results show that while introducing extra coarse-grained data offers greater improvement and robustness, a gain is still possible with only the addition of negative documents that have no information on any event.

Benzer Tezler

  1. Ilgın (Konya) kuzeyindeki yüksek potasyumlu metamorfik kayaçların jeolojik ve petrolojik incelemesi

    Geological and petrological investigation of high-K metamorphic rocks in the north of Ilgin (Konya)

    ŞENEL ÖZDAMAR

    Doktora

    Türkçe

    Türkçe

    2008

    Jeoloji Mühendisliğiİstanbul Teknik Üniversitesi

    Jeoloji Mühendisliği Ana Bilim Dalı

    PROF. DR. BEKTAŞ UZ

    PROF. DR. FAHRİ ESENLİ

  2. Depremler sırasında zeminlerin davranışına bağlı olarak meydana gelen zemin deplasmanlarının belirlenmesi

    Determination of soil displacements depending on the soil behaviour during earthquakes

    ZÜLKÜF KAYA

    Doktora

    Türkçe

    Türkçe

    2008

    İnşaat Mühendisliğiİstanbul Teknik Üniversitesi

    İnşaat Mühendisliği Bölümü

    PROF. DR. AYFER ERKEN

  3. Basınçlı döküm yöntemiyle üretimde OTHEA ve HAA teknikleri uygulaması ile ürün ve proses optimizasyonu

    Ooptimising product and process by fmea and fta techniques on die casting production

    BURAK PULATKAN

    Yüksek Lisans

    Türkçe

    Türkçe

    1997

    Metalurji Mühendisliğiİstanbul Teknik Üniversitesi

    Metalurji Mühendisliği Ana Bilim Dalı

    PROF. DR. YILMAZ TAPTIK

  4. Uzaktan eğitim uygulamalarında tam öğrenme modelinin öğrencilerin başarı ve tutumlarına etkisi

    The effect of mastery learning designed for distance education on students' success and attitude

    MUSTAFA ERSOY

    Doktora

    Türkçe

    Türkçe

    2014

    Eğitim ve Öğretimİnönü Üniversitesi

    Eğitim Bilimleri Ana Bilim Dalı

    YRD. DOÇ. DR. EYÜP İZCİ