Utilizing coarse-grained data in low-data settings for event extraction
Olay bilgisi çıkarma sistemleri için az veri senaryosunda az detaylı veri kullanmak
- Tez No: 728326
- Danışmanlar: PROF. DR. DENİZ YURET, DR. ÖĞR. ÜYESİ ALİ HÜRRİYETOĞLU
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: İngilizce
- Üniversite: Koç Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 45
Özet
Olay bilgisi çıkarma sistemleri için metin verisi işaretlemesi yapmak hem zor, hem pahalı, hem de hata yapmaya oldukça açıktır. Bu tezde, yeni detaylı işaretleme yapmak yerine, çok daha kolay şekilde elde edilebilen daha az detaylı (döküman ve cümle etiketlemesi) veri kullanmanın fizibilitesini ölçüyoruz. Döküman ve cümle etiketlerini kullanmak için çok amaçlı modelimizi, ana işimiz olan kelime sınıflandırmasının yanında döküman ve cümle ikili sınıflandırması yan işleri ile eğitiyoruz. Bu amaçta, değişen veri rejimleri içeren birtakım deneyler icra ediyoruz. Deneylerin sonuçları bu eklenen daha az detaylı verinin daha iyi performans ve stabiliteye yol açtığını gösterirken, aynı zamanda orijinal veriye sadece içinde hiçbir şekilde olay bilgisi bulundurmayan negatif dökümanlar eklemenin göz ardı edilemeyecek katkısını da gözler önüne seriyor.
Özet (Çeviri)
Annotating text data for event information extraction systems is hard, expensive, and error-prone. We investigate the feasibility of integrating coarse-grained data (document or sentence labels), which is far more feasible to obtain, instead of annotating more documents. We utilize a multi-task model with two auxiliary tasks, document and sentence binary classification, in addition to the main task of token classification. We perform a series of experiments with varying data regimes for the aforementioned integration. Results show that while introducing extra coarse-grained data offers greater improvement and robustness, a gain is still possible with only the addition of negative documents that have no information on any event.
Benzer Tezler
- Ilgın (Konya) kuzeyindeki yüksek potasyumlu metamorfik kayaçların jeolojik ve petrolojik incelemesi
Geological and petrological investigation of high-K metamorphic rocks in the north of Ilgin (Konya)
ŞENEL ÖZDAMAR
Doktora
Türkçe
2008
Jeoloji Mühendisliğiİstanbul Teknik ÜniversitesiJeoloji Mühendisliği Ana Bilim Dalı
PROF. DR. BEKTAŞ UZ
PROF. DR. FAHRİ ESENLİ
- An investigation of the influence of keyhole laser welding parameters on weld bead shape and integrity
Başlık çevirisi yok
ÖMER EKİNCİ
- Depremler sırasında zeminlerin davranışına bağlı olarak meydana gelen zemin deplasmanlarının belirlenmesi
Determination of soil displacements depending on the soil behaviour during earthquakes
ZÜLKÜF KAYA
Doktora
Türkçe
2008
İnşaat Mühendisliğiİstanbul Teknik Üniversitesiİnşaat Mühendisliği Bölümü
PROF. DR. AYFER ERKEN
- Basınçlı döküm yöntemiyle üretimde OTHEA ve HAA teknikleri uygulaması ile ürün ve proses optimizasyonu
Ooptimising product and process by fmea and fta techniques on die casting production
BURAK PULATKAN
Yüksek Lisans
Türkçe
1997
Metalurji Mühendisliğiİstanbul Teknik ÜniversitesiMetalurji Mühendisliği Ana Bilim Dalı
PROF. DR. YILMAZ TAPTIK
- Uzaktan eğitim uygulamalarında tam öğrenme modelinin öğrencilerin başarı ve tutumlarına etkisi
The effect of mastery learning designed for distance education on students' success and attitude
MUSTAFA ERSOY
Doktora
Türkçe
2014
Eğitim ve Öğretimİnönü ÜniversitesiEğitim Bilimleri Ana Bilim Dalı
YRD. DOÇ. DR. EYÜP İZCİ