Yazılı belgeler üzerinden kişi ve olayları ilişkilendirerek bilgi çıkarımı yapmak
Information extraction from written documents by relating people and events
- Tez No: 542819
- Danışmanlar: PROF. DR. BAHAR KARAOĞLAN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2018
- Dil: Türkçe
- Üniversite: Ege Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Uluslararası Bilgisayar Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 82
Özet
Bu tez çalışması, yapısal olmayan metinleri kümeleme ve sınıflandırma yöntemleri ile insan ve yer arasındaki ilişkileri zamana bağlı olarak yapısal biçime dönüştürmeyi hedeflemektedir. Çoğunlukla politikacılar hakkında 539 bin haber içeren New York Times derlemi eğitim ve değerlendirme sürecinde kullanılmıştır. Cümlelerde varlık isimleri (kişi, yer, tarih) etiketlenmiş ve düzgelenmiştir. Daha sonra cümle bazında, kişi ve yer ikilileri; son olarak da bu ikililer arasındaki hareket eylemlerine dayalı gezinim ilişkileri çıkarılmıştır. Yer ve zaman ikililerine olay adı verilmiş ve kişilerle ilişkilendirilmiştir. Uygulanan yöntemi değerlendirmek için altın standartta bir veri kümesi oluşturulmuş; F skoru ve doğruluk değerleri ile yöntemin farklı modüllerinin başarımları ölçülmüştür.
Özet (Çeviri)
In this thesis, the proposed method transforms unstructured texts into structured form using clustering and classification techniques which extract person and location relations depending on time and employ this structured form to generate event based queries on personal trajectory. New York Times corpus which includes 539 thousands of news mostly about politicians is used in training and testing process. Person, location and time phrases are extracted from sentences and normalization of named entities is done in order to track the person trajectory. After that, person-location pairs are extracted on the one-sentence level granularity. Finally, the personal trajectory is obtained based on the action verb phrases between person-location pairs.Time-location pairs are named as events and relation of events with people are extracted from documents. In order to evaluate the method, golden standard dataset is generated and for the different modules of the method, F-Score and Accuracy are calculated.
Benzer Tezler
- Üsküdarlı İbrahim Sırrî Efendi'nin târîh-i Sultan Mustâfâ-i Sâni adlı eseri'nin transkripsiyonu ve nüshalarının karşılaştırması
Transcription and copy comparison of the book 'History of the Sultan Mustafa-i Sâni' belonged to Üsküdarli İbrahim Sirrî
BÜNYAMİN ARAS
Yüksek Lisans
Türkçe
2019
TarihNevşehir Hacı Bektaş Veli ÜniversitesiTarih Ana Bilim Dalı
DR. ÖĞR. ÜYESİ RÜMEYSA KARS
- Diasporanın sembolik sermayesi: Atina'da yaşayan İstanbullu Rumların aile fotoğrafları
The symbolic capital of the diaspora: Family photographs of the Rum Istanbulites of Athens
CEREN ACUN
Doktora
Türkçe
2021
AntropolojiGalatasaray ÜniversitesiRadyo Televizyon ve Sinema Ana Bilim Dalı
DR. ÖĞR. ÜYESİ Ö. MURAD ÖZDEMİR
- Yeni Cami'nin akustik açıdan performans değerlendirmesi
Evaluation of the acoustical performance of the New Mosque
EVREN YILDIRIM
Yüksek Lisans
Türkçe
2003
Mimarlıkİstanbul Teknik ÜniversitesiMimarlık Ana Bilim Dalı
PROF. DR. SEVTAP YILMAZ DEMİRKALE
- Assessment of urbanization history of Addis Ababa city, Ethiopia
Addıs Ababa cıty, Ethıopıa'nın kentleşme tarihinin değerlendirilmesi
ABDURAHMAN HUSSEN YIMER
Yüksek Lisans
İngilizce
2023
Şehircilik ve Bölge PlanlamaMersin ÜniversitesiŞehir ve Bölge Planlama Ana Bilim Dalı
DOÇ. DR. ALİ CENAP YOLOĞLU
- Tommaso Campanella ve Thomas More'un ütopyalarının karşılaştırılması
Comparing Thomas More and Tommaso Campanella's utopias
MAHMUT AVCI
Yüksek Lisans
Türkçe
2006
FelsefeAtatürk ÜniversitesiFelsefe ve Din Bilimleri Ana Bilim Dalı
YRD. DOÇ. DR. OSMAN ELMALI