Data driven exploration of document collectionto understand underlying social fabric usinggraph representation learning
Doküman koleksiyonu üzerinde grafik temsil öğrenimi kullanarak temeldeki sosyal yapıyı anlamak
- Tez No: 680361
- Danışmanlar: PROF. DR. SELİM SAFFET BALCISOY
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: İngilizce
- Üniversite: Sabancı Üniversitesi
- Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 72
Özet
Kültürel Miras (CH) alanında metin, resim ve diğer temsil türlerinde dijital olarak çok büyük bir belge koleksiyonu ortaya çıkmaya başlamıştır. Bu tür kapsamlı verilerin mevcudiyeti, araştırmacıların ve arşivcilerin koleksiyonlardaki gizli ilişkileri anlamalarına olanak tanıyan çeşitli yaklaşımlara ihtiyaç duymaktadır. Ancak kültürel mirasta belgelerin en büyük zorluklarından biri, arşivcilerin belgeleri analiz edip işlemesinin uzun zaman alması ve zor olmasıdır. Bu manuel işlem nedeniyle, bu belgelerde adı geçen kişi, yer ve olayların aynı dilsel terim ve kelimelerle ifade edilmediği veya anlaşılmasını zorlaştıran belirsiz kavramlar içerdiği durumlar olabilir; sonuç olarak, bir profesyonel tarafından dikkatli bir şekilde incelenmeden bu ilişkileri ortaya çıkarmak zordur. Bu nedenle, belgeler arasındaki benzer olayları, kişileri ve yerleri yakalayacak ve böylece gizli ilişkiyi ortaya çıkaracak bu terimleri yeniden analiz edecek bir arşivciye ihtiyaç vardır. Bu boşluğu doldurmak için, yalnızca belgelerin metinsel özetini ve belgelerin ekstra meta-verilerini kullanarak çeşitli doğal dil işleme algoritmalarını ve grafik temsili öğrenme yöntemlerini birleştiren bir sistem önerdik. Sistem otomatik olarak belgelerdeki önemli terimleri çıkarır, ardından belgelerin kendileri ve bu terimler için vektörel değerler üretir. Bu vektörel değerler kullanılarak dokümanlar arasındaki ilişkileri gözlemlemek ve ilgili dokümanları ortaya çıkarmak kolaydır. Son olarak önerilen sistem, hesaplanan vektörler kullanılarak doküman önerisi yapmak için kullanılmıştır. Önerilen çalışmanın performansını alternatif yöntemlerle arşiv uzmanlarıyla yaptığımız bir deneyle değerlendirdik ve karşılaştırdık.
Özet (Çeviri)
An enormous collection of documents is digitally available in text, images, and other representations for cultural heritage (CH). The availability of such extensive data creates a need for various approaches that allow users and archivists to understand latent relationships in collections. However, one of the biggest challenges of documents in cultural heritage is that it takes a long time and is difficult for archivists to analyze and process documents. Due to this manual process, there may be situations where the person, place, and events mentioned in these documents are not expressed in the same linguistic terms and words, or they contain ambiguous concepts that make it difficult to understand; as a result, it is challenging to uncover these relationships without careful examination by a professional. Therefore, there is a need for an archivist who will re-analyze these terms to capture similar events, persons, and places between the documents and thus reveal the latent relationship. To fill this gap, we proposed a system that combines various NLP algorithms and graph representation learning methods using only the textual summary of the documents and the documents' metadata. The system automatically extracts substantial terms in the documents, then produces embedding for the documents themselves and these terms. Finally, the proposed system has been used to explore the document collection and perform document recommendations by utilizing calculated document embeddings. We evaluated and compared the performance of the proposed work with alternative methods through an experiment we conducted with archive experts.
Benzer Tezler
- Uçtan uca derin öğrenme yaklaşımlarıyla Türkçe eşgönderge çözümlemesi
Neural end to end Turkish coreference resolution
TUĞBA PAMAY ARSLAN
Doktora
Türkçe
2025
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. GÜLŞEN ERYİĞİT
- Strengthening inclusive practices in English language teaching: Al-powered lesson plans and material design for pre-service teachers
İngiliz dili eğitiminde kapsayıcı uygulamaları güçlendirme: Öğretmen adayları için yapay zeka destekli ders planı ve materyal tasarlama
ÇAĞATAY ÇINAR
Yüksek Lisans
İngilizce
2025
Eğitim ve Öğretimİzmir Demokrasi ÜniversitesiYabancı Diller Eğitimi Ana Bilim Dalı
PROF. DR. ECE ZEHİR TOPKAYA
- Nakış sanatının e-ticarette incelenmesi
An examination of embroidery artworks in e-commerce
MERYEM KÖSE
Yüksek Lisans
Türkçe
2025
El SanatlarıAnkara Hacı Bayram Veli ÜniversitesiEl Sanatları Ana Sanat Dalı
DOÇ. DR. TUBA BAHAR
- Tersine göç olgusu: Şehirden kaçan insan hikâyelerinin sosyolojik analizi
Reverse migration phenomenon: Sociological analysis of stories of people fleeing from the city
ZEYNEP BEYZA BİLGİLİ
Yüksek Lisans
Türkçe
2024
SosyolojiNiğde Ömer Halisdemir ÜniversitesiSosyoloji Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ELİF NAGİHAN TÜRKÖZ
- İstanbul'un Bakırköy ve Bağcılar ilçelerinde sosyo-mekansal değişim dinamikleri
Socio-spatial transformation dynamics in Bakırköy and Bağcılar districts of Istanbul
SEVGİYE SÖNMEZ ÖZDEMİR
Doktora
Türkçe
2024
Şehircilik ve Bölge Planlamaİstanbul Teknik ÜniversitesiŞehir ve Bölge Planlama Ana Bilim Dalı
PROF. DR. GÜLDEN ERKUT