Data driven exploration of document collectionto understand underlying social fabric usinggraph representation learning
Doküman koleksiyonu üzerinde grafik temsil öğrenimi kullanarak temeldeki sosyal yapıyı anlamak
- Tez No: 680361
- Danışmanlar: PROF. DR. SELİM SAFFET BALCISOY
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2021
- Dil: İngilizce
- Üniversite: Sabancı Üniversitesi
- Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Bilimleri ve Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 72
Özet
Kültürel Miras (CH) alanında metin, resim ve diğer temsil türlerinde dijital olarak çok büyük bir belge koleksiyonu ortaya çıkmaya başlamıştır. Bu tür kapsamlı verilerin mevcudiyeti, araştırmacıların ve arşivcilerin koleksiyonlardaki gizli ilişkileri anlamalarına olanak tanıyan çeşitli yaklaşımlara ihtiyaç duymaktadır. Ancak kültürel mirasta belgelerin en büyük zorluklarından biri, arşivcilerin belgeleri analiz edip işlemesinin uzun zaman alması ve zor olmasıdır. Bu manuel işlem nedeniyle, bu belgelerde adı geçen kişi, yer ve olayların aynı dilsel terim ve kelimelerle ifade edilmediği veya anlaşılmasını zorlaştıran belirsiz kavramlar içerdiği durumlar olabilir; sonuç olarak, bir profesyonel tarafından dikkatli bir şekilde incelenmeden bu ilişkileri ortaya çıkarmak zordur. Bu nedenle, belgeler arasındaki benzer olayları, kişileri ve yerleri yakalayacak ve böylece gizli ilişkiyi ortaya çıkaracak bu terimleri yeniden analiz edecek bir arşivciye ihtiyaç vardır. Bu boşluğu doldurmak için, yalnızca belgelerin metinsel özetini ve belgelerin ekstra meta-verilerini kullanarak çeşitli doğal dil işleme algoritmalarını ve grafik temsili öğrenme yöntemlerini birleştiren bir sistem önerdik. Sistem otomatik olarak belgelerdeki önemli terimleri çıkarır, ardından belgelerin kendileri ve bu terimler için vektörel değerler üretir. Bu vektörel değerler kullanılarak dokümanlar arasındaki ilişkileri gözlemlemek ve ilgili dokümanları ortaya çıkarmak kolaydır. Son olarak önerilen sistem, hesaplanan vektörler kullanılarak doküman önerisi yapmak için kullanılmıştır. Önerilen çalışmanın performansını alternatif yöntemlerle arşiv uzmanlarıyla yaptığımız bir deneyle değerlendirdik ve karşılaştırdık.
Özet (Çeviri)
An enormous collection of documents is digitally available in text, images, and other representations for cultural heritage (CH). The availability of such extensive data creates a need for various approaches that allow users and archivists to understand latent relationships in collections. However, one of the biggest challenges of documents in cultural heritage is that it takes a long time and is difficult for archivists to analyze and process documents. Due to this manual process, there may be situations where the person, place, and events mentioned in these documents are not expressed in the same linguistic terms and words, or they contain ambiguous concepts that make it difficult to understand; as a result, it is challenging to uncover these relationships without careful examination by a professional. Therefore, there is a need for an archivist who will re-analyze these terms to capture similar events, persons, and places between the documents and thus reveal the latent relationship. To fill this gap, we proposed a system that combines various NLP algorithms and graph representation learning methods using only the textual summary of the documents and the documents' metadata. The system automatically extracts substantial terms in the documents, then produces embedding for the documents themselves and these terms. Finally, the proposed system has been used to explore the document collection and perform document recommendations by utilizing calculated document embeddings. We evaluated and compared the performance of the proposed work with alternative methods through an experiment we conducted with archive experts.
Benzer Tezler
- Tersine göç olgusu: Şehirden kaçan insan hikâyelerinin sosyolojik analizi
Reverse migration phenomenon: Sociological analysis of stories of people fleeing from the city
ZEYNEP BEYZA BİLGİLİ
Yüksek Lisans
Türkçe
2024
SosyolojiNiğde Ömer Halisdemir ÜniversitesiSosyoloji Ana Bilim Dalı
DR. ÖĞR. ÜYESİ ELİF NAGİHAN TÜRKÖZ
- Innovation management in design-intensive family firms from office furniture manufacturing industry: A dynamic capability perspective from an emerging market
Ofis mobilyası imalat sanayisindeki tasarım yoğun aile firmalarında inovasyon yönetimi: Gelişmekte olan bir pazardan dinamik yetenek perspektifi
SELİN GÜLDEN
Doktora
İngilizce
2022
Endüstri Ürünleri Tasarımıİstanbul Teknik ÜniversitesiEndüstriyel Tasarım Ana Bilim Dalı
PROF. DR. ÖZLEM ER
- Mobil uygulama aracılı veri sömürgeciliği: Bağımsız mobil uygulama geliştiricilerine yönelik bir araştırma
Mobile app-mediated data colonialism: Research on indie mobile app developers
ÖMÜR TALAY
- Seyir emniyetinde insan hatası risk analizi ve insan faktörleri temelinde köprüüstü dizaynına yönelik kural önerileri
Human error risk analysis in navigational safety and human factors based rule recommendations on bridge design
RİFAT BURKAY ALAN
Doktora
Türkçe
2021
Denizcilikİstanbul Teknik ÜniversitesiGemi İnşaatı ve Gemi Makineleri Mühendisliği Ana Bilim Dalı
PROF. DR. OĞUZ SALİM SÖĞÜT