Taranmış gazete koleksiyonu üzerinde tam metin arama ve görselleştirme aracı
Full-text search and visualization tool on scannednewspaper collection
- Tez No: 759817
- Danışmanlar: DOÇ. DR. SÜLEYMAN EKEN
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2022
- Dil: Türkçe
- Üniversite: Kocaeli Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilişim Sistemleri Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 48
Özet
Gazete, 17. yüzyılın başlarında Avrupa'da ayrı bir kültürel form olarak ortaya çıktı. Tari- hin erken modern dönemiyle bağlantılıdır. Tarih gazeteleri, milletler ve insanları için son derece önemlidir ve farklı disiplinlerden araştırmacılar, geçmişe dair anlayışımızı geliş- tirmek için, gazetelere güvenirler. Bu ihtiyacı karşılamak için İstanbul Üniversitesi Kü- tüphane ve Dokümantasyon Daire Başkanlığı, taranmış tarihi gazetelerden oluşan büyük bir veri tabanını, Gazetelerden Tarihe Bakış Projesi kapsamında erişime açmışlardır. Bunu bir adım daha ileri götürmek ve belgeleri daha erişilebilir kılmak için tüm veri ta- banında optik karakter tanıma ve varlık ismi tanıma görevlerini çalıştırmamız ve sonuç- ları tam metin arama mekanizmasına izin verecek şekilde indekslememiz gerekmektedir. Varlık ismi tanıma; kişi, yer, kurum, tarih, formül ve para gibi varlık isimlerini doküman- larda bulan doğal dil işleme ve metin madenciliğinde bilgi çıkarımı alanlarından biridir. Bu çalışmada, taranmış gazete dokümanlarındaki yer, kişi, organizasyon isimlerini eti- ketleyen bir sistem geliştirilmiştir. Orijinal web sitesindeki veri kümesini elde etmekten, arama sorgularını çalıştırmak için grafiksel bir kullanıcı ara yüzü sağlamaya kadar tüm bu hattı kapsayan bir sistem tasarladık ve bu beklentileri başarıyla gerçekleştiren bir al- goritma geliştirdik. Ayrıca performans sonuçlarını doğru şekilde ölçümleyebilmek için bulut bilişim kullanılmış ve eşit kaynaklara sahip bilgisayarlar üzerinde geliştirilen yazı- lım çalıştırılmıştır. Önerilen sistem, kişi, kültür ve güvenlikle ilgili anahtar kelimeleri ara- mayı ve görselleştirmeyi sağlamaktadır.
Özet (Çeviri)
The newspaper emerged as a distinct cultural form in early 17th-century Europe. It is bound up with the early modern period of history. Historical newspapers are of utmost importance to nations and its people, and researchers from different disciplines rely on these papers to improve our understanding of the past. In pursuit of satisfying this need, Istanbul University Head Office of Library and Documentation provides access to a big database of scanned historical newspapers, Gazetelerden Tarihe Bakış. To take it another step further and make the documents more accessible, we need to run optical character recognition (OCR) and named entity recognition (NER) tasks on the whole database and index the results to allow for full-text search mechanism. Name Entity Recognition (NER); It is one of the fields of information extraction in natural language processing and text mining, which finds entity names such as person, place, institution, date, formula and money in documents. In this thesis, a system has been developed that labels the names of places, people and organizations in scanned newspaper documents. We design and imp- lement a system encompassing the whole pipeline starting from scrapping the dataset from the original website to providing a graphical user interface to run search queries, and it manages to do that successfully. In addition, cloud computing was used to accura- tely measure performance results and the software developed on computers with equal resources was run. Proposed system provides to search people, culture and security-rela- ted keywords and to visualise them.
Benzer Tezler
- Öncü: 27 Mayıs 1960 askerî darbesi'nin ardından çıkan bir gazetenin tarihi
Oncu: History of a newspaper which was published afterwards May 27, 1960 military coup
MELTEM ŞAHİN
- Ortaöğretim coğrafya eğitiminde materyal kullanımı ve coğrafya sınıflarının gerekliliği
Material usage and geography classes in secondary school geography education requirement of
SEBAHATTİN KURTKAYA
Yüksek Lisans
Türkçe
2010
Eğitim ve ÖğretimMarmara ÜniversitesiOrtaöğretim Sosyal Alanlar Eğitimi Ana Bilim Dalı
YRD. DOÇ. DR. MEHMET ÜNLÜ
- Tanzimat'tan harf devrimi'ne çocuk şarkıları
Child songs from the age of tanzimat to reform of alphabet
SELMA ÇERGEL
Yüksek Lisans
Türkçe
2006
Eğitim ve ÖğretimMarmara Üniversitesiİlahiyat Ana Bilim Dalı
PROF. DR. HASAN AKSOY
- Bir mizah gazetesi Akbaba'nın gözünden Türkiye'de Demokrat Parti yılları (1950-1960)
Democratic Party years in Turkey through the eyes of a newspaper Akbaba (1950-1960)
ELİF KONAR
Yüksek Lisans
Türkçe
2021
GazetecilikFatih Sultan Mehmet Vakıf ÜniversitesiTarih Ana Bilim Dalı
PROF. DR. HASİP SAYGILI
- Gazete haberlerinde kimlik inşası: Terör haberlerinin sunumu
Identity-building in printed news media: The presentation of terror-related news
NURDİLEK ÇETİN
Yüksek Lisans
Türkçe
2014
GazetecilikGazi ÜniversitesiHalkla İlişkiler ve Tanıtım Ana Bilim Dalı
PROF. DR. HANİFE GÜZ