Geri Dön

Taranmış gazete koleksiyonu üzerinde tam metin arama ve görselleştirme aracı

Full-text search and visualization tool on scannednewspaper collection

  1. Tez No: 759817
  2. Yazar: HASAN BASRİ ŞAHİN
  3. Danışmanlar: DOÇ. DR. SÜLEYMAN EKEN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2022
  8. Dil: Türkçe
  9. Üniversite: Kocaeli Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilişim Sistemleri Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 48

Özet

Gazete, 17. yüzyılın başlarında Avrupa'da ayrı bir kültürel form olarak ortaya çıktı. Tari- hin erken modern dönemiyle bağlantılıdır. Tarih gazeteleri, milletler ve insanları için son derece önemlidir ve farklı disiplinlerden araştırmacılar, geçmişe dair anlayışımızı geliş- tirmek için, gazetelere güvenirler. Bu ihtiyacı karşılamak için İstanbul Üniversitesi Kü- tüphane ve Dokümantasyon Daire Başkanlığı, taranmış tarihi gazetelerden oluşan büyük bir veri tabanını, Gazetelerden Tarihe Bakış Projesi kapsamında erişime açmışlardır. Bunu bir adım daha ileri götürmek ve belgeleri daha erişilebilir kılmak için tüm veri ta- banında optik karakter tanıma ve varlık ismi tanıma görevlerini çalıştırmamız ve sonuç- ları tam metin arama mekanizmasına izin verecek şekilde indekslememiz gerekmektedir. Varlık ismi tanıma; kişi, yer, kurum, tarih, formül ve para gibi varlık isimlerini doküman- larda bulan doğal dil işleme ve metin madenciliğinde bilgi çıkarımı alanlarından biridir. Bu çalışmada, taranmış gazete dokümanlarındaki yer, kişi, organizasyon isimlerini eti- ketleyen bir sistem geliştirilmiştir. Orijinal web sitesindeki veri kümesini elde etmekten, arama sorgularını çalıştırmak için grafiksel bir kullanıcı ara yüzü sağlamaya kadar tüm bu hattı kapsayan bir sistem tasarladık ve bu beklentileri başarıyla gerçekleştiren bir al- goritma geliştirdik. Ayrıca performans sonuçlarını doğru şekilde ölçümleyebilmek için bulut bilişim kullanılmış ve eşit kaynaklara sahip bilgisayarlar üzerinde geliştirilen yazı- lım çalıştırılmıştır. Önerilen sistem, kişi, kültür ve güvenlikle ilgili anahtar kelimeleri ara- mayı ve görselleştirmeyi sağlamaktadır.

Özet (Çeviri)

The newspaper emerged as a distinct cultural form in early 17th-century Europe. It is bound up with the early modern period of history. Historical newspapers are of utmost importance to nations and its people, and researchers from different disciplines rely on these papers to improve our understanding of the past. In pursuit of satisfying this need, Istanbul University Head Office of Library and Documentation provides access to a big database of scanned historical newspapers, Gazetelerden Tarihe Bakış. To take it another step further and make the documents more accessible, we need to run optical character recognition (OCR) and named entity recognition (NER) tasks on the whole database and index the results to allow for full-text search mechanism. Name Entity Recognition (NER); It is one of the fields of information extraction in natural language processing and text mining, which finds entity names such as person, place, institution, date, formula and money in documents. In this thesis, a system has been developed that labels the names of places, people and organizations in scanned newspaper documents. We design and imp- lement a system encompassing the whole pipeline starting from scrapping the dataset from the original website to providing a graphical user interface to run search queries, and it manages to do that successfully. In addition, cloud computing was used to accura- tely measure performance results and the software developed on computers with equal resources was run. Proposed system provides to search people, culture and security-rela- ted keywords and to visualise them.

Benzer Tezler

  1. Öncü: 27 Mayıs 1960 askerî darbesi'nin ardından çıkan bir gazetenin tarihi

    Oncu: History of a newspaper which was published afterwards May 27, 1960 military coup

    MELTEM ŞAHİN

    Doktora

    Türkçe

    Türkçe

    2017

    GazetecilikErciyes Üniversitesi

    Gazetecilik Ana Bilim Dalı

    PROF. DR. HAKAN AYDIN

  2. Ortaöğretim coğrafya eğitiminde materyal kullanımı ve coğrafya sınıflarının gerekliliği

    Material usage and geography classes in secondary school geography education requirement of

    SEBAHATTİN KURTKAYA

    Yüksek Lisans

    Türkçe

    Türkçe

    2010

    Eğitim ve ÖğretimMarmara Üniversitesi

    Ortaöğretim Sosyal Alanlar Eğitimi Ana Bilim Dalı

    YRD. DOÇ. DR. MEHMET ÜNLÜ

  3. Tanzimat'tan harf devrimi'ne çocuk şarkıları

    Child songs from the age of tanzimat to reform of alphabet

    SELMA ÇERGEL

    Yüksek Lisans

    Türkçe

    Türkçe

    2006

    Eğitim ve ÖğretimMarmara Üniversitesi

    İlahiyat Ana Bilim Dalı

    PROF. DR. HASAN AKSOY

  4. Bir mizah gazetesi Akbaba'nın gözünden Türkiye'de Demokrat Parti yılları (1950-1960)

    Democratic Party years in Turkey through the eyes of a newspaper Akbaba (1950-1960)

    ELİF KONAR

    Yüksek Lisans

    Türkçe

    Türkçe

    2021

    GazetecilikFatih Sultan Mehmet Vakıf Üniversitesi

    Tarih Ana Bilim Dalı

    PROF. DR. HASİP SAYGILI

  5. Gazete haberlerinde kimlik inşası: Terör haberlerinin sunumu

    Identity-building in printed news media: The presentation of terror-related news

    NURDİLEK ÇETİN

    Yüksek Lisans

    Türkçe

    Türkçe

    2014

    GazetecilikGazi Üniversitesi

    Halkla İlişkiler ve Tanıtım Ana Bilim Dalı

    PROF. DR. HANİFE GÜZ