Big data storage and automated text summarization in turkish text
Dev veri depolama ve Türkçe metin için otomatik özetleme
- Tez No: 507693
- Danışmanlar: PROF. DR. OLCAY TANER YILDIZ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2018
- Dil: İngilizce
- Üniversite: Işık Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 65
Özet
Bu çalışmanın konusu, geniş çapta veriyi Dev Veri ekosistemine uygun bir şekilde saklamak ve bir Türkçe dokumanın özet cümlelerinin çıkarılması için doğal dil işleme (DDİ) alt konusu olan otomatik metin özetleme işlemini uygulamaktır. Bu amaçla Türkçe haber metinleri toplanmış ve çalışma bu metinler üzerinden yürütülmüştür. Yapılan çalışmanın performans testi için 20 farklı kişiye 50 farklı haber metni verilmiş ve her metnin içerisinden önemli gördükleri 3 cümlenin seçilmesi istenmiştir ve sonuçlar birbirleriyle karşılaştırılmıştır. Daha sonra kişilerden alınan sonuç ile bu çalışmadaki çıkan sonuç karşılaştırılmıştır. Test işleminin neticesinde çalışmanın özetleme performansı yaklaşık olarak yüzde otuz altı ölçülmüştür.
Özet (Çeviri)
The subject of this study is storing the large datasets in accordance with Big Data ecosystem and to extract the summary sentences of a text in Turkish, apply the automatic text summarization process which is a subtopic of Natural language processing (NLP). For this purpose, Turkish news articles were collected and the study was carried out through these texts. For the performance test of the work done, 50 different news textiles were given to 20 different persons and 3 sentences which were considered important from each other were asked to be selected and their results were compared with each other. Then, the results from the people were compared with the results from this study. As a result of the test process, the summation performance of the work was measured approximately as thirty-six percentage.
Benzer Tezler
- Özelleştirilmiş analitik bulut mimarilerinde dağıtık dosya sistemleri ile performans iyileştirmesi
Performance improvement via distribited file systems on private analytic clouds
MUHAMMED AKİF AĞCA
Yüksek Lisans
Türkçe
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolTOBB Ekonomi ve Teknoloji ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ERDOĞAN DOĞDU
- Automatic topic categorization of turkish faxed bank documents in the presence of ocr errors
Türkçe fakslanmış banka belgelerinin okt hataları varlığında otomatik konu sınıflandırması
SEÇİL ÖZTÜRK
Yüksek Lisans
İngilizce
2014
Elektrik ve Elektronik MühendisliğiBoğaziçi ÜniversitesiElektrik-Elektronik Mühendisliği Ana Bilim Dalı
DOÇ. DR. MURAT SARAÇLAR
PROF. DR. MEHMET BÜLENT SANKUR
- Cloud computing in maritime transport for data collection: Cyber security risk analysis with FMECA method
Deniz taşımacılıgında veri toplama işlemi için bulut bilişim cözümü: FMECA methodu ile siber güvenlik risk analizi
TOPRAK OBA
Yüksek Lisans
İngilizce
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiDeniz Ulaştırma Mühendisliği Ana Bilim Dalı
PROF. DR. YASİN ARSLANOĞLU
- Yeşil tedarik zinciri süreçlerinde yenilikçi teknolojilerin kullanımı: Bursa ilinde bir araştırma
Using innovative technologies in green supply chain processes: A study in Bursa municipality
FATMANUR TORUN ŞAŞMAZ
Yüksek Lisans
Türkçe
2022
İşletmeBursa Uludağ Üniversitesiİşletme Ana Bilim Dalı
DR. ÖĞR. ÜYESİ FATMA GÜLAY KASAP
- Coğrafi bilgi sistemleri ile İstanbul ili nominal taşınmaz değer haritasının oluşturulması
Creation of nominal asset value-based map using geographical information systems for İstanbul city
MUHAMMED OĞUZHAN METE
Yüksek Lisans
Türkçe
2019
Jeodezi ve Fotogrametriİstanbul Teknik ÜniversitesiGeomatik Mühendisliği Ana Bilim Dalı
PROF. DR. TAHSİN YOMRALIOĞLU