Yapısal olmayan türkçe verilerin bağlı veri kaynaklarıyla etiketlenmesi
Tagging unstructured data in turkish language with linked data sources
- Tez No: 411339
- Danışmanlar: DOÇ. DR. RIZA CENK ERDUR
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2015
- Dil: Türkçe
- Üniversite: Ege Üniversitesi
- Enstitü: Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 70
Özet
Bu tezde yapısal olmayan Türkçe özgeçmişler ve LinkedIn profesyonel sosyal ağ sitesinden sağlanan yarı yapısal Türkçe veriler bağlı veri kaynaklarıyla etiketlenerek anlamsallaştırılmıştır. Verilerin etiketlenmesinde kullanılan Türkçe doğal dil işleme aracının geliştirilmesinde kullanılabilecek kütüphaneler incelenmiş ve bu kütüphanelerden Zemberek kütüphanesi kullanılmıştır. Etiketlenmiş verilerin ve çalışma kapsamında kullanılan diğer verilerin saklanmasında kullanılabilecek veri depolama altyapıları incelenmiştir. Verilerin saklanacağı en etkin veri depolama altyapısını belirlemek için anlamsal verilerin saklandığı üçlü depolama altyapıları ile NoSQL veritabanları incelenmiştir. Çalışmada melez veri altyapısını destekleyen Polyglot Persistence yaklaşımı benimsenmiştir.
Özet (Çeviri)
In this thesis, unstructured resumes written in Turkish and semi-structured data retrieved from LinkedIn professional social website are tagged to make them semantic data. Zemberek NLP Library has been chosen following the investigation of natural language processing libraries which would be used in the development of the Turkish natural language processing tool that is used on tagging of text data. Data storage structures that tagged data and the data used in this study are stored in are examined. Triple stores and NoSQL databases are examined in the decision of best options which keep semantic data. In this work, Polyglot Persistence approach is chosen which supports hybrid data infrastructure.
Benzer Tezler
- Konutlarda akustik performansın mevzuat ve subjektif etki bağlamında değerlendirilmesi için bir yaklaşım
An approach for acoustic performance assessment of dwellings in the context of legislations and subjective evaluation
AYÇA ŞENTOP DÜMEN
Doktora
Türkçe
2020
Mimarlıkİstanbul Teknik ÜniversitesiMimarlık Ana Bilim Dalı
DR. ÖĞR. ÜYESİ NURGÜN BAYAZIT
- Freeqa - bağlı veri üzerinde hibrid soru cevaplama sistemi
Freeqa-Hybrit question answering system on linked data
ŞENOL ATAÇ
Yüksek Lisans
Türkçe
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolTOBB Ekonomi ve Teknoloji ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. ERDOĞAN DOĞDU
- Bankacılık sektöründe büyük veri uygulamaları ve pazarlama öngörülerinde kullanımı
Big data applications in the banking sector and its use in marketing insights
YASEMİN OLĞAÇ AKAR
Doktora
Türkçe
2023
MaliyeDüzce Üniversitesiİşletme Ana Bilim Dalı
PROF. DR. MEHMET AKİF ÖNCÜ
DOÇ. DR. EMEL FAİZ
- Deprem sonrasında algılayıcılar kullanılarak geçiş alanlarında hasara bağlı blokaj tespiti
The assessment of blockage related to damage in transition areas after earthquake with sensors
BURAK ÖZBAŞ
Yüksek Lisans
Türkçe
2013
Bilim ve Teknolojiİstanbul Teknik Üniversitesiİnşaat Mühendisliği Ana Bilim Dalı
YRD. DOÇ. ESİN ERGEN PEHLEVAN
- Siber tehdit istihbaratı için yeni tarama modeli geliştirilmesi
Development of a new scanning model in cyber threat intelligence
EBU YUSUF GÜVEN
Doktora
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Üniversitesi-CerrahpaşaBilgisayar Mühendisliği Ana Bilim Dalı
DOÇ. DR. MUHAMMED ALİ AYDIN
DR. ÖĞR. ÜYESİ ALİ BOYACI