İnternette heterojen veri kaynaklarından verinin toplanması, doğrulanması ve sorgulanması

Collecting, verifying, and inquiring data from heterogeneous data sources on the internet

PDF İndir

Tez No: 834048
Yazar: SERDAR KÜRŞAT SARIKOZ
Danışmanlar: PROF. DR. MUHAMMET ALİ AKCAYOL
Tez Türü: Doktora
Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
Anahtar Kelimeler: Belirtilmemiş.
Yıl: 2023
Dil: Türkçe
Üniversite: Gazi Üniversitesi
Enstitü: Bilişim Enstitüsü
Ana Bilim Dalı: Bilgisayar Bilimleri Ana Bilim Dalı
Bilim Dalı: Belirtilmemiş.
Sayfa Sayısı: 153

Özet

Yapay zekâ alanındaki disiplinler arası araştırmalar ve teknolojik gelişmeler, heterojen veri kaynaklarından gelen büyük hacimli verilerin bilgi grafları sayesinde entegrasyonunu sağlayarak gerçek dünya sorunlarının çözümü ve büyük veri analitiğini olanaklı kılmıştır. Web üzerindeki heterojen veri kaynakları ile çalışmada, bağlantılı veri, anlamsal ağ ve bilgi graflarının entegrasyonu; veri kalitesi ve doğruluk keşfinin birlikte etkileşimini sağlam bir dijital çerçevede sunumunu sağlamaktadır. Bu çerçeve sadece bilginin zenginliğini ve erişilebilirliğini değil, aynı zamanda güvenilirliğini, doğruluğunu ve güvenilirliğini de sağlayarak bilgilerin tutarlılığını ve güvenilirliğini sağlayan dijital çağın önünü açmaktadır. Bir dil için KG oluşturmak, heterojen verilerin karmaşıklığı ve dinamik yapısı nedeniyle zorlukları beraberinde getirmektedir. Heterojen veri kaynakları üzerinden, heterojen bilgi ağlarının oluşturulmasında, saklanmasında, işlenmesinde, analiz edilmesinde ve karmaşık ilişkilerin çıkarılmasında; verimli ve etkin yeni algoritmalar geliştirilmesine ihtiyaç bulunmaktadır. Bu çalışmada, Türkçe diline yönelik olarak heterojen veri kaynaklarından bilgi çıkarımı, makine okunabilir formatta bilgi tabanının oluşturulması ve bilgilerin graf formatında gösterimini sağlayan özgün bir model geliştirilmiştir. Sistem, Wikipedia ve arama motorları üzerinden elde etmiş olduğu veriler üzerinden bilgi çıkarımını, bilgi tabanına eklenmesine yönelik gerekli işlemleri, oluşturmuş olduğu referans bilgi tabanı aracılığı ile bilgilerin doğrulanmasını gerçekleştirilmektedir. Çalışma kapsamında önerilen özgün modelin benzersiz mimarisi, farklı alanlardaki farklı problemlere ve görevlere uyarlanmasına olanak sağlamaktadır. Bu esneklik, modelin çeşitli alanlarda kullanılabilirliğini ve uygulanabilirliğini artırmaktadır. Bununla birlikte Türkçe dilinde Web ölçekli ve genel amaçlı bir bilgi grafı sunması nedeniyle mevcut literatürdeki bir boşluğu doldurmaktadır. Önerilen sistem aynı zamanda arama motorlarına özgün unutulma hakkı ve güvenli arama gösterimini de sunmaktadır.

Özet (Çeviri)

Interdisciplinary research and technological developments in the field of artificial intelligence have enabled the integration of large volumes of data from heterogeneous data sources through knowledge graphs, enabling the solution of real world problems and big data analytics. In working with heterogeneous data sources on the Web, integrating linked data, semantic networks, and knowledge graphs enables the interaction of data quality and truth discovery to be presented in a robust digital framework. This framework paves the way for a digital age that ensures not only the richness and accessibility of information but also its reliability, accuracy, and trustworthiness, ensuring consistency and trustworthiness of information. Creating a QA for a language brings challenges due to heterogeneous data's complexity and dynamic nature. New efficient and effective algorithms are needed for creating, storing, processing, analyzing, and extracting complex relationships from heterogeneous data sources. This study developed a novel model for extracting information from heterogeneous data sources, creating a machine-readable knowledge base, and representing the information in graph format for the Turkish language. The system performs information extraction through the data obtained from Wikipedia and search engines, the necessary operations for adding to the knowledge base, and the verification of the information through the reference knowledge base it has created. The unique architecture of the original model proposed in this study allows it to be adapted to different problems and tasks in different fields. This flexibility increases the usability and applicability of the model in various fields. In addition, it fills a gap in the existing literature by providing a Web-scale and general-purpose knowledge graph in the Turkish language. The proposed system also gives search engines a unique right to be forgotten and a secure search representation.

Benzer Tezler

Tez No
849103
İnternet'te heterojen veri kaynaklarından veri toplanması, entegrasyonu ve güncellenmesi
Collecting, integrating and updating data from heterogenous data sources on the internet
ZÜLFÜ ALANOĞLU
Doktora
Türkçe
2024
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Gazi Üniversitesi
Bilişim Sistemleri Ana Bilim Dalı
PROF. DR. MUHAMMET ALİ AKCAYOL
Tez No
421183
Ortak mimarili yapılar ile insansız araçlarda veri iletişimi
Data communication in unmanned systems using joint architecture
OKAN BOSTAN
Yüksek Lisans
Türkçe
2015
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol İstanbul Teknik Üniversitesi
Mekatronik Mühendisliği Ana Bilim Dalı
PROF. DR. HAKAN TEMELTAŞ
Tez No
537372
A matched-pair comparative study on classification of data streams with concept drift
İçerik kayması bulunan akışkan verilerin sınıflandırılmasında eşleştirmeli karşılaştırma çalışması
ELİF SELEN BABÜROĞLU
Yüksek Lisans
İngilizce
2019
Endüstri ve Endüstri Mühendisliği Gaziantep Üniversitesi
Endüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. ALPTEKİN DURMUŞOĞLU
PROF. DR. TÜRKAY DERELİ
Tez No
126562
Information extraction and manipulation system for the web sources
Web kaynaklarından bilgi sağlanması ve manipülasyonu
SERHAN TATAR
Yüksek Lisans
İngilizce
2002
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol Marmara Üniversitesi
Bilgisayar Mühendisliği Ana Bilim Dalı
PROF. DR. M. AKİF EYLER
Tez No
894240
Yapay zeka ve derin öğrenme algoritmaları kullanılarak internet ortamındaki heterojen veri kaynaklarından veri sorgulaması
Data querying from heterogeneous data sources on the internet using artificial intelligence and deep learning algorithms
KUBİLAY AYTURAN
Doktora
Türkçe
2024
Elektrik ve Elektronik Mühendisliği Gazi Üniversitesi
Elektrik-Elektronik Mühendisliği Ana Bilim Dalı
PROF. DR. FIRAT HARDALAÇ

Geri Dön