Geri Dön

İnternette heterojen veri kaynaklarından verinin toplanması, doğrulanması ve sorgulanması

Collecting, verifying, and inquiring data from heterogeneous data sources on the internet

  1. Tez No: 834048
  2. Yazar: SERDAR KÜRŞAT SARIKOZ
  3. Danışmanlar: PROF. DR. MUHAMMET ALİ AKCAYOL
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: Türkçe
  9. Üniversite: Gazi Üniversitesi
  10. Enstitü: Bilişim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Bilimleri Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 153

Özet

Yapay zekâ alanındaki disiplinler arası araştırmalar ve teknolojik gelişmeler, heterojen veri kaynaklarından gelen büyük hacimli verilerin bilgi grafları sayesinde entegrasyonunu sağlayarak gerçek dünya sorunlarının çözümü ve büyük veri analitiğini olanaklı kılmıştır. Web üzerindeki heterojen veri kaynakları ile çalışmada, bağlantılı veri, anlamsal ağ ve bilgi graflarının entegrasyonu; veri kalitesi ve doğruluk keşfinin birlikte etkileşimini sağlam bir dijital çerçevede sunumunu sağlamaktadır. Bu çerçeve sadece bilginin zenginliğini ve erişilebilirliğini değil, aynı zamanda güvenilirliğini, doğruluğunu ve güvenilirliğini de sağlayarak bilgilerin tutarlılığını ve güvenilirliğini sağlayan dijital çağın önünü açmaktadır. Bir dil için KG oluşturmak, heterojen verilerin karmaşıklığı ve dinamik yapısı nedeniyle zorlukları beraberinde getirmektedir. Heterojen veri kaynakları üzerinden, heterojen bilgi ağlarının oluşturulmasında, saklanmasında, işlenmesinde, analiz edilmesinde ve karmaşık ilişkilerin çıkarılmasında; verimli ve etkin yeni algoritmalar geliştirilmesine ihtiyaç bulunmaktadır. Bu çalışmada, Türkçe diline yönelik olarak heterojen veri kaynaklarından bilgi çıkarımı, makine okunabilir formatta bilgi tabanının oluşturulması ve bilgilerin graf formatında gösterimini sağlayan özgün bir model geliştirilmiştir. Sistem, Wikipedia ve arama motorları üzerinden elde etmiş olduğu veriler üzerinden bilgi çıkarımını, bilgi tabanına eklenmesine yönelik gerekli işlemleri, oluşturmuş olduğu referans bilgi tabanı aracılığı ile bilgilerin doğrulanmasını gerçekleştirilmektedir. Çalışma kapsamında önerilen özgün modelin benzersiz mimarisi, farklı alanlardaki farklı problemlere ve görevlere uyarlanmasına olanak sağlamaktadır. Bu esneklik, modelin çeşitli alanlarda kullanılabilirliğini ve uygulanabilirliğini artırmaktadır. Bununla birlikte Türkçe dilinde Web ölçekli ve genel amaçlı bir bilgi grafı sunması nedeniyle mevcut literatürdeki bir boşluğu doldurmaktadır. Önerilen sistem aynı zamanda arama motorlarına özgün unutulma hakkı ve güvenli arama gösterimini de sunmaktadır.

Özet (Çeviri)

Interdisciplinary research and technological developments in the field of artificial intelligence have enabled the integration of large volumes of data from heterogeneous data sources through knowledge graphs, enabling the solution of real world problems and big data analytics. In working with heterogeneous data sources on the Web, integrating linked data, semantic networks, and knowledge graphs enables the interaction of data quality and truth discovery to be presented in a robust digital framework. This framework paves the way for a digital age that ensures not only the richness and accessibility of information but also its reliability, accuracy, and trustworthiness, ensuring consistency and trustworthiness of information. Creating a QA for a language brings challenges due to heterogeneous data's complexity and dynamic nature. New efficient and effective algorithms are needed for creating, storing, processing, analyzing, and extracting complex relationships from heterogeneous data sources. This study developed a novel model for extracting information from heterogeneous data sources, creating a machine-readable knowledge base, and representing the information in graph format for the Turkish language. The system performs information extraction through the data obtained from Wikipedia and search engines, the necessary operations for adding to the knowledge base, and the verification of the information through the reference knowledge base it has created. The unique architecture of the original model proposed in this study allows it to be adapted to different problems and tasks in different fields. This flexibility increases the usability and applicability of the model in various fields. In addition, it fills a gap in the existing literature by providing a Web-scale and general-purpose knowledge graph in the Turkish language. The proposed system also gives search engines a unique right to be forgotten and a secure search representation.

Benzer Tezler

  1. İnternet'te heterojen veri kaynaklarından veri toplanması, entegrasyonu ve güncellenmesi

    Collecting, integrating and updating data from heterogenous data sources on the internet

    ZÜLFÜ ALANOĞLU

    Doktora

    Türkçe

    Türkçe

    2024

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolGazi Üniversitesi

    Bilişim Sistemleri Ana Bilim Dalı

    PROF. DR. MUHAMMET ALİ AKCAYOL

  2. Ortak mimarili yapılar ile insansız araçlarda veri iletişimi

    Data communication in unmanned systems using joint architecture

    OKAN BOSTAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2015

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik Üniversitesi

    Mekatronik Mühendisliği Ana Bilim Dalı

    PROF. DR. HAKAN TEMELTAŞ

  3. A matched-pair comparative study on classification of data streams with concept drift

    İçerik kayması bulunan akışkan verilerin sınıflandırılmasında eşleştirmeli karşılaştırma çalışması

    ELİF SELEN BABÜROĞLU

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Endüstri ve Endüstri MühendisliğiGaziantep Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ALPTEKİN DURMUŞOĞLU

    PROF. DR. TÜRKAY DERELİ

  4. Information extraction and manipulation system for the web sources

    Web kaynaklarından bilgi sağlanması ve manipülasyonu

    SERHAN TATAR

    Yüksek Lisans

    İngilizce

    İngilizce

    2002

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolMarmara Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    PROF. DR. M. AKİF EYLER

  5. Yapay zeka ve derin öğrenme algoritmaları kullanılarak internet ortamındaki heterojen veri kaynaklarından veri sorgulaması

    Data querying from heterogeneous data sources on the internet using artificial intelligence and deep learning algorithms

    KUBİLAY AYTURAN

    Doktora

    Türkçe

    Türkçe

    2024

    Elektrik ve Elektronik MühendisliğiGazi Üniversitesi

    Elektrik-Elektronik Mühendisliği Ana Bilim Dalı

    PROF. DR. FIRAT HARDALAÇ