Geri Dön

Entity-relationship diagram generation with natural language processing and machine learning approach

Doğal dil işleme ve makine öğrenmesi yaklaşımıyla varlık-ilişki diyagram üretimi

  1. Tez No: 836438
  2. Yazar: MERTALİ KÖPRÜLÜ
  3. Danışmanlar: DR. ÖĞR. ÜYESİ EMİNE EKİN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: İngilizce
  9. Üniversite: Işık Üniversitesi
  10. Enstitü: Lisansüstü Eğitim Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 86

Özet

Yazılım sistemleri giderek karmaşıklık kazandıkça, verimli ve doğru tasarım yöntemlerine olan ihtiyaç artan bir şekilde kritik hale gelmektedir. Varlık İlişki Diyagramları (ERD), sistem yapılarını ve bağımlılıklarını güçlü bir görsel diyagram ile sunarak yazılım mühendisliği ve dahi veri tabanı tasarımının temelini oluştururlar. Ancak, metinsel gereksinimlerden ERD'lerin el ile oluşturulması zaman alıcı ve zahmet gerektirir iken, tasarım yapan kişinin öznel eleştirisine bağlıdır. Bu zorluğun üstesinden gelmek için bu tez, doğal dil işleme (NLP) tekniklerinin kullanımını ve metinden diyagram ile ilgili gerekli olan bilgileri otomatik olarak çıkarmak ve ERD'ler oluşturmak için incelemektedir. Önerilen bu yaklaşım, doğal dil girdilerinden varlık, varlıkların özniteliklerini ve ilişkilerini ve kardinalitelerini otomatik olarak belirlemek için kural tabanlı tekniklerin, anlamsal analizin ve makine öğrenimi algoritmalarının birleşimini kullanır. Bu çalışma, dilbilimsel ve anlamsal analiz ile makine öğreniminin verimli bilgi çıkarımı için kullanılmasına ilişkin araştırmaları sunarak deneyler yapar ve bu deney sonuçlarını karşılaştırması sonucu önerilen yöntemin eksikliklerini ve güçlü yönlerini bildirir. Önerilen bu sistem, ERD oluşturma sürecini basitleştirmeyi ve bilgi çıkarımı ile ERD'lerin doğru ve kaliteli üretimini amaçlar. Ek olarak, bu değerlendirme, varlık, öznitelik ve ilişkilerin tespitinde sırasıyla 0.96, 0.93 ve 0.92 f1 puanı almış, bileşen özelliklerinin çözümlenmesinde ise doğru diyagram varlıklarının özelliklerini bulmada sırasıyla 0.87, 0.84 ve 0.91 doğruluk oranını elde etmiştir. Elde edilen bu bulgular, metinden ERD çıkarma konusunda ilerlemeye katkı sağlayıp ve dahi çözümün sağlamlığını ve kullanılabilirliğini artırmak için gelecekteki araştırmalar için yönergeler ve çözümler önerir. NLP tekniklerinin ERD oluşturma ile birleştirilmesi ve yazılım geliştirme yaşam döngüsünü geliştirmenin potansiyelini vurgulayarak metinden bilgi çıkarma alanına da yeni araştırma olanakları sunar.

Özet (Çeviri)

As software systems continue to grow in complexity, the need for efficient and accurate design methodologies becomes increasingly critical. Entity-Relationship Diagrams (ERDs) provide a powerful visual representation of system structures and dependencies, serving as a foundation for software engineering and database design. However, manually creating ERDs from textual requirements is time-consuming and manual. To address this challenge, this research explores the application of natural language processing (NLP) techniques to automatically extract relevant information from unstructured text and generate ERDs. The proposed approach leverages the strengths of rule-based techniques, semantic analysis, and machine learning algorithms to automatically identify entities, attributes, relationships, and cardinalities from natural language input. Our study offers practical insights into the utilization of linguistic and semantic analysis, and machine learning for efficient information extraction. The proposed system aims to streamline the ERD creation process and improve the accuracy and quality of the resulting diagrams. While the proposed approach shows promising results, the limitations in heuristic rule coverage and data dependencies are acknowledged. Furthermore, the evaluation results demonstrate in detecting entities, attributes, and relations, with f1-scores of 0.96, 0.93, and 0.92, and resolving the components specifications achieved an accuracy of 0.87, 0.84, and 0.91, respectively. The findings contribute to advancing ERD extraction from text and suggest future research directions for improving the robustness and usability of the solution. The fusion of NLP techniques with ERD creation highlights the potential for enhancing the software development lifecycle and opens new avenues for research in the realm of information extraction from natural language text.

Benzer Tezler

  1. Bulut üretim için endüstri 4.0'da bir kolektif farkındalık sistemi

    A collective awareness system for cloud manufacturing in industry 4.0

    GÖZDE KIRAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Endüstri ve Endüstri MühendisliğiHacettepe Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    PROF. DR. MURAT CANER TESTİK

  2. Development of a GIS-based monitoring and management system for underground mining safety

    Yer altı madenciliği emniyetiyle ilgili coğrafi bilgi sistemleri tabanlı bir izleme ve işletme sisteminin geliştirilmesi

    SEDA ŞALAP

    Yüksek Lisans

    İngilizce

    İngilizce

    2008

    Jeodezi ve FotogrametriOrta Doğu Teknik Üniversitesi

    Jeodezi ve Coğrafi Bilgi Teknolojileri Ana Bilim Dalı

    DOÇ. DR. MAHMUT ONUR KARSLIOĞLU

    DR. NURAY DEMİREL

  3. Yapılacak işler yaklaşımı ile sistem tasarımı

    System design with jobs to be done approach

    GONCA ÖZDEN

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    Endüstri Mühendisliği Ana Bilim Dalı

    DOÇ. DR. BAŞAR ÖZTAYŞİ

  4. Mimari formun evrim anlatısı: Canlı form hali

    The evolution narrative of architectural form: The state of vital form

    BETÜL UÇKAN

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Mimarlıkİstanbul Teknik Üniversitesi

    Mimarlık Ana Bilim Dalı

    PROF. DR. PELİN DURSUN ÇEBİ

    PROF. DR. FATMA AHSEN ÖZSOY

  5. Kamu kurumlarında risk değerlendirme rehberi

    Risk assessment guide in public institutes

    ELİF GÜLCE TOK

    Yüksek Lisans

    Türkçe

    Türkçe

    2018

    Mühendislik BilimleriÇankaya Üniversitesi

    İş Sağlığı ve Güvenliği Ana Bilim Dalı

    YRD. DOÇ. DR. BENHÜR SATIR