Geri Dön

Ham verilerin genetik algoritmalarla ilişkisel veritabanlarına dönüştürülmesi ve bir uygulama

Converting raw datasets to relational databases using genetic algorithms and an application

  1. Tez No: 462916
  2. Yazar: EMRE AKADAL
  3. Danışmanlar: DOÇ. DR. MEHMET HAKAN SATMAN
  4. Tez Türü: Doktora
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Dokümantasyon ve Enformasyon, Computer Engineering and Computer Science and Control, Documentation and Information
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2017
  8. Dil: Türkçe
  9. Üniversite: İstanbul Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Enformatik Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 199

Özet

Ham veriler, veriye özel tasarlanmış bir veri yapısı sayesinde etkin biçimde saklanabilir ve işlenebilirler. İlişkisel veritabanları, Codd (1970) tarafından ortaya atılan, verinin daha küçük tablolar (varlıklar) içerisinde ifade edilmesiyle birlikte veri tekrarını en aza indirebilen; veriyle ilgili işlemlerde performansı arttırabilecek bir veri saklama yöntemidir. Elektronik tablo biçiminde saklanan bir veri setinin, ilişkisel veritabanı formuna getirilmesi işlemine normalizasyon adı verilmektedir. Normalizasyon, verinin normal formlara getirilmesiyle uygulanmaktadır. Ancak normal formlar ile birlikte gelen ve uyulması gereken kurallar, sezgisel ve öznel kararlara bağlı olarak uygulandığı için tasarımcıya göre farklılık gösterebilmektedir. Bu sebeple her zaman en iyi ilişkisel veritabanı tasarımına ulaşılamayabilir. Bu durum, normal form kurallarının sistematik ya da otomatik olarak uygulanmasının zorluğunu göstermektedir. Literatürde normalizasyon işleminin otomatik olarak gerçekleştirilebilmesiyle ilgili çeşitli çalışmalar bulunmaktadır. Ancak bu çalışmaların ortak dezavantajı, kullanıcıdan fonksiyonel bağımlılıkların talep ediliyor olmasıdır. Fonksiyonel bağımlılıkların hatalı belirlenmesi, ilişkisel veritabanı tasarımının hatalı oluşturulmasına sebep olabileceği için sürecin otomatik hale getirilmesindeki zorluk, varlığını korumaktadır. Bu tez çalışması kapsamında normalizasyon işlemi bir optimizasyon problemi olarak ele alınmıştır. Amaç fonksiyonu, normalizasyon tanım ve kuralları gözetilerek önerilmiştir. Literatürdeki çalışmalardan farklı olarak bu çalışmada kullanıcıdan herhangi bir bilgi istenilmemekte, verilen ham veri setine karşılık ilişkisel veritabanı tasarımı önerisi sunulabilmektedir. Uygulama, seçilen 20 veritabanının veri setine dönüştürüldükten sonra önerilen algoritmanın tekrar aynı tasarımı önermesi beklenerek gerçekleştirilmiştir. Uygulama sonuçları, algoritmanın başarılı bir şekilde ilişkisel veritabanı tasarımı önerisi sunabileceğini göstermiştir.

Özet (Çeviri)

Raw datasets can be stored and processed through a specific modelled data modal. Relational database, suggested by Codd (1970), is a data management method that can minimize the redundant parts of data thanks to the identification of the data in smaller tables (entities) and increase the performance in data-related processes. The process of converting a data set stored in electronic table form into relational database form is called normalization. Normalization is applied by converting the data into normal forms. However, since the rules arising from the normal forms and to be followed are applied depending on intuitive and subjective decisions they can vary according to the designer. Therefore, the best relational database design cannot always be achieved. This indicates the difficulty of applying normal form rules systematically or automatically. In literature, there are various studies regarding the automatic execution of the normalization process. However, the common disadvantage of these studies is that they demand functional dependencies from the user. Since the determination of functional dependencies incorrectly causes the incorrect design of the relational database, the difficulty in automatizing the process preserves its existence. Within the scope of this thesis study, normalization process was discussed as an optimization problem. The objective function was proposed by considering the definition and rules of normalization. Unlike the studies in the literature, in this study no information is demanded from the user and a relational database design suggestion can be offered in response to the given raw data set. The application was performed after the selected 20 databases were turned into data set with an expectation that the proposed algorithm results the same design again. The application results showed that the algorithm could successfully put forward a relational database design proposal.

Benzer Tezler

  1. Gemi taşımacılığında veriye dayalı yakıt tüketimi optimizasyonu

    Data driven fuel consumption optimization of vessels

    TARIK TAŞPINAR

    Yüksek Lisans

    Türkçe

    Türkçe

    2022

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Üniversitesi-Cerrahpaşa

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. ZEYNEP ORMAN

  2. Büyük boyutlu veriler için metasezgisel yöntemler ile öznitelik indirgemede yeni bir yaklaşım geliştirilmesi

    Developing a new approach to feature selection with metaheuristic methods for large scale data

    ESİN AYŞE ZAİMOĞLU

    Doktora

    Türkçe

    Türkçe

    2023

    Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya Üniversitesi

    Bilgisayar Mühendisliği Ana Bilim Dalı

    DOÇ. DR. NİLÜFER YURTAY

  3. İnfertil erkeklerde paternal kalıtımla ilişkili endog geninin analizi

    Analysis of the endog gene associated with paternal inheritance in infertile men

    MEHMET ULAŞ BİLİR

    Yüksek Lisans

    Türkçe

    Türkçe

    2023

    Genetikİstanbul Üniversitesi

    Moleküler Biyoloji ve Genetik Ana Bilim Dalı

    PROF. DR. TUBA GÜNEL

  4. Veri madenciliği ve bir uygulaması

    Data mining and an application on data mining

    LEMAN PINAR YILDIRIM

    Yüksek Lisans

    Türkçe

    Türkçe

    2005

    EkonometriDokuz Eylül Üniversitesi

    Ekonometri Ana Bilim Dalı

    Y.DOÇ.DR. ALİ KEMAL ŞEHİRLİOĞLU

  5. Multivariate and fuzzy clustering approaches to dynamic classification of traffic flow states

    Çok değişkenli ve bulanık yaklaşımlarla trafik akımının dinamik sınıflandırılması

    MEHMET ALİ SİLGU

    Yüksek Lisans

    İngilizce

    İngilizce

    2015

    Trafikİstanbul Teknik Üniversitesi

    İnşaat Mühendisliği Ana Bilim Dalı

    PROF. DR. HİLMİ BERK ÇELİKOĞLU