Geri Dön

Bir abonenin elektrik tüketim verilerinin veri madenciliği yöntemleri ile analiz edilmesi ve doğru tarifenin belirlenmesi

Analysis of electric consumption data by data mining methods and determining the right tariff

  1. Tez No: 700346
  2. Yazar: SEDA BALTA
  3. Danışmanlar: DOÇ. DR. CÜNEYT BAYILMIŞ
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2020
  8. Dil: Türkçe
  9. Üniversite: Sakarya Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Bilgisayar Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Belirtilmemiş.
  13. Sayfa Sayısı: 70

Özet

Her geçen gün hayatımızda daha çok yer edinen teknolojinin gelişmesi ile birlikte büyük veri hacmi, depolanması ve analizi gibi sorunlar ortaya çıkmaktadır. Teknolojinin gelişimi aynı zamanda elektriğe olan bağımlılığı da arttırmaktadır. Elektrik tüketiminin artması maliyet sorununu ortaya çıkarmaktadır. Bu sebeplerden dolayı bireyler optimum fayda-maliyet ilişkisini aramaktadır. Optimum fayda-maliyet ilişkisini bulabilmek için elde edilen büyük veriyi anlamlı hale getirmek gerekmektedir. Bu nedenle büyük veri analitiği için Apache Spark özel olarak geliştirilmiş platformdur. Apache Spark büyük veriler üzerinde çeşitli makine öğrenmesi algoritmaları kullanarak veri analizi yapılmasına olanak sağlayan bütünleşik bir hesaplama motorudur. Diğer bir veri analitiği sistemi olan Apache Kafka ise sistemler arasındaki entegrasyon problemlerine bir çözüm olarak geliştirilen, üreticiler ve tüketiciler arasında gerçek zamanlı iletişime olanak sağlayan bir mesajlaşma protokolüdür. Bu tezde, öncelikle kullanıcıların elektrik tüketim bilgilerini incelemek ve kullanıcılardan elde edilen tüketim verilerinin analizi için yazılım kontrollü akıllı priz geliştirilmiştir. Geliştirilen bu akıllı priz aracılığıyla elde edildiği varsayılan 5000 adet kullanıcının elektrik tüketim verisi Türkiye'de varolan elektrik faturalandırma sistemine göre incelenerek, kullanıcıya en uygun tüketici tipi seçimi yapılmıştır. Tüketici tipi seçimi yapılırken, aynı veri seti ile Lojistik Regresyon kullanılarak iki farklı makine öğrenmesi uygulaması geliştirilmiştir. Uygulama-1'de Spark Structured Streaming ile gerçek zamanlı veri analizi yapılmaktadır. Uygulama-2'de ise Apache Kafka ile gerçek zamanlı veri analizi yapılmaktadır. Bu iki uygulama arasında yaklaşım ve kullanılan teknolojiler açısından farklılıklar bulunmaktadır. Uygulamalara göre elde edilen sonuçlar, önerilen mimarinin gerçek zamanlı veri analizi için kullanılabilir olduğunu göstermektedir.

Özet (Çeviri)

With the development of technology, which takes more place in our lives day by day, problems such as big data volume, storage and analysis arise. The development of technology also increases dependence on electricity. The increase in electricity consumption raises the cost problem. For these reasons, individuals seek the optimum cost-benefit relationship. To find the optimum cost-benefit relationship, it is necessary to make the big data obtained meaningful. Therefore, Apache Spark is a specially developed platform for big data analytics. Apache Spark is an integrated calculation engine that enables data analysis on large data using various machine learning algorithms. Apache Kafka, another data analytics system, is a messaging protocol developed as a solution to integration problems between systems, enabling real-time communication between producers and consumers. In this thesis, firstly, software controlled smart plug was developed to examine the electricity consumption information of the users and to analyze the consumption data obtained from the users. Developed this smart plug is obtained through the default data 5000's by examining the power consumption by the electricity billing system existing in Turkey are made optimum consumer type selection to the user. While selecting the consumer type, two different machine learning applications were developed by using Logistic Regression with the same data set. Real-time data analysis is performed with Spark Structured Streaming in Application-1. In application-2, real-time data analysis is performed with Apache Kafka. There are differences between these two applications in terms of approaches and technologies. Results obtained according to applications show that the proposed architecture is available for real-time data analysis.

Benzer Tezler

  1. Yeni bir yaklaşımla yük profillerinin oluşturulması ve dağıtım sistemlerinde teknik kayıpların tahmini

    A novel approach for load profile formation and technical loss estimation of electrical disrtibution systems

    GİZEM TULUN

    Yüksek Lisans

    Türkçe

    Türkçe

    2016

    Elektrik ve Elektronik Mühendisliğiİstanbul Teknik Üniversitesi

    Elektrik Mühendisliği Ana Bilim Dalı

    PROF. DR. ÖMER USTA

  2. Şırnak ilinde hibrit enerji ile beslenen ev modeli

    Hybrid energy housing model in Şırnak province

    MEHMET SİNAN NOHUT

    Yüksek Lisans

    Türkçe

    Türkçe

    2019

    EnerjiFırat Üniversitesi

    Enerji Sistemleri Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ AYDIN DİKİCİ

  3. Investigation of the most suitable location finding techniques for İstanbul in gsm 1800 network

    İstanbul'da gsm 1800 şebekesinde en uygun yer bulma tekniklerinin araştırması

    VELİ MURAT ÇELİK

    Yüksek Lisans

    İngilizce

    İngilizce

    2006

    Elektrik ve Elektronik MühendisliğiBoğaziçi Üniversitesi

    Elektronik ve Haberleşme Mühendisliği Ana Bilim Dalı

    PROF. DR. SELİM ŞEKER

  4. Bilgisayarın telefon bağlantısı yapabilmesi için elektronik bir ara devre dizaynı

    A Circuit designed and constructed to make the telephone communication easy and quick

    NEDİM İSKENDER

    Yüksek Lisans

    Türkçe

    Türkçe

    1992

    Elektrik ve Elektronik MühendisliğiGazi Üniversitesi

    PROF. DR. DOĞAN ÇALIKOĞLU