Scaling forecasting algorithms using clustered modeling
Kümeleme modellemesi tabanlı ölçeklenebilir tahminleme algoritmaları
- Tez No: 335618
- Danışmanlar: DOÇ. DR. HAKAN FERHATOSMANOĞLU
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Bilim ve Teknoloji, Computer Engineering and Computer Science and Control, Science and Technology
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2013
- Dil: İngilizce
- Üniversite: İhsan Doğramacı Bilkent Üniversitesi
- Enstitü: Mühendislik ve Fen Bilimleri Enstitüsü
- Ana Bilim Dalı: Bilgisayar Mühendisliği Bölümü
- Bilim Dalı: Belirtilmemiş.
- Sayfa Sayısı: 63
Özet
İstatistiksel tahminleme konusunda yapılan araştırmalar geleneksel olarak daha çok verilen zaman serisi için daha doğru modeller oluşturmaya odaklanmaktadır. Bu modeller verimlilik ve ölçeklenebilirlik kısıtlarından dolayı sadece sınırlı sayıda zaman serisine uygulanabilmektedir. Ancak, Müşteri İlişkileri Yönetimi (MİY) ve Müşteri Deneyimi Yönetimi (MDY) gibi bazı kurumsal uygulamalar büyük veri seti üzerinde çalışabilen ölçeklenebilir tahminleme gerektirmektedir. Örnek olarak, telekomünikasyon ?rmaları müşterilerin ihtiyaçlarını ve davranışlarını anlamak veya müşteriye özel kampanya üretmek için her bir müşterinin ayrı ayrı tra?k yükünün tahminine ihtiyaç duyarlar. Tahminleme modelleri, gelir tahmini veya kaynak planlaması için gerekli olan toplam tra?k hacmi tahmininde toplu trak verisi üzerinde kolayca kullanılabilir. Bununla birlikte, çok sayıda kullanıcı için ayrı ayrı model oluşturmak çok fazla zaman aldığı için bu durumda tahminleme modelleri uygulabilirliğini yitirmektedir. Tahminleme sürecinin sürekli olduğu ve modellerin periyodik olarak güncellenmesi gerektiği durumlarda problem daha da içinden çıkılmaz hale gelmektedir. Biz bu çalışmada, birden fazla zaman serisi için tahminleme modellerini oluşturma ve sürekli bir şekilde güncelleme problemini ele almaktayız ve tahminleme için optimize edilmiş dinamik kümeleme modellemesini sunmaktayız. Çalışmada küme merkezleri için temsili model oluşturmayı ve bu modelleri tekrarlı doğrusal olmayan optimizasyon kullanarak her bir zaman serisine ayrı ayrı uygulamayı önermekteyiz. Öne sürülen yaklaşım, modelleme ve kümeleme işlemlerini eş zamanlı olarak yerine getirmekte, temsili modelleri her bir zaman serisine uygulayarak tahminleme yapmakta ve sürekli tahminleme süreci için model parametrelerini güncellemektedir. Elde ettiğimiz bulgular bireysel model davranışlarını kendi segment modeli üzerinden değerlendirmenin bireysel modeller hesaplamaya göre daha ölçeklenebilir ve daha doğru olduğunu göstermektedir. Gerçek bir telekom MİY uygulaması üzerinde yapılan deneyler, önerilen yöntemin her bir kişiyi ayrı ayrı modellemeye göre yüksek verimli, ölçeklenebilir ve daha doğru olduğunu ortaya koymaktadır.
Özet (Çeviri)
Research on statistical forecasting has traditionally focused on building more accurate models for a given time-series. The models are mostly applied only to limited data due to their limitation on eciency and scalability. However, many enterprise applications such as Customer Relationship Model (CRM) and Customer Experience Management (CEM) require scalable forecasting on large number of data series. For example, telecommunication companies need to forecast each of their customers' trac load individually to understand their needs and behavior, and to tailor targeted campaigns. Forecasting models are easily applied on aggregate trac data to estimate the total trac volume for revenue estimation and resource planning. However, they cannot be applied to each user individually as building accurate models for large number of users would be time consuming. The problem is exacerbated when the forecasting process is continuous and the models need to be updated periodically. We address the problem of building and updating forecasting models continuously for multiple data series and propose dynamic clustered modeling optimized for forecasting. We introduce representative models as an analogy to cluster centers, and apply the models to each individual series through iterative nonlinear optimization. The approach performs modeling and clustering simultaneously, makes forecasts by applying representative models to each data, and updates the model parameters for a continuous forecasting process. Our ndings indicate that understanding an individual's behavior within its segment's model provides more scalability and accuracy than computing the individual model itself. Experimental results from a real telecom CRM application show the method is highly ecient and scalable, and also more accurate than having separate individual models.
Benzer Tezler
- Essays on time series analysis of forecasting, structural breaks, and convergence.
Zaman serisi analizi, yapısal kırılmalar ve yakınsama üzerine denemeler.
HARUN ÖZKAN
- K- ortalamalar algoritması ile ileriye dönük modellemeler
Forecasting modellings based on K- means algorithm
KEMAL KOŞUTA
Yüksek Lisans
Türkçe
2018
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolYıldız Teknik ÜniversitesiMatematik Mühendisliği Ana Bilim Dalı
PROF. DR. AYLA ŞAYLI
- Dalgacık analizi kullanılarak optik fotoğraflardan bulutluluk oranı tayini
Cloudiness ratio determination from optic photographs using wavelet analysis
UĞUR BERKAY KAHVECİ
Yüksek Lisans
Türkçe
2018
Enerjiİstanbul Teknik ÜniversitesiEnerji Bilim ve Teknoloji Ana Bilim Dalı
DR. ÖĞR. ÜYESİ BURAK BARUTÇU
- Optimizasyon ve regresyon modelleri ile meteorolojik tahminleme denemesi
Experiment with meteorological forecasting using optimization and regression models
DİNCER ATASOY
Doktora
Türkçe
2023
MatematikIğdır ÜniversitesiMatematik Ana Bilim Dalı
DR. ÖĞR. ÜYESİ HASAN KARA
PROF. DR. ALİ FARAJZADEH
- Dalgacık dönüşümü kullanılarak zirai-meteorolojik verilerin hata teşhis ve tamiri
Fault diagnosis and repair of agricultural meteorological data using wavelet transform
NİGAR TUĞBAGÜL ALTAN
Yüksek Lisans
Türkçe
2012
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiBilgi Teknolojileri Ana Bilim Dalı
YRD. DOÇ. DR. B. BERK ÜSTÜNDAĞ