Data-driven process mining for production line optimization using IIOT and big data technologies
IIOT ve büyük veri teknolojileri kullanılarak veri odaklı süreç madenciliği ile üretim hattı uygulaması
- Tez No: 945928
- Danışmanlar: PROF. DR. ALP ÜSTÜNDAĞ
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Endüstri ve Endüstri Mühendisliği, Computer Engineering and Computer Science and Control, Industrial and Industrial Engineering
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: İngilizce
- Üniversite: İstanbul Teknik Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Veri Mühendisliği ve İş Analitiği Ana Bilim Dalı
- Bilim Dalı: Büyük Veri ve İş Analitiği Bilim Dalı
- Sayfa Sayısı: 107
Özet
Bu tez çalışması, üretim sistemlerinden toplanan gerçek zamanlı verilerin süreç madenciliği teknikleriyle analiz edilmesini sağlayacak bir metodoloji geliştirmeyi amaçlamaktadır. Endüstri 4.0 vizyonu doğrultusunda üretim hatlarında artan dijitalleşme, sahadan elde edilen yüksek frekanslı ve yapılandırılmamış verilerin daha etkin analizini gerekli kılmaktadır. Özellikle PLC, sensör, MES ve ERP sistemlerinden gelen ham sinyallerin işlenebilir bir formata dönüştürülmesi ve süreç performansı, sapmalar ve darboğazların analiz edilebilmesi için yapılandırılmış olay günlüklerine dönüştürülmesi kritik bir adımdır. Bu bağlamda tezde önerilen metodoloji; veri toplama, ön işleme, olay günlüğü oluşturma ve süreç madenciliği algoritmalarının uygulanması olmak üzere dört ana adımdan oluşmaktadır. Geliştirilen yöntem, hem ayrık hem de sürekli üretim sistemlerine uygulanabilir olacak şekilde esnek ve ölçeklenebilir bir yapıya sahiptir. Süreç madenciliği uygulamalarının farklı üretim yapılarındaki başarımlarını değerlendirmek amacıyla biri kesikli, diğeri sürekli üretim karakteristiği gösteren iki ayrı vaka çalışması yürütülmüştür: bir sos üretim hattı ve bir kauçuk karışım üretim hattı. İlk vaka çalışması olarak ele alınan sos üretim hattı, İstanbul Teknik Üniversitesi Rockwell Automation laboratuvarında yer alan sistemler ile kurulmuş ve gerçekçi endüstriyel koşulları taklit edecek şekilde yapılandırılmıştır. Bu süreç; hammadde kabulü, öğütme, tanklara aktarma, pişirme, dolum ve paketleme gibi adımlardan oluşmaktadır. Her üretim emri, kullanıcı girişleri, kalite kontrol noktaları ve üretim adımlarındaki makinelerden gelen sinyaller ile takip edilmiştir. Bu yapı sayesinde gerçek zamanlı veriler toplanarak süreç madenciliği için kullanılabilecek detaylı bir olay günlüğü oluşturulmuştur. Veri toplama süreci, IIoT mimarisiyle bütünleşik bir şekilde kurgulanmıştır. MQTT protokolü kullanılarak kullanıcı komutları, sensör verileri ve üretim emirleri, Ethernet/IP protokolü üzerinden PLC'lere aktarılmış ve eş zamanlı olarak PostgreSQL tabanlı bir veritabanına kaydedilmiştir. Bu yapı sayesinde tüm sistem katmanlarında gecikmesiz ve kayıpsız veri akışı sağlanmıştır. Ayrıca JSON formatı sayesinde mesajlar anahtar-değer yapısında zenginleştirilmiş ve çok katmanlı bilgi tek bir aktarımda elde edilmiştir. Bu yaklaşım, süreç madenciliği açısından oldukça esnek ve modüler bir veri yapısı sunmuştur. Sos üretim sürecine dair toplanan veriler, hem klasik ProM yazılımı hem de tez kapsamında geliştirilen ProsB aracı kullanılarak analiz edilmiştir. ProM ortamında uygulanan Log Skeleton yöntemi ile süreç yapısının genel iskeleti çıkarılmış, eksik veya atlanan adımlar görsel olarak tespit edilmiştir. Özellikle bazı üretim örneklerinde malzeme yükleme adımının sistemde kaydedilmediği görülmüş ve bu durumun sistem tasarımı ya da kullanıcı müdahalelerinden kaynaklandığı anlaşılmıştır. Bu bulgular, süreçteki yapısal zayıflıkların tanımlanması ve önleyici aksiyonların belirlenmesi açısından kritik değer taşımaktadır. Alpha Miner algoritması ile süreç akışı Petri net modeli olarak çıkarılmış ve üretim adımlarının sırasal yapısı değerlendirilmiştir. Modelde, sürecin başlangıçtan sonlandırmaya kadar genel olarak lineer ve tutarlı bir şekilde ilerlediği gözlemlenmiştir. Ancak bazı durumlarda, ürün yükleme onayı alınmadan sonraki adıma geçildiği tespit edilmiştir. Bu durum, süreç kontrol noktalarının yeterince güvenli olmadığını ve sistemin kritik adımlarda doğrulama mekanizmasından yoksun olduğunu göstermektedir. Süreç kalitesi ve müşteri memnuniyeti açısından bu tür sapmaların ortadan kaldırılması önerilmektedir. Gecikme analizi için ise z-score tabanlı bir yöntem uygulanmış ve her üretim olayının ortalama süresine göre sapma miktarı hesaplanmıştır. Özellikle başlangıç seviyesindeki adımlarda ciddi gecikmeler gözlemlenmiş ve bu durum sistem darboğazı olarak değerlendirilmiştir. Süreç ortalarında yer alan farklı yüksek sapma değerleri gözlemlenmiş, süreç boyunca tekrar eden gecikme eğilimleri ortaya konmuştur. Bu analizler, süreçlerdeki performans dengesizliklerinin belirlenmesinde önemli katkılar sunmuştur. Bu analizlere ek olarak, ProsB adlı özel geliştirilen araç sayesinde olay dizileri grafiksel olarak skeleton yapısında gösterilmiş, atlanan düğümler ve atlanan geçişler görsel olarak belirlenmiştir. Gecikmeli olaylar tablolar halinde sunulmuş, istatistiksel olarak anlamlı sapmalar işaretlenmiştir. ProsB, bu yönüyle kullanıcı dostu bir arayüzde hızlı analiz imkânı sağlamış ve klasik ProM çıktılarının yorumlanmasını desteklemiştir. Geliştirilen analiz yapısı, sadece yapısal değil aynı zamanda davranışsal performans değerlendirmesi yapılmasına da olanak tanımaktadır. Süreç adımlarının ne kadar sürede gerçekleştiği, hangi olayların tekrarlandığı ya da eksik kaydedildiği gibi konular, süreç modeli bütünlüğü içinde değerlendirilebilmiştir. Bu özellik, özellikle yarı otomatik ve kullanıcı müdahalesi içeren üretim sistemlerinde süreç görünürlüğünü artırmakta ve optimizasyon önerileri geliştirmeyi mümkün kılmaktadır. Kauçuk üretimi üzerine gerçekleştirilen ikinci vaka çalışması ise daha çok sürekli üretim karakteristiği sergileyen, analog sinyallerin ön planda olduğu ve daha az insan müdahalesiyle yürütülen bir üretim sürecini temel almaktadır. Bu süreçte, ERP sisteminden gelen tarif bilgisine göre hammadde dozajlama, Banbury tipi mikserde karıştırma, ardından iki aşamalı mil makineleriyle inceltme ve son olarak soğutma işlemleri gerçekleştirilmiştir. Her adımda üretim olayları zaman damgalı olarak kaydedilmiş, üretim başlangıç ve bitiş anlarıyla beraber toplam çevrim süresi hesaplanabilir hâle getirilmiştir. Bu üretim hattında veri toplama süreci, Unified Namespace mimarisi ile gerçekleştirilmiştir. Bu yapı sayesinde; PLC, operatör paneli, SCADA sistemi, tarif modülü ve sensörlerden gelen tüm sinyaller MQTT protokolü ile tek bir veri havuzunda mantıksal olarak hiyerarşik biçimde birleştirilmiştir. Her üretim adımı,“factory1/line1/compounding/station2/temperature”gibi belirli bir konu başlığı altında toplanarak hem erişim hem de analiz kolaylığı sağlamıştır. Bu sayede zaman serisi verileri eksiksiz bir şekilde veritabanına aktarılmıştır. Toplanan bu sinyaller ham hâlleriyle doğrudan süreç madenciliği analizlerinde kullanılamayacağından, Python tabanlı özel bir yapılandırma fonksiyonu geliştirilmiştir. Bu fonksiyon her üretim partisine özgü olay kimliği (case ID), faaliyet etiketi (activity label), zaman damgası ve ürün kodu ekleyerek olay günlükleri oluşturmuştur. Bu sayede her bir üretim partisi için“Karıştırıcı Hamur Üretimine Başladı”gibi adımlar kronolojik olarak sıralanabilmiş, süreç madenciliği algoritmalarına uygun bir veri seti elde edilmiştir. Kauçuk üretimi süreci için Alpha Miner ve Heuristic Miner algoritmaları kullanıldığında, elde edilen modellerin büyük oranda sıralı ve yapısal olarak tutarlı olduğu görülmüştür. Süreç adımları belirli bir sırayı takip etmiş, her partide mikserden başlayıp Mill 2 çıkışına kadar aynı düzen korunmuştur. Bu durum, sürekli üretim yapılarının doğası gereği süreç modellemesinde daha yüksek yapısal bütünlük sunduğunu göstermiştir. Ancak süreç süresi bazında yapılan analizlerde bazı önemli farklılıklar ortaya çıkmıştır. Zaman temelli performans analizleri sonucunda, özellikle belirli üretim partilerinde işlem sürelerinin ortalamalara kıyasla \%50 ila \%100 oranında daha uzun sürdüğü gözlemlenmiştir. Bu tür sapmaların \%10 ila \%15 oranında tekrar ettiği tespit edilmiştir. Analizler, bu sapmaların büyük ölçüde ani operatör müdahaleleri ve ekipman performans düşüşlerinden kaynaklandığını ortaya koymuştur. Üretim sürecindeki bu varyasyonlar, yapısal modelde görünmemekle birlikte performans bazlı analizlerle ortaya çıkarılmıştır. Bu anomalileri daha detaylı analiz edebilmek adına, Fuzzy Miner algoritması ile varyant kümelenmesi yapılmıştır. Elde edilen kümelerde bazı grupların süreç adımlarını oldukça tutarlı zamanlarda tamamladığı, diğerlerinin ise büyük varyasyonlar gösterdiği anlaşılmıştır. Bu ayrımlar sayesinde sadece yapısal değil, davranışsal olarak da süreç içi farklılıklar saptanmış, iyileştirme için hedeflenebilir alanlar belirlenmiştir. Süreç madenciliği algoritmalarının karşılaştırmalı değerlendirmesi sonucunda, her algoritmanın farklı üretim yapıları için belirli avantajları ve sınırlılıkları olduğu ortaya konmuştur. Heuristic Miner, sık tekrarlanan yolları başarılı şekilde modellese de, nadir varyantlarda yetersiz kalmıştır. Fuzzy Miner, karmaşık ve gürültülü verileri soyutlayarak daha sade bir yapı sunsa da, bu durum bazen detaylı yorumlamayı zorlaştırmıştır. Alpha Miner, kural tabanlı süreçlerde güçlü bir yapı ortaya koyarken, beklenmeyen davranışları modellemek konusunda sınırlı kalmıştır. LFM4 algoritması ise dallanma içeren yapıları doğru şekilde gösterse de, görsel karmaşıklık nedeniyle yorumlama zorluğu doğurmuştur. Tez kapsamında geliştirilen ProsB aracı, hem performans hem de yapısal analizlerde kullanılmış, sürece özgü olayların analizini sade bir arayüz üzerinden sağlamıştır. Skeleton grafikleri ile sürecin genel iskeleti çıkarılmış, atlanan adımlar ve gecikmeli olaylar istatistiksel olarak tespit edilmiştir. Özellikle z-score tabanlı analizler, standart dışı zamanlamaları belirlemiş ve kullanıcıya detaylı tablo çıktılarıyla sunulmuştur. Bu yönüyle ProsB, geleneksel araçlara göre daha esnek, hafif ve yorumlanabilir bir süreç analitiği aracı olmuştur. Genel olarak, bu tez çalışması IIoT ve büyük veri temelli bir mimarinin süreç madenciliği ile entegrasyonu sonucu, hem ayrık hem de sürekli üretim sistemlerinde süreç analizinin nasıl yapılabileceğini göstermiştir. Üretim hattı boyunca gerçek zamanlı görünürlük kazandırılarak darboğazlar, atlanan adımlar ve davranışsal sapmalar somut olarak ortaya konmuş, bu durum veri temelli sürekli iyileştirme fırsatlarını da beraberinde getirmiştir. Ayrıca her iki vaka özelinde elde edilen analiz çıktıları, süreç kontrol tasarımı, kaynak planlaması ve karar destek sistemleri açısından önemli geri bildirimler sunmuştur. Sonuç olarak, bu çalışma sadece akademik bir uygulama sunmakla kalmamış, aynı zamanda endüstride uygulanabilir, modüler ve ölçeklenebilir bir süreç madenciliği metodolojisi ortaya koymuştur. Büyük veri teknolojileriyle desteklenen bu yapı, hem performans analizi hem de yapısal doğrulama için güçlü bir temel sağlamış, özellikle Endüstri 4.0 çerçevesinde dijital dönüşüme katkı sunacak uygulamalar için örnek bir model olmuştur. Bu yönüyle çalışma, üretim süreçlerinde anomali tespiti, süreç tasarımı değerlendirmesi ve performans optimizasyonu gibi çeşitli alanlarda doğrudan kullanılabilecek bir altyapı sunmaktadır.
Özet (Çeviri)
In the face of increasing complexity in modern manufacturing, which is driven by rapid technological innovation, globalization, environmental sustainability requirements, and the growing demand for customized products, industrial organizations are transitioning toward smarter, more flexible, and data-driven production systems. Despite this shift, the vast volume of unstructured and high-frequency data generated at the shop floor level, originating from programmable logic controllers, sensor networks, manufacturing execution systems, and enterprise resource planning platforms, continues to present considerable challenges for process-level analysis and operational decision-making. This thesis addresses these challenges by proposing a hybrid methodology that integrates Industrial Internet of Things technologies and large-scale data processing infrastructures with process mining techniques. The aim is to convert raw machine-level signals into structured event logs, which can then be analyzed to model, evaluate, and optimize production processes more effectively. The proposed methodology is composed of four principal components: industrial data acquisition, data preprocessing, structured event log creation, and the application of multiple process discovery algorithms. It is designed to be scalable and adaptable across both discrete and continuous production environments. By applying this approach, the study aims to identify inefficiencies, detect behavioral anomalies, and uncover weaknesses in process control logic. To assess the practical applicability of the methodology, two contrasting industrial scenarios were selected as case studies: one representing a batch-based, semi-automated sauce production system and the other a continuous rubber compounding line. These cases were chosen specifically for their different production characteristics, offering a comprehensive view of the flexibility and limitations of process mining in diverse industrial settings. In the discrete sauce production scenario, digital process signals were captured from a simulated semi-automated line using the Message Queuing Telemetry Transport protocol. These signals were transformed into structured event logs using Python-based processing tools. The analysis focused on detecting structural inconsistencies such as skipped steps and improper event transitions. These issues were successfully identified through the use of the Log Skeleton and Alpha Miner algorithms. In addition, delay patterns were quantitatively evaluated using standard z-score calculations, which revealed significant bottlenecks particularly during the early phases of the production flow. These analytical insights were visually reinforced using ProsB, a custom-developed software tool that enables anomaly detection and performance profiling through graph-based process visualizations. In contrast, the rubber compounding process exhibited a highly consistent structural flow but demonstrated considerable variation in task durations. In this case, the data was collected using a Unified Namespace architecture, an Industrial Internet of Things framework that facilitated the hierarchical integration of operator inputs, machine state information, and enterprise planning data. Time-based performance analysis revealed that certain production sequences took significantly longer to complete, with delays observed in approximately ten to fifteen percent of the production cycles. These delays were not related to specific product types but were instead caused by irregular operator interventions and temporary reductions in machine efficiency. To better understand this behavioral variability, Fuzzy Miner was used to cluster similar execution patterns and identify outlier cases. This analysis demonstrated how process mining could go beyond structural modeling to provide insight into real-time operational behaviors and performance deviations. To further evaluate the effectiveness of the process discovery tools, four algorithms were compared across both case studies: Alpha Miner, Heuristic Miner, Fuzzy Miner, and All Operators Miner. The comparative analysis revealed that each algorithm had distinct advantages depending on the production scenario and data characteristics. Heuristic Miner produced clear and interpretable models for common process paths but lacked sensitivity to rare or noisy behaviors. Fuzzy Miner was more adept at abstracting complex and variable process flows, although it occasionally reduced model transparency. Alpha Miner, which builds formal Petri net representations, was useful for strict conformance checking but less suitable for capturing behavioral flexibility. All Operators Miner provided a deeper modeling capability for branching and probabilistic behavior but resulted in more complex visual models that may challenge interpretability. These findings suggest that a hybrid approach, tailored to the characteristics of each process and data type, is necessary for achieving optimal results in industrial process discovery. In summary, this research demonstrates that the integration of process mining techniques with Industrial Internet of Things-based data collection and big data analytics constitutes a powerful framework for increasing operational transparency, efficiency, and responsiveness in manufacturing environments. The hybrid methodology developed and validated in this thesis proved effective across both discrete and continuous production scenarios. It facilitated the detection of structural deficiencies, identification of performance bottlenecks, and classification of behavioral variability in real-world and simulated process settings. By enabling the transformation of raw production data into actionable insights, the study supports key goals of Industry 4.0, such as real-time monitoring, continuous improvement, and data-driven decision-making. The contributions of this work are both practical, in terms of industrial applicability, and theoretical, offering a methodological foundation for future research in intelligent process optimization and digital transformation.
Benzer Tezler
- Pertübasyon yöntemi ile hassas veri güvenliğine yönelik çok değişkenli veriler için tahmin analizi
Prediction analysis for multivariate data with respect to sensitive data security using the perturbation method
İLKER İLTER
Yüksek Lisans
Türkçe
2023
Endüstri ve Endüstri MühendisliğiSakarya ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
DOÇ. DR. SAFİYE SENCER
- Fuzel alkollerinden asetat esterleri üreten reaksiyonlu distilasyon prosesinin inceloenmesi ve kontrolü
Başlık çevirisi yok
HALİL İBRAHİM TANRIVERDİ
- Tek silindirli içten yanmalı bir motorda sıkıştırma ve yanma periyodlarının bilgisayarla modellenmesi
Başlık çevirisi yok
MURAT EMİROĞLU
- Teknoloji fırsat keşfi için veri odaklı çözüm yaklaşımlarının geliştirilmesi
Development of data-driven solution approaches for technology opportunity discovery
ZÜLFİYE ERDOĞAN
Doktora
Türkçe
2024
Endüstri ve Endüstri MühendisliğiYıldız Teknik ÜniversitesiEndüstri Mühendisliği Ana Bilim Dalı
PROF. DR. SERKAN ALTUNTAŞ
PROF. DR. TÜRKAY DERELİ
- İklimlendirme sistemleri üzerinde makine öğrenmesi ile anomali tespiti
Anomaly detection with machine learning on air conditioning systems
REFİK KİBAR
Yüksek Lisans
Türkçe
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve KontrolSakarya ÜniversitesiBilgisayar Mühendisliği Ana Bilim Dalı
DR. ÖĞR. ÜYESİ MUHAMMED FATİH ADAK
DR. ÖĞR. ÜYESİ KEVSER OVAZ AKPINAR