Geri Dön

The complex network analysis of the education network of employees

Çalışanların eğitim ağının karmaşık ağ analizi

  1. Tez No: 815086
  2. Yazar: CEYDA KOCAMAN
  3. Danışmanlar: DR. ÖĞR. ÜYESİ GÜNCE KEZİBAN ORMAN
  4. Tez Türü: Yüksek Lisans
  5. Konular: Bilim ve Teknoloji, Science and Technology
  6. Anahtar Kelimeler: Belirtilmemiş.
  7. Yıl: 2023
  8. Dil: İngilizce
  9. Üniversite: Galatasaray Üniversitesi
  10. Enstitü: Fen Bilimleri Enstitüsü
  11. Ana Bilim Dalı: Akıllı Sistemler Mühendisliği Ana Bilim Dalı
  12. Bilim Dalı: Akıllı Sistemler Mühendisliği Bilim Dalı
  13. Sayfa Sayısı: 83

Özet

Teknoloji ve veri bilimindeki gelişmeler birçok alanı olumlu yönde etkilemektedir. Bu alanlardan biri de eğitimdir. Öğrenme analitiği, öğretme ve öğrenmede mükemmelliğe ulaşmanın yeni yollarını geliştirme potansiyeline sahiptir. Şirketler, çalışanlarının eğitimi için öğrenme analitiği tekniklerini kullanmaya çalışmakta ve çalışan performansını artırmayı hedeflemektedir. Bu çalışmada Softtech çalışanlarının eğitim veri setleri kullanılmıştır. Softtech, Türkiye'de bir yazılım şirketidir ve bu veri setleri farklı teknik, teknik olmayan, çevrimiçi ve çevrimdışı eğitim türlerini içerir. Tüm veri setleri birleştirilir ve çalışanlar eğitimler aracılığıyla birbirine bağlanarak bir çalışan ağı oluşturulur. Bu çalışmada bir eğitim öneri sistemi oluşturmak amacıyla karmaşık ağ analizi, dinamik ve statik ağ analizi, bağlantı tahmini ve makine öğrenmesi teknikleri uygulanır. Çalışma, başlangıçta dinamik ağlarda topluluk tespiti ile başladı. Uygulama aşamasında gelindiğinde, verilerde COVID-19 pandemisinin etkisinin neden olduğu değişiklikler nedeniyle dinamik ağlarda topluluk tespiti için uygun olmadığı sonucuna varıldı. Bu nedenle çalışmada bağlantı tahmin yöntemi ile ilerlemeye karar verildi. Ancak ağ, kapsamlı bir şekilde dinamik bir ağ olarak incelenir. Yöntem bölümünde çalışmada kullanılan tüm yöntemler detaylı bir şekilde anlatılmıştır. Öncelikle dinamik ve statik ağların nasıl oluşturulduğu hakkında bilgi verilmektedir. Ardından karmaşık bir ağın analizi için gerekli olan tüm mikro, makro, mezo ve zaman serilerinin analizine ilişkin bilgiler paylaşılmaktadır. Analizlerde kullanılan tüm parametrelerin açıklamaları verilmiştir. Ağların oluşturulması ve analizi hakkında bilgi verildikten sonra bağlantı tahmin yöntemleri ile ilgili literatür taraması paylaşılmıştır. Daha sonra bağlantı tahmini için kullanılacak makine öğrenmesi algoritmaları ve bu algoritmalara ait performans değerlendirme metrikleri hakkında bilgiler paylaşılmıştır. Son olarak, çalışanların eğitim ağı için makine öğrenimi tabanlı bağlantı tahmini konusunda bir şablon oluşturularak yöntem aşaması tamamlanır. Uygulama kısmına gelindiğinde ise öncelikle dinamik ağlar oluşturulmaktadır. Bu dinamik ağlar, yöntem bölümünde açıklanan yöntemlerle analiz edilir ve sonuçlar paylaşılır. Ocak 2017'den Aralık 2021'e kadar 5 yıllık bir döneme ait veriler mevcuttur. Bu veri kümeleri aylık olarak ayrıştırılarak dinamik ağlar oluşturulur. Sonunda toplam 59 aylık ağ dosyası elde edilir. Ağlar, her ağ dosyasından oluşturulur. Çalışanların eğitim ile birbirlerine nasıl bağlandıkları ve bu bağlantıların değişimi aylık olarak görselleştirilir. 2017 yılına ait görseller fikir vermesi amacıyla paylaşılır. Sırasıyla, her ağ için makro, mikro ve mezo analizler yapılır. Bu analiz sonuçlarına dayanarak, her bir ağın düğüm sayıları, bağlantı sayıları, ağ yapıları, merkeziyet ölçüleri ve topluluk yapıları görselleştirilir. Derecesi en yüksek düğüm, arasındalık merkeziliği en yüksek düğüm, aynı topluluğa ait düğümler gibi bilgilere bu görsellerden ulaşılabilir. Bu bilgilerin bir kısmı fikir vermesi amacıyla paylaşılır. Zaman serisi analizi bölümünde her bir parametre zaman içinde incelenir ve geleceğe yönelik öngörülerde bulunup bulunamayacağı kontrol edilir. COVID-19 pandemisinin etkisi burada açıkça görülür. Karantina döneminde tüm çalışanların evden çalışması, COVID-19 pandemisi sırasında eğitim alan çalışan sayısında (düğüm sayısı) ve eğitim sayısında (bağlantı sayısı) artışa neden olur. Düzenli bir dağılımın olmadığı için tahmin konusunda başarılı sonuçlar görülmez. Ayrıca, 2018 yılının Ağustos ayındaki düğüm (eğitim alan çalışanlar) sayısındaki ani düşüş, zorunlu toplu izin dönemine işaret etmektedir. Verileri analiz edip inceledikten sonra bağlantı tahmin süreci başlatılır. Ham veriler, yeni oluşturulan eğitim sözlüğü ve yeni oluşturulan statik ağ yapısı açıklandıktan sonra, bağlantı tahmin yöntemleri sırayla uygulanır. Toplam 15 farklı bağlantı tahmin yöntemi uygulanmaktadır. 2021 yılına kadar olan veriler eğitim verisi, 2021 yılı verisi ise test verisi olarak kullanılmaktadır. Bu işlemler hem eğitim hem de test verileri kullanılarak gerçekleştirilir. Çıktı dosyası, 15 yönteme karşılık gelen 15 öznitelik içerir. Çıktı dosyası ayrıca ağdaki düğümler arasında bir bağlantı olup olmadığını gösteren bir etiket özniteliği içerir. Bağlantı tahmini sonuçlarından bazıları fikir vermesi açısından paylaşılmıştır. En nihayetinde, her biri 21 sütun ve 222778 satır içeren, biri eğitim verileri ve diğeri test verileri için olmak üzere iki ayrı çıktı dosyası oluşturulur. Bir önceki adımda oluşturulan çıktı dosyaları, makine öğrenimi adımında girdi dosyaları olarak kullanılır. XGBoost, gradyan artırma, rastgele orman, lojistik regresyon, destek vektör makineleri ve çok katmanlı algılayıcılar gibi makine öğrenimi algoritmaları kullanılarak tahmin yapılmaya çalışılır. Doğruluk, kesinlik, hatırlama ve F1 puanı değerleri incelenerek modellerin doğruluğu karşılaştırılır. Bu değerlerin sonuçları tablolarda paylaşılır. Model için farklı tercihler yapılabilir ancak genel olarak tutarlılığı dolayısıyla destek vektör makinesi daha tercih edilebilir görünüyor. Tüm değerleri %98'den büyüktür. Makine öğrenmesi tabanlı bağlantı tahmin yönteminin çalışmamızda kullanılabileceği sonucu ortaya çıkmıştır. Verimize uygulanabilir olduğu ve sonuçların kullanılabilir olduğu görülmektedir. Nasıl geliştirilebilir konusu ele alınmıştır. Sonraki aşamada bağlantılara eğitim bilgileri de kaydedilebilir. Bağlantının gücü, alınan ortak eğitim sayısına göre değerlendirilebilir. Çalışmayı daha farklı yöntemlerle ilerletmek ve geliştirmek mümkündür.

Özet (Çeviri)

The advances in technology and data science affect many fields positively. One of these fields is education. Learning analytics have the potential to develop new ways of achieving excellence in teaching and learning. The companies try to use learning analytics techniques for their employees' education and aim to improve employee performance. The education data sets of Softtech employees are used in this study. Softtech is a software company in Turkey, and those data sets include different types of technical, non-technical, online, and offline education. All data sets are combined, and an employee network is created by connecting employees via education. In this study, complex network analysis, dynamic and static network analysis, link prediction, and machine learning techniques are applied with the aim of creating an education recommendation system. The study initially began with community detection in dynamic networks. During the application phase, it was concluded that due to the changes caused by the impact of the COVID-19 pandemic in the data, it was not suitable for community detection in dynamic networks. Therefore, it was decided to proceed with the link prediction method in the study. But the network is extensively examined as a dynamic network. In method section, all the methods used in the study are explained in detail. Firstly, information about how dynamic and static networks are generated is provided. Subsequently, information regarding the analysis of all micro, macro, meso, and time series required for the analysis of a complex network is shared. Descriptions of all the parameters used in the analyses are provided. After the information about network generation and analysis, a literature review on link prediction methods is shared. Afterwards, information regarding machine learning algorithms to be used for link prediction and performance evaluation metrics for these algorithms are shared. Finally, the method stage is completed by creating a template for machine learning-based link prediction for the education network of employees. When it comes to the application part, dynamic networks are firstly created. These dynamic networks are analyzed using the methods described in the method section, and the results are shared. There is data available for a period of 5 years, from January 2017 to December 2021. These data sets are separated on a monthly basis to create dynamic networks. At the end, a total of 59 monthly network files are obtained. Networks are generated from each network file. The connections between employees in relation to their education and the evolution of these connections are visualized on a monthly basis. Visuals from the year 2017 are shared to provide an idea. Sequentially, macro, micro, and meso analyses are conducted for each network. Based on these analysis results, the node counts, link counts, network structures, centrality measures, and community structures of each network are visualized. Information such as the node with the highest degree, the node with the highest betweenness centrality, and the nodes belonging to the same community can be accessed from these visualizations. Some of this information is shared to provide an idea. In the time series analysis section, each parameter is examined over time, and it is checked whether predictions can be made for the future. The impact of the COVID-19 pandemic is evident here. During the quarantine period, all employees work from home, resulting in an increase in the number of employees receiving education (node count) and the number of education sessions (link count) during the COVID-19 pandemic. Due to the lack of a regular distribution, successful results are not observed in terms of prediction. Additionally, the sudden decrease in the number of nodes (employees receiving education) in August 2018 indicates a period of mandatory collective leave. After analyzing and examining the data, the link prediction process is initiated. After explaining the raw data, the newly created education dictionary, and the newly generated static network structure, link prediction methods are applied in sequence. A total of 15 different link prediction methods are applied. Data until 2021 is used as training data, and data for 2021 is used as test data. These operations are performed using both training and test data. The output file contains 15 attributes corresponding to 15 methods. The output file also includes a label attribute indicating whether there is a connection between nodes in the network. Some of the connection prediction results are shared for illustrative purposes. Ultimately, two separate output files are generated, one for the training data and one for the test data, with 21 columns and 222778 rows each. The output files generated in the previous step are used as input files in the machine learning step. Prediction is being attempted using machine learning algorithms such as XGBoost, gradient boosting, random forest, logistic regression, support vector machines, and multilayer perceptron. Accuracy, precision, recall, and F1 score values are being examined to compare the accuracy of the models. The results of these values are shared in tables. Different preferences can be made for the model, but generally, support vector machine seems to be more preferred due to its consistency. All of its values are greater than 98%. The results indicate that the machine learning-based connection prediction method can be used in our study. It is observed that it is applicable to our data, and the results are usable. The subject of how to improve it is addressed. In the next stage, education information can also be recorded on the connections. The strength of the connection can be considered based on the number of shared education received. It is possible to advance and improve the study with different methods.

Benzer Tezler

  1. Ortaölçekli firmalarda kalite kontrol sistemi

    Quality control system in middle scale firms

    TAMER YUVAKURAN

    Yüksek Lisans

    Türkçe

    Türkçe

    1991

    İşletmeİstanbul Teknik Üniversitesi

    PROF.DR. AYDIN AYDINCIOĞLU

  2. Exploring opinions of corporate instructional designers on their professional development and training needs

    Kurumsal öğretim tasarımcılarının mesleki gelişim ve eğitim ihtiyaçları konusundaki görüşlerinin araştırılması

    NAZLI GÖKALP

    Yüksek Lisans

    İngilizce

    İngilizce

    2025

    Eğitim ve ÖğretimOrta Doğu Teknik Üniversitesi

    Eğitim Programları ve Öğretimi Ana Bilim Dalı

    DR. ELİF ÖZTÜRK

  3. Yeraltı madencilik sektörü mesleki güvenlik risk analizi

    Occupational safety risk analysis in underground mining sector

    FATMA YAŞLI

    Doktora

    Türkçe

    Türkçe

    2020

    Endüstri ve Endüstri Mühendisliğiİstanbul Teknik Üniversitesi

    İşletme Mühendisliği Ana Bilim Dalı

    DOÇ. DR. HÜR BERSAM BOLAT

  4. Factors influencing the successful development of hospitality Smes: A study of independent hotels in North Cyprus

    Konaklama Kobi'lerinin başarı gelişimini etkileyen faktörler: Kuzey Kıbrıs'ta bağımsız oteller üzerine bir araştırma

    SENEM YAZICI YILMAZ

    Doktora

    İngilizce

    İngilizce

    2010

    TurizmUniversity of Surrey

    Turizm İşletmeciliği Ana Bilim Dalı

    PROF. DR. PETER JONES

  5. Antecedents and consequences of cyber security awareness: A case study for maritime sector

    Siber güvenlik farkındalığının öncülleri ve sonuçları: Denizcilik sektörü için bir vaka çalışması

    GİZEM YÜKSEL

    Yüksek Lisans

    İngilizce

    İngilizce

    2019

    Denizcilikİstanbul Teknik Üniversitesi

    Deniz Ulaştırma Mühendisliği Ana Bilim Dalı

    DR. ÖĞR. ÜYESİ PELİN BOLAT