A case study on the use of AI-generated music in video game development
Video geliştirme sürecinde yapay zeka ile üretilen müziklerin kullanımına ilişkin bir vaka çalışması
- Tez No: 949560
- Danışmanlar: DR. ÖĞR. ÜYESİ OZAN SARIER
- Tez Türü: Yüksek Lisans
- Konular: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Bilim ve Teknoloji, Müzik, Computer Engineering and Computer Science and Control, Science and Technology, Music
- Anahtar Kelimeler: Belirtilmemiş.
- Yıl: 2025
- Dil: İngilizce
- Üniversite: İstanbul Teknik Üniversitesi
- Enstitü: Lisansüstü Eğitim Enstitüsü
- Ana Bilim Dalı: Oyun ve Etkileşim Teknolojileri Ana Bilim Dalı
- Bilim Dalı: Oyun ve Etkileşim Teknolojileri Bilim Dalı
- Sayfa Sayısı: 133
Özet
Video oyunu müzikleri ve sesleri günümüz oyunlarının ayrılmaz bir parçasıdır. Ancak video oyunları her zaman sesli değildi. Tıpkı sinemada olduğu gibi, oyunların ilk dönemleri de sessizce başladı. Daha sonra, teknolojik olanaklar geliştikçe, bip sesleriyle başlayan bu yolculuk zamanla tematik, sürekli, uyarlanabilir ve dinamik özellikler kazanarak müzikal bir kimlik oluşturdu. Müzikal kimliğe sahip oyun müziği, oyun atmosferini pekiştirerek oyuncunun duygusal bağ kurmasını ve oyunla etkileşiminin güçlenmesini sağlayan temel bir öge haline geldi. Teknoloji ve yapay zeka alanındaki son gelişmeler ise diğer yaratıcı alanlarda olduğu gibi müzik alanında da yapay zeka müzik araçlarının ortaya çıkmasına yol açtı. Oyun geliştirmenin giderek daha erişilebilir ve disiplinlerarası hale gelmesi ve geleneksel müzik üretim yöntemleri geliştiriciler için zaman, maliyet ve teknik kaynaklar açısından zorluklar yarattığı için bu araçların oyunlarda ses ve müzik üretim süreçlerine potansiyel entegrasyonu daha fazla ilgi görmeye başladı. Ancak bu yeni teknolojilerin üretim süreçlerine entegrasyonu hâlâ birçok belirsizliği beraberinde getirmektedir. Birçok çalışma yapay zeka modellerinin teknik kapasitesine veya yaratıcılıkla ilgili felsefi tartışmalara odaklanırken, geliştiricilerin bu araçları gerçek hayattaki oyun projelerinde nasıl kullandıklarını inceleyen çok az çalışma bulunmaktadır. Bu araçların nasıl etkin bir şekilde kullanılacağına dair geliştiriciler ve müzisyenler tarafından soru işaretleri ve belirsizlikler bulunmaktadır. Bu araştırma yapay zekayı bu alana entegre etmenin mevcut durumda nasıl olduğunu, sanatsal, teknik, profesyonel ve etik konularında nasıl algılandığını ve gelecekte nasıl bir yol izleyebileceğini incelemiştir. Dolayısıyla bu tez, video oyunu geliştirmede yapay zeka tarafından üretilen müziğin kullanımına ilişkin kapsamlı bir vaka çalışması sunmuş ve yapay zeka tabanlı müziğin kullanımını derinlemesine incelemeyi amaçlamıştır. Bu bağlamda bu tez ile literatürde nispeten yeni olan oyun müziği çalışmaları alanına hem akademik hem sektörel bir değerlendirmeyle katkıda bulunulmuştur. Literatür taraması yapılırken oyun müziği çalışmaları anlamına gelen ludomüzikoloji disiplininin tanımı, nereden geldiği ve temel ilkelerinden başlanarak oyun müziğinin tarihsel gelişimi ve dönüm noktaları anlatılmış ve bu disiplin çerçevesinde video oyunu müziğinin oyunlarda üstlendiği anlatı, yönlendirme ve atmosfer oluşturma gibi sahip olduğu işlevlerden bahsedilmiştir. Günümüzde müziğin oyunlarda nasıl bir yer edindiğine dair kapsamlı bir araştırma sunulmuştur. Bu tez çalışması, yapay zeka tarafından üretilen müzik araçlarının teknik yeteneklerini inceleyen bir gözlemsel ön çalışma ve oyun geliştirme profesyonellerinin deneyimlerini ve algılarını inceleyen yarı yapılandırılmış görüşmeleri içermektedir. Araştırma nitel araştırma olmak üzere iki aşamalı olarak tasarlanmıştır. İlk aşamada, pilot çalışma olarak yaygın bir şekilde kullanılan sinir ağları ve metin tabanlı yapay zeka müzik araçları olan Udio ve Suno.AI seçilerek gözlemsel bir ön çalışma yürütülmüştür. Bu araçlar ile bulmaca, aksiyon-macera ve korku olmak üzere üç farklı oyun türlerinde toplam on sekiz müzikal çıktı elde edilmiştir. Araçlar metin tabanlı olduğu için istenilen türde müzik elde edilebilmesi için istemler girilmiş ve bu istemler seçilen oyun türlerinin literatürde bahsedilen müzik gereksinimlerine göre oluşturulmuştur. Bulmaca türü için odaklanmayı ve sakin düşünmeyi destekleyen bir bulmaca seviyesi için minimal ortam arka plan müziği, aksiyon-macera türü için vuruşlu öğeler ve dramatik gerilim içeren hızlı tempolu aksiyon müziği ve korku türü için uyumsuz armoniler içeren gerilim ve heyecan yaratmak için ortam dokularıyla karanlık orkestral temayı yansıtan müziklerin elde edilmesini sağlaması planlanan istemler girilmiştir. Elde edilen çıktılar süre, BPM, tonalite, döngüsel yapı, duygusal, teknik ve tür uyumu gibi kriterler çerçevesinde analiz edilmiştir. Oyun müziklerinin genellikle döngüsel, etkileşimli olması ve uyarlanabilir bir şekilde tekrarlayıcı kullanımı gerekli olduğu için parçaların uzunluğu müziğin oyunun hangi bölümlerinde kullanılabileceğinin değerlendirilmesine yardımcı olmuştur. Müziğin hızının oyuncunun tempo ve enerji algısını etkilemesi sebebiyle elde edilen müziklerin BPM değeri seçilen türün ihtiyacı olan tempoya uygunluğunu belirlemiştir. Ton modlarının müziğin duygusal rengini şekillendirmesi sebebiyle elde edilen çıktıların minör, majör veya modal tonlarda olması müziğin sakinlik, heyecan, korku ve gerilim gibi duygulanımlarla ilişkilendirilmesini sağlamıştır. Müziğin armonik yapısının duygusal gelişime ve türe bağlılığa katkıda bulunması sebebiyle elde edilen müziklerin basit, kademeli veya karmaşık yapıda olması hangi tür oyun müziklerinde kullanılabileceğini belirlemiştir. Müziğin ritminin etkileşimi ve atmosferi etkilemesi sebebiyle oyun türleri ritmik yoğunluk açısından farklılık göstermesi, ritmin türe uygunluğunu belirlemiştir. Melodilerin karakterler veya mekanlarla anlatı ilişkisini destekleyerek kimlik ve akılda kalıcılık sağlaması sebebiyle melodide yer alan katmanlar incelenerek oyun türünün kimliğini ne kadar yansıttığı değerlendirilmiştir. Algılanan duygusal ifade, müziğin amaçlanan oyun ruh hallerini destekleyip desteklemediğini belirlemeye yardımcı olmuştur. Araçlar karşılaştırıldığında Udio aracının ücretsiz versiyonunun fikir üretme, ilham bulma, örnekleme gibi erken aşamada kullanıma, Suno.AI aracının ücretsiz sürümünün prototipleme ve test aşamasında kullanıma, Suno.AI aracının premium sürümünün ise bazı durumlarda final aşamasında daha işlevsel olduğu gözlemlenmiştir. Özellikle döngüsel müzik üretimi, duygusal ifade gücü ve ses kalitesi açısından premium sürümün daha başarılı olduğu görülmüştür. Ancak her iki aracın da manuel müdahale olmadan doğrudan oyun içinde final ürün olarak kullanılabilecek müzik üretiminin sınırlı olduğu sonucuna ulaşılmıştır. Bu pilot çalışma ile ana çalışma öncesinde bu araçların profesyonel oyun geliştirme süreçlerine entegre edilmesi ve hangi aşamalarda nasıl kullanılabileceğine dair ön fikirler elde edilmiştir. Araştırmanın ikinci aşamasında ise oyun sektöründe çalışan on bir kişi ile yarı yapılandırılmış görüşmeler gerçekleştirilmiştir. Katılımcı profili, video oyunu geliştiricileri, müzisyenler ve ses tasarımcılarından oluşmuştur. Görüşmeler esnasında katılımcılara, üretken yapay zeka tabanlı müzik araçlarıyla olan deneyimleri, hangi amaçlarla bu araçları kullanmayı tercih ettikleri, kullanım kararlarını neye göre aldıkları, profesyonel üretim süreçlerinde hangi aşamalarda faydalandıkları, bu araçlardan elde edilen müzikal çıktıları nasıl manipüle ettikleri, araçların teknik sınırlılıkları, yaratıcı sürece etkileri, özgünlük, telif hakkı ve etik gibi yasal konulardaki endişeleri ve oyun sektörüne uzun vadeli etkileri anlamaya yönelik önceden belirlenmiş sorular yöneltilmiştir. Görüşmelerden elde edilen veriler bilgisayar ortamında yazıya dökülmüş ve değerlendirilmiştir. Görüşmeler, ses kaydı alınıp yazıya döküldükten sonra katılımcıların karar ve davranışlarının altında yatan öznel anlamları ve bağlamsal yorumları anlamak ve görüşme verilerini yorumlamak için veriler tematik analize tabi tutulmuştur. Görüşme metinleri birçok kez okunarak önemli olarak vurgulanan tekrar eden düşünceler belirlenmiş, bu bulgular doğrultusunda kodlar oluşturulmuştur. Kodlar hem soruların yöneldiği alanlara göre altı farklı kategoriye ayrılmış hem de süreçte kendiliğinden ortaya çıkan benzer temalarla bütünleştirilerek sınıflandırılmıştır. Bulgulara göre katılımcıların büyük kısmını bağımsız oyun deneyimi bulunan kişiler oluşturmakla beraber bazılarının mobil, PC, VR ve AA oyun deneyimi olmuştur. En çok kullanın yapay zeka tabanlı müzik aracı Suno.AI aracıyken ElevenLabs ses tasarımı için büyük oranda kullanılmıştır. Katılımcılar yapay zeka araçlarını çoğunlukla fikir üretme, prototipleme ve atmosferik testler gibi erken aşamalarda kullandıklarını belirtmiştir. Kullanma kararlarını bu araçların özellikle bağımsız ekipler için hız, erişilebilirlik ve maliyet açısından avantajlar sağlamasının etkilediği iletilmiştir. Bazı katılımcılar bunların yanı sıra istedikleri enstrümanlara ulaşamamaları sebebiyle, bazıları müzikal bilgilerinin yetersiz olması, bazıları ise çıktıların kalitesinden ötürü kullandıklarına değinmiştir. Yapay zeka araçları ile müzik üretimi yapmadan önce karşılaştıkları zorluklar arasında zaman kaybı, istenilen modla müziğin eşleşmemesi veya oyunun temasıyla uyuşmaması, manuel bir şekilde seslerin sınıflandırılması ve etiketlenmesi, bestecilere istenilen müziğin doğru bir şekilde aktarılamaması ve müzikal bilginin yetersizliği gibi konulara değinilmiştir. Katılımcılar çoğunlukla atmosferik ve ambiyans müziği üretirken bunu takip eden müzik türleri bulmaca, savaş, epik, karakter teması, duysusal, semfonik vb. müzikler olmuştur. Yapay zeka araçlarını kullanırken araçların özellikleri arasında en çok metin girerek müzikal çıktı elde etme, müziği katmanlarına ayırma ve yeniden yorumlatma özellikleri yer almıştır. Katılımcılar araçlara girilecek istemleri belirlerken çoğunlukla ChatGPT gibi diğer yapay zeka araçlarından faydalanmış veya oyunun temasına ve duygusal içeriğine görer karar vermiştir. Bazı katılımcılar istemleri kelime bazlı bir şekilde basitleştirerek kullandığını, aksi takdirde aracın denilmek isteneni algılayamadığını belirtmiştir. Katılımcılar müzikal çıktıları olduğu gibi kullanamadığına ve manuel müdahaleler yapmaları gerektiğine değinerek bu müdahaleleri kesme, kırpma, ayrıştırma, sesin şiddetini ayarlama, yeniden yazma, tonu değiştirme, kusurları ve gürültüleri temizleme, hızı değiştirme ve döngülü bir hale getirme gibi eylemlerle örneklendirmiştir. Katılımcılar yapay zeka araçlarını geleneksel müzik besteleme yöntemleri ile karşılaştırdığında yapay zekanın robotik ve yapay hissettirdiğini, niş temalarda başarısız olduğunu, duygunun eksik olduğunu, insan müdahalesi eksikliği sebebiyle organik hissettirmediğini ve orijinalliğin az olduğunu belirtirken jenerik müzik üretiminde başarılı olduğuna ve hızlı prototiplemeyi sağladığına değinmiştir. Katılımcıların bazıları sanatsal ve teknik açıdan yapay zekayı başarılı ve ortalamanın üzerinde bulurken bazıları gelişmesi gerektiğini, kusurlarının olduğunu söylemiş, bazıları ise bu konuda güçlü bir fikir belirtmemeyi tercih etmiştir. Yapay zekanın insan yaratıcılığını kısıtlaması konusunda ise çoğunluk kullanıma ve kullanan kişiye bağlı olduğunu ifade etmiştir. Oyunun kimliğini ve duygusunu yakalama konusunda ise çoğunluk başarısız görürken, diğerleri koşullara bağlı olarak başarılı olduğunu ifade etmiştir. Katılımcıların çoğunun çalıştıkları kurumlardaki yöneticileri tarafından yapay zeka kullanımında desteklendiği ve özellikle oyun geliştiricisi, oyun tasarımcısı gibi ses ve müzik alanıyla mesleki olarak direkt ilişkili olmayan pozisyonlarda yaygın olduğu görülmüştür. Ancak genellikle müzisyen veya ses tasarımcısı olan katılımlarda veya çevrelerinde henüz yeterince desteklenmediği ve yaygın olmadığı anlaşılmıştır. Katılımcılar çoğunlukla yapay zekayı gelecekte sahip oldukları profesyonel iş alanlarında bir tehdit olarak değil yardımcı bir araç olarak gördüğünü belirtmiştir. Lisanslama, orijinallik ve telif hakları konusunda ise bir kısmı bu konulardan yapay zekanın sorumlu olduğunu, para karşılığı bir hizmet aldıklarını ve endişe duymadıklarını belirtirken, diğerleri bu konularda endişelerinin olduğunu veya belirsizlik hissettiklerini söylemiştir. Uzun vadede video oyunu geliştirme alanında yapay zeka tabanlı müziğin etkisi konusunda ise bağımsız oyun geliştiricileri için pozitif etkisi olacağına, özellikle ses efektleri ve dublaj konusunda daha hızlı ilerleyeceğine ve büyük stüdyolar için bir etkisi olmayacağına değinerek çeşitli fikirler öne sürmüşlerdir. Elde edilen çıktıların başka yapay zeka araçları ve programlar kullanmadan düzenlenememesi, araçların sadece kelime bazlı istemlerle düzgün çalışıp cümle olarak yazılanları anlamada sorun yaşaması, oyunun ihtiyaç duyduğu temanın ve atmosferin yapay zekaya istenildiği gibi aktarılamaması ve döngüsel müzik üretimindeki zorluklar gibi yapısal kontrol sınırlamaları yapay zeka araçlarının oyun müziği alanında kullanımını kısıtlamıştır. Ayrıca yasal konulardaki gri alanlar ve belirsizlikler katılımların bu çıktıları nihai ürün olarak kullanmada çekingen davranmasına sebep olmuştur. Bunların sonucunda katılımcılar genel olarak yapay zekayı tam prodüksiyon veya final aşamasında değil erken aşamalarda yardımcı, destekleyici ve tamamlayıcı bir araç olarak değerlendirmiştir. Dolayısıyla mevcut durumda bu araçlar sadece bir araç olmaktan öteye gidememiş, her ne kadar teknik olarak olabildiğince kusursuz müzik üretse de beslendiği kaynaklar sebebiyle oyun gibi niş temalar için müzik üretiminde yetersiz kalmıştır. Bu duruma çözüm olarak daha kapsamlı kaynaklarla beslenmesi ve müzik besteleme süreçlerinin mantığını anlayacak şekilde profesyonellere danışılarak eğitilmesi gerektiği önerilmiştir. Bu tez, yapay zeka destekli müzik üretiminin oyn geliştirme sürecine nasıl entegre olduğuna dair geliştirici odaklı bir bakış açısı sağlayarak literatüre ve oyun sektörüne katkıda bulunmuştur. Teknik yeteneklerin yanı sıra, çalışmanın geliştiricilerin üretim süreciyle etkileşimlerini ve yapay zeka ile kullanıcı deneyimini dikkate alması, insan-yapay zeka işbirliği hakkında veri sağlamıştır. Çalışma bu alanda bir başlangıç çalışması niteliğindedir ve gelişmeye açıktır. Az sayıda araç ve tür üzerinden pilot çalışma yapılması, nispeten sınırlı ve bir coğrafyadan katılımcıların olması ve yapay zeka teknolojilerindeki hızlı değişim çalışmayı sınırlamıştır. Bu sınırlamalar doğrultusunda çalışmanın sonunda gelecekte yapılacak araştırmalar için önerilerde bulunulmuştur. Daha fazla yapay zeka tabanlı müzik aracını veya bu araçlar üzerinde daha çeşitli oyun türlerini değerlendirmek, oyuncunun yapay zeka tarafından üretilen müzikle nasıl duygusal bir bağ kurduğunu irdelemek, yapay zeka tarafından üretilen müziğin geleneksel yöntemlerle üretilen müziğe kıyasla oyuna dalmayı nasıl etkilediğini araştırmak, yapay zekanın uyarlanabilir, etkileşimli ve dinamik müzik üretmede ne ölçüde başarılı olduğunu ölçmek, yapay zekanın etkileşimli ses motorlarına nasıl entegre edilebileceğine dair yöntemler geliştirmek, yapay zeka çıktılarının kullanımının etik ve yasal uygulamalarını değerlendirmek ve insan ve yapay zekanın hibrit bir şekilde çalışması için yapay zekanın nasıl eğitilebileceği yönünde araştırmalar yapmak önerilmiştir.
Özet (Çeviri)
This thesis presents a comprehensive case study on the use of AI-generated music in video game development, examining the role of music in depth. The study included both an observational preliminary study examining the technical capabilities of AI-generated music tools and semi-structured interviews examining the experiences and perceptions of game development professionals. Starting from the historical development of game music and the basic principles of ludomusicology, this research examined the artistic, technical, professional, and ethical dimensions of integrating AI into the video game development field. The research was conducted in two stages. In the first stage, a pilot study was conducted to evaluate the capabilities of existing AI music production tools, Udio and Suno.AI, to produce music for different game genres (puzzle, action-adventure, horror). By observing the performance of the produced music in terms of structural, emotional, technical, and genre harmony, preliminary ideas were obtained on integrating these tools into professional development processes. In the second stage, semi-structured interviews were conducted with eleven people working in the gaming industry. The thematic analysis method was used to analyze the experiences of video game developers and musicians regarding these tools, the purposes for which they prefer them, how they use them in professional production processes, their perceptions on the artistic, technical and creative process, their concerns about issues such as originality, copyright and ethics, and their thoughts on how their long-term impact on the gaming industry will be. According to the findings, AI music tools were primarily used by developers in the early stages, such as idea generation, prototyping, and testing. It was stated that these tools provided advantages, especially for independent teams, in terms of speed, accessibility, and cost. However, due to structural limitations in controlling the music, difficulties in producing cyclical music, and uncertainties about copyrights and originality, participants were hesitant to incorporate this music into their final products. Participants generally evaluated AI as an auxiliary, supportive, and complementary tool, stating that no system can replace human creativity. This thesis contributed to the literature by providing a developer-focused perspective on how AI-assisted music production integrates into the game development process. In addition to technical capabilities, the study's consideration of developers' interactions and user experience with AI provided data on human-AI collaboration. The limited number of tools, types and participants, and the rapid change in AI technologies limited the study. Future research should explore a broader range of AI music tools and game genres, examine how players emotionally connect with AI-generated music, evaluate its impact on immersion compared to traditionally composed music, assess its ability to produce adaptive, interactive, and dynamic soundtracks, investigate integration with interactive audio engines, and develop frameworks for ethical use, legal clarity, and hybrid human-AI collaboration in music production.
Benzer Tezler
- İstanbul'daki su isale hatlarının deprem risk analizi
Earthquake risk analysis of water transmission lines in İstanbul
EMİR EKREM BARUTÇU
Yüksek Lisans
Türkçe
2025
Jeodezi ve Fotogrametriİstanbul Teknik ÜniversitesiGeomatik Mühendisliği Ana Bilim Dalı
PROF. DR. HİMMET KARAMAN
- Earthquake damage detection with satellite imagery and deep learning approaches: A case study of the february 2023, Kahramanmaraş, Turkey earthquake sequence
Uydu görüntüleri ve derin öğrenme yaklaşımları ile hasar tespiti: 2023 şubat Kahramanmaraş, Türkiye deprem dizisinden bir vaka çalışması
FATMA ELİK
Yüksek Lisans
İngilizce
2023
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrolİstanbul Teknik ÜniversitesiUydu Haberleşmesi ve Uzaktan Algılama Ana Bilim Dalı
PROF. DR. ELİF SERTEL
- Terkos Gölünün su kalitesinin değerlendirilmesi için önyaklaşım
Başlık çevirisi yok
ÖZDEN DAVASLIGİL
Yüksek Lisans
Türkçe
1998
Çevre Mühendisliğiİstanbul Teknik ÜniversitesiÇevre Mühendisliği Ana Bilim Dalı
DOÇ. DR. ORHAN İNCE
- Yapay zekayla üretilen görsellerde grafik tasarım açısından etik ve intihal sorunları
Ethical and plagiarism issues in artificial intelligence-generated images in terms of graphic design
ISMİRİDA SHALA
Yüksek Lisans
Türkçe
2025
Güzel SanatlarOndokuz Mayıs ÜniversitesiGörsel İletişim Tasarımı Ana Sanat Dalı
DOÇ. DR. HÜLYA DEMİR
- İmalat sistemlerinin tasarlanması ve öncelik kurallarının belirlenmesinde yapay sinir ağlarının kullanılması
Başlık çevirisi yok
TARIK ÇAKAR
Doktora
Türkçe
1997
Mühendislik Bilimleriİstanbul Teknik Üniversitesiİşletme Mühendisliği Ana Bilim Dalı
PROF. DR. AYHAN TORAMAN