2023, müzik yapay zeka yılı: metinden sese ve mükemmel şarkı için metin arama

Adanali

Member


  1. 2023, müzik yapay zeka yılı: metinden sese ve mükemmel şarkı için metin arama

Mannheim’dan bir DeepTech şirketi olan Cyanite, serbest metin aramalarına dayalı olarak kitaplıklarda ve kataloglarda müzik bulan bir arama motoru geliştirdi. Stable Diffusion, Midjourney veya DALL E gibi AI sanat programlarından bilindiği gibi, sorgulama doğal dilde yapılır. Teknoloji, bir öneri motorunun ötesine geçer, arama motorunun ayrıca daha uzun metin girişleri için uygun müzik parçaları önermesi gerekir. Birkaç olası senaryo vardır:


Kısa sahneleri tanımlayabilir, müzik özetleri yükleyebilir veya bir müzik parçası için fikir yazabilirsiniz. Cyanite, API erişimi yoluyla uygun başlıkların bir listesini oluşturur. İstekler farklı şekillerde yapılandırılabilir, giriş dili İngilizce’dir: “Ormanda güneşli bir gün”, bir film için müzik bulmaya yönelik daha karmaşık bir senaryo açıklaması kadar mümkündür: “Kuzey Amerika’da çılgın bir şehir , karanlık ruh halindeki insanlarla dolu, vahşi ve çürüme ile çevrili, kıyamet öncesi ortam ve deniz yakında sahip çıkacak.”


Ücretsiz metin arama ile müzik veritabanlarında arama yapın


Bu test istemiyle, yazı işleri ekibi, bazıları açıklanan ruh haline çok iyi karşılık gelen, geçici Spotify önerileri aldı. Liste, dosya adına ek olarak tempo, ton ve tür ile (şarkı söyleme durumunda) vokal profili hakkında bilgi sağlar. Metin ipucunun melankolik havasına uygun olarak, ipuçlarının çoğu bir minör tondadır. Public Memory, “Afterlife” ve Juju & Jordash, “Almost” kulağa özellikle uygun geliyordu: gruplardan parçalar ve yazara yabancı bir tür (elektro dans). Muhtemelen onları kendisi bulamazdı.




API'nin Arkasında: Cyanite'in yapay zeka destekli müzik araması, Serbest Metin Araması



Cyanite’nin müzik arama motoru, daha uzun bir doğal metin düzeniyle eşleşen başlıkları listeler (bir test çalışmasından ekran görüntüsü).



Müzik Endüstrisi: “Mükemmel Şarkıyı Bulun”


Schwarzer, “Mükemmel şarkıyı bulun”un son yıllarda ayrı bir (B2B) iş alanı haline geldiğini de sözlerine ekledi. Tipik kullanımları sorulduğunda, oyun geliştirme, stok müzik (stok görüntülerin eşdeğeri), film ve televizyon, reklamcılık ve markalaşmadan alıntı yaptı. Kendisi, bu dünyanın müziğini “anlayan ve öğüt veren” bir “müzik zekası”ndan söz eder. En basit ifadeyle, Cyanite’nin arama motoru, Spotify gibi büyük kataloglardan veya kendi müzik arşivlerinizden ve veritabanlarınızdan şarkı bulmaya yarayan bir programdır. Cyanite, bu havuzdan metin girişi için uygun başlık listeleri oluşturur.


Size Pandora’yı hatırlatmıyor mu? Sadece ilk bakışta: Cyanite CEO’su Markus Schwarzer sorulduğunda, öneri algoritmalarında paralellikler var, diye açıkladı. Öte yandan ABD müzik önerileri platformu, son müşterilere (B2C) odaklanan bir akış ve öneri hizmetidir ve kendi müzik akışı veritabanıdır – ve lisanslama nedenleriyle Pandora şu anda Avrupa’da mevcut değildir. Cyanite bir akış kataloğu sunmaz, ancak teknolojinin amacı, arama motoru kullanıcılarının büyük kitaplıklarında ve kataloglarında hızlı bir şekilde arama yapmasına olanak tanımaktır. Bir videoya ya da sinematik bir fragmana eşlik edecek belli bir ruh haline, duruma uygun müzik adlarını bulmak, müzikal deneyime değil, senaryonun formülasyonuna bağlı olmalıdır. Arayüz doğal dildedir.






(Resim: ymgerman/shutterstock.com)


Cyanite.AI, 2018 yılında Joshua Weikert (CTO), Jakob Höflich (CMO) ve Markus Schwarzer (CEO) tarafından Mannheim’da kuruldu. Teknoloji şirketi, yapay zeka destekli sınıflandırma ve metin girişi yoluyla müzik arama için yazılım sunuyor. Mannheim merkezli şirket kendi müzik kataloğunu sağlamaz, ancak büyük müzik kitaplıklarına sahip olan ve profesyonel veya özel nedenlerle bunlardan en iyi şekilde yararlanmak isteyen şirketler ve bireyler için bir araç sağlar.

Ses teknolojisi ve müzik endüstrisinde uzmanlık


Weikert, Müzik ve Yaratıcı Endüstrilerde Master of Arts derecesine sahip bir yazılım geliştiricisidir, daha önce açık inovasyon projelerinde teknik müzik yapımcısıydı. Kibar, daha önce birçok müziği elle etiketlemek zorunda kalan bir radyo editörü ve gazetecidir. Schwarzer iş dünyasından (iş idaresi) geliyor ve ayrıca Müzik ve Yaratıcı Endüstriler okudu, daha önce Lenny Kravitz, Kings of Leon ve Daft Punk gibi müzisyenler için müzik PR kampanyaları oluşturdu ve müzik endüstrisindeki iş modelleri üzerine özel bir kitap yayınladı. Springer-Verlag ile.

Üç kurucu, Pop Academy Mannheim’da (“müzik endüstrisinin WHU’su”) okuduklarından birbirlerini tanıyorlar. Roman Gebhardt, yapay zeka ve veriler (AI Chief Officer) uzmanı olarak gemide. Gebhardt, TU Berlin’de ses ve iletişim teknolojisi alanında yüksek lisans derecesine sahip bir elektrik mühendisidir ve bu alanda doktoraya başlamıştır ve müzik teknolojisi üzerine araştırmalar yapmaktadır.







Etiketler, lisanslar, yayıncılar – büyük müzik kataloglarını açın


Teknik olarak, arama motoru bir dönüştürücü modele dayalıdır ve benzer bir mimari, yapay zeka görüntü üreteçleri veya ChatGPT gibi araçlar için de kullanılır. Cyanite eğitimli Transformer modelleri, müzik incelemeleri gibi karmaşık müzik açıklamalarıyla kullanıldı ve yapay zeka sistemini her türlü şarkı sözüne uygun müzik önerecek şekilde eğitti. Yeni olan, yazılımın sabit sınıflar yerine serbest metni işleyebilmesi ve metin içindeki anlamsal ilişkileri anlayıp onu müziğe atayabilmesidir. Arka uçta üç arama modu arasından seçim yapabilirsiniz: serbest metin girişi, benzerlik araması veya anahtar kelime araması.

Mannheim merkezli şirkete göre, akıllarında daha az özel birey var, ancak esas olarak müzik ve eğlence endüstrisini (B2B) hedefliyorlar ve bu endüstriyi müşterilerine müzik önerileri ve proje çalma listeleri sunmak için kullanabiliyorlar – büyük müzik şirketleri daha fazla yapay zeka destekli arama ile açılabilen büyük ve geniş repertuar Arşivlerine sahip olması muhtemeldir. Sorulduğunda, Markus Schwarzer birkaç önemli müşterinin adını verdi: BMG, Schubert Music, Hollanda’dan Brilliant Classics, Kanada’dan Nettwerk Music Group gibi müzik yayıncıları ve plak şirketleri, ABD ve Büyük Britanya’daki müzik pazaryerleri ve bazı müzik markaları. bazıları doğrudan portföyünüzde yerleşik serbest metin aramasını kullanır.

Kyanit: üç arama algoritmasını test edin


ABD’de yaşamadığımız için editörler şu anda Cyanite’in en iyi Pandora olup olmadığını söyleyemez – en azından mevcut. Cyanite şu anda öncelikle Anglo-Amerikan ülkelerinde temsil edilse de, hizmet ülkeye özgü kısıtlamalara tabi değildir. Bu nedenle, müziğe ilgi duyan kullanıcılar kendi kitaplıklarını açıyor ve müzik yayıncıları zaten kendi kamuya açık olmayan arşivlerini bahçeliyor. Dilerseniz, Cyanite web sitesindeki sağlayıcının web uygulamasında bir Spotify veritabanıyla ücretsiz metin aramayı deneyebilirsiniz – bunun için kayıt olmanız gerekir (çift katılım olmadığı için, kişisel verilerinizi sağlamanız gerekir. test ettiğimiz gibi ifşa etmeniz gerekmez). İlgili taraflar, müziklerini burada kapsamlı bir şekilde etiketleyebilir, meta veriler sağlayabilir, yapay zeka destekli bir tam metin açıklaması oluşturabilir ve üç arama algoritması arasından seçim yapabilir. Sağlayıcıya göre, ayda beş analiz ücretsizdir.

ayrıca oku

Daha fazla göster



daha az göster



Tahmin 2023: Hızlı şeritte AI müzik ve ses


Müzik yapay zekasının gelişimi de bu yıl son derece dinamik: Metin ve görüntü senteziyle geçen bir yılı, sesli yapay zeka projelerinde bir atılım takip ediyor. Text-to-Tunes ve Text-to-Audio yükselişte, metin hazır ayarlarıyla yaratıcı içerik oluşturmak, metin veya sanat makinelerinden (ChatGPT, Claude, Lumi, …) zaten tanıdık. Google’ın AudioLM ve MusicLM (şarkılar için bir tür “DALL E”) ve Çinli TikTok sağlayıcısı ByteDance’in Make-an-Audio’su gibi yeniliklerden sonra, teknik gelişme görünüşe göre o kadar ilerlemiştir ki, yapay zeka sistemleri artık belirli metni sesler oluşturmak için kullanabilir. ses materyali, ancak giderek daha fazla müzik yaratabiliyor veya insan seslerini taklit edebiliyor (metinden konuşmaya, örneğin VALL·E ile).

Şarkı sesleri oluşturmak için bir AI yöntemi olan SingGAN, 2021’de Çin’de zaten ortaya çıktı. Şimdi konuşma senteziyle çalışan ilk radyo istasyonları ve podcast’ler var (Haberler’nin bir meslektaşı “Kurz Infos” için sesini klonladı). İlk demolardan bazıları yoğun bir şekilde kullanılıyor ve sistemler daha da iyileştirildi. Bu arada, çıktı genellikle biraz rastgele ve kontrol edilemez görünüyor. Bu yeniliklerin tümü, müzik endüstrisinin lisansa dayalı temel işiyle rekabet edebilir, ancak aynı zamanda tüm müzik sahnesine zarar verebilir.

Ses AI geçmişi


İsviçreli geliştirici Flavio Schneider, yeni sürümleri belgelemek için GitHub’da (Audio AI Timeline) AI müzik projeleri için bir zaman çizelgesi içeren bir havuz oluşturdu. Schneider ayrıca müzik AI araştırmasında da aktiftir ve Ocak 2023’ün sonunda yayınlanmıştır. Moûsai, metin şablonlarından müzik oluşturmak için bir şablon zengin içerikle (AI Stable Difüzyon görüntü oluşturucu gibi, gizli difüzyona dayalıdır). Müzik ve AI ile ilgilenen herkes, sesli AI geçmişini takip edebilir ve bakımcıyı projeleri hakkında bilgilendirebilir.


(onun)



Haberin Sonu
 
Üst