Ses Tanımlama İşlemine Dikkat!

NETHANESİ 22 May 2017 Teknoloji 654  0

Gelişen teknoloji sayesinde parmak izi çok gerilerde kaldı. Şimdilerde bankalarda, kurumlarda vb. yerlerde göz tarama teknolojisi uygulanıyor. Operatörler tarafından ise ses tanıma teknolojisi kullanılıyor. Her ne kadar bunlar yararlı teknolojiler olsa da teknolojinin bazı zararları da olabiliyor.

Sesin DNA’sı Çıkarılabiliyor

Sadece bir dakikalık sesten sesin DNA’sını çıkaran teknoloji geliştiren Lyrebird adlı şirket bu sesin çeşitli yelerde kullanılabilmesini sağlayacak teknolojiler üzerinde de çalışmaya devam ediyor. Asıl işi geliştiriciler için konuşma sentez Teknolojileri geliştirmek olan şirket sadece bir dakikalık bir sesten herhangi birinin sesini kopyalayabiliyor ve kimin olduğunu tanımlayabiliyor.

Montreal merkezli Lyrebird’in bu konuda adım niteliğindeki buluşu ise sesin bir anahtar şeklinde kopyalanabilmesi.  Yalnızca 1 dakikalık bu ses kaydını aldıktan sonra kişinin ses DNA’sını eşsiz bir anahtar halinde sıkıştıran API kullanılıyor. Daha sonra ise bu anahtarı kullanarak o sesten herhangi bir diyalog oluşturulmasını sağlayabiliyor.

Bir Dakikalık Ses Kaydı Yeterli

Bu teknolojide en çok dikkat çeken nokta ise ses tanıma için herhangi biz özel kelimeler söylenmesi ya da seslerin tanınmasını sağlayacak bir tanıma sürecinden geçirilmeyecek olması. Konuşmacı kişinin farklı tonlamalar yaparak bazı kelimeler söylemesine de ihtiyaç yok. Herhangi bir konuşma sırasında söylediğiniz alelade sözlerin kaydedilmesi bile yeterli. Üstelik analiz edilmesi gereken uzun uzadıya kayıtlara da ihtiyaç yok. Bir dakika süren herhangi bir konuşma ile sesinizin anahtarı çıkarılabiliyor.

Sesinize Efekt Bile Yapılabiliyor

Çıkarılan bu ses anahtarı sayesinde sadece sizin sesinizin oluşturulması değil, aynı zamanda sesinize tonlama yapılması dahi mümkün. Sezinizin kızgın, endişeli veya mutlu çıkarılması da mümkün. Nasıl ki resimlerde PhotoShop yaparak olduğundan farklı görünümler elde edebiliyorsak, burada da bir nevi sese efekt yaparak sesin farklı şekillerde çıkması sağlanıyor.

Lyrebird tarafından geliştirilen bu teknoloji kullanılarak ünlü kişilerin sesleri üzerinde analizler yapılıp, yeni konuşmalar hazırlanarak denemeler yapılıyor. Bu denemelere şahit olanlar ise şaşkınlıklarını gizleyemiyor.

Diğer Tüm Çalışmalar Geride Kaldı

Daha önce bu konuda benzer çalışmalar yapılmış olsa da bu kısa süreli ses kaydıyla sonuç alınan bir çalışmaya henüz rastlanılmamıştı. Lyrebird API’si bulut tabanlı olması yönüyle benzer çalışmalar arasından kendisini gösteriyor. Şirketin bazı birimleri 1000 cümleyi yarım saniyeden daha az sürede oluşturarak rakiplerine fark atıyor.

Dikkat! Kötüye Kullanılabilir

Bu teknoloji devrim niteliğinde olsa da endişeleri devamında getiriyor. Seslerin taklit edilerek kötü niyetli olarak kullanılması da ihtimal dahilinde. Bu teknolojinin yaygınlaştırılmasının kontrollü bir şekilde gerçekleşmesini düşünenlerin yanı sıra, bu teknoloji alelade bir hal alırsa zaten kimse itibar etmeyecektir diye düşünenler de var. Yine de bu teknoloji kullanılmaya başlanırken dikkatli olmakta fayda var.

Bu teknolojinin sağladığı faydalardan biri ise ses bana ait değil diyenlerin artık bunu dayandırabilecekleri bir teknoloji olması.

WhatsApp’ta Paralı Gruplar Yaygınlaşıyor
Babalar Günü İçin Alınabilecek Teknolojik Hediyeler
Samsung Health Uygulaması Hakkında Bilinmesi Gerekenler
VLC İçin Pratik Kısayollar

Yorum Yapmayı Unutmayın :)