28.01.2007

Ses Sentezleme ve Tanıma Teknolojisi ile Neler Yapılabilir?

GVZ Ses Teknolojileri‘nin geliştirdiği ses işleme yazılımı Türkçe söylediğiniz herhangi bir şeyi dijital metine çevirebiliyor ve yazdığınız herhangi bir Türkçe metni seslendirebiliyor. Genelde santrallerde ve telefonla müşteri hizmetlerinde kullanılan bu sistemin başka pek çok ticari uygulaması var. Türkiye’de 444lü bir servise telefon ettiğinizde 3e bas 2ye bas yerine, bizle konuşan ve konuşarak komut alan robotlar genelde bu sistemi kullanıyor.

Ses tanıma sistemi aynı zamanda telefon dinleyerek konuşmaları analiz eden sistemlerde de kullanılabiliyor. Mesela polis telefonunuzu dinliyorsa –telekulak– dinlediklerini otomatik olarak bir veri tabanına aktarıp detaylı bir analiz yapabilir. Konuşmalar metne dönüştüğünden metin tarayıcı programlar ile çok kolay metin içinde arama yapılıp hakkınızda çeşitli örüntüler çıkartabilir.

Ses Tanıma Nasıl Çalışıyor? (PDF)
Ses Sentezleme Nasıl Çalışıyor? (PDF)

Voder Schema

İlk ses sentezleme sistemi Voder 1939 New York dünya fuarında tanıtıldı.

GVZ teknolojisi şu anda paralı ve açık değil. Eğer bu teknolojiyi kullanmak veya denemek istiyorsanız açık kaynaklı ses tanıma ve sentezleme Mbrola‘yi kullanabilirsiniz. Mbrola Türkçe tanıyabililyor.

Ses sentezleme ve tanıma bir çok işlemsel sanat ve tasarım işinde kullanılabilir. Mesela bir ortamdaki sesleri gerçek zamanda kaydedip tipografik bir kompozisyona çevirebilirsiniz, veya mikrofana söylenen bir kaç kelime otomatik olarak arama motorundan görseller bulup size getirdiğinde etkileşimli sinema yapabilirsiniz. Başka neler olabilir?

Etiketler

Geri beslemeler (Trackback)

Trackback Adresi
  1. düğümküme » Açık Kaynaklı Telefon Platformları
  2. Hayata dair her şey » Blog Arşivi » Açık Kaynaklı Telefon Platformları
  3. düğümküme » Esra Robot ile Sohbetler
  4. düğümküme » Bugünlerde Merak Ettiklerim

Yorum Yaz