::D i k t e::
  
    KONUŞMA TEKNOLOJİLERİ
    ÜRÜNLER
•   Demo

 

 
KONUŞMA TANIMA
Konuşma tanıma (Speech Recognition), klavyeyi kullanmak yerine konuşarak komut vermenize ve konuşmalarınızın yazıya dönüştürülmesine olanak sağlayan bir teknolojidir. Bu teknolojiyi kullanarak, sadece sesinizle bilgisayarınızı kontrol edebilir ve yazılarınızı yazabilirsiniz.

KONUŞMA TEKNOLOJİLERİNİN ÖNEMİ NEDİR?
Konuşmak, insanlar için en doğal iletişim yöntemidir. Konuşma tanıma (Speech Recognition) ve yazı okuma (Text To Speech) teknolojileri bilgisayar kullanıcılarına pek çok alanda hız ve kolaylık sağlayacaktır.

ÇOK YÜKSEK KELİME KAPASİTELİ SÜREKLİ KONUŞMA TANIMA NEDİR?
“Çok Yüksek Kelime Kapasiteli Sürekli Konuşma Tanıma” (Very Large Vocabulary Continuous Speech Recognition) teknolojisi, kelimeler arasında duraklama yapmadan – doğal şekilde – yüz binlerce kelime kullanarak yaptığınız konuşmaların bilgisayar tarafından tanınarak yazıya dönüştürülmesini sağlar.

KONUŞMA TANIMA SİSTEMİNİN YAPISI NASILDIR?
DİKTE Sistemi, Eğitim (Training) ve Tanıma (Recognition) olmak üzere iki modülden oluşmaktadır. Her iki modül de kendi içinde Akustik ve Dil Bilgisi olmak üzere iki ana alt gruptan oluşur.

Konuşma Tanıma Sistemi yapısını görmek için tıklayınız.

Eğitim modülü öğrenme, tanıma modülü de algılanan sesi daha önceden öğrenilenler ile karşılaştırarak tanıma işlemlerini gerçekleştirirler. Eğitim ve Tanıma modüllerinin her biri kendi içinde “Akustik” ve “Dil Bilgisi” olmak üzere iki alt gruba ayrılır.

KONUŞMA TANIMA SÜRECİ NASIL GERÇEKLEŞMEKTEDİR?
Konuşma Tanıma süreci mikrofondan alınan sesin ADC (Analog Dijital Dönüştürücü) ile sayılara dönüştürülmesiyle başlar. Bilgisayar üzerinde ADC işlevini kullanmakta olduğunuz USB kulaklık gerçekleştirmektedir.
Bir ses algılama algoritması, sayısallaştırılan sinyali inceleyerek konuşmanın nerede başladığını ve bittiğini tespit eder. Algılanan konuşma parçası (segment) tanımada kullanılacak parametrelerin hesaplanması için çeşitli Sayısal Sinyal İşleme (Digital Signal Processing) algoritmalarından geçirilir. Bu algoritmalar dijital ses verilerinden – 15 – 20 msn aralıklarla – enerji, çeşitli frekans bantlarındaki ses şiddeti gibi parametreler çıkarır.

Konuşma Tanıma Süreci yapısını görmek için tıklayınız.

Tanıma algoritmaları, akustik olarak algılanan sese en çok benzeyen kelimeleri seçer ve her bir kelimenin yine akustik olarak olasılığını hesaplar.
Akustik değerlendirme sonucu seçilen aday kelimelerden hangilerinin gramer olarak uygun olduğu belirlenir, her birine bir gramer olasılığı atanır ve akustik değerlendirmenin işlemci yükünü azaltmak için sonraki kelimeler TriGram yapılar kullanılarak tahmin edilir.
Döngünün sonunda en yüksek olasılığı olan dizi, tanınan kelime dizisi olur Dizinin gerçekleşme olasılığı hesaplanırken, akustik olasılık ve gramer olasılığı birlikte değerlendirilir. Kelime listesinde olmasına rağmen TriGram yapılarda olmayan (sistem tarafından bilinmeyen) kelime dizilişleri de tanınabilir, fakat bu durumda tanıma başarısı daha düşük olacaktır. Hatalı tanınan kelime dizisini çak kolay bir şekilde birkaç saniye içinde sisteme öğretebilirsiniz.

KTM®:Konuşma Tanıma Motoru (Yöndata'nın ticari markasıdır.)
YOM®:Yazı Okuma Motoru (Yöndata'nın patentli ticari markasıdır.)

 
YönData Bilgisayar Ltd.Şti Ceyhun Atuf Kansu Cad. Beycanoğlu İş Merkezi A2 Blok No:104 Kat:3 Daire:10 06520 Balgat / ANKARA
Tel:+90 (312) 473 71 70 Fax:+90 (312) 473 75 86 E-Posta: dikte@dikte.com.tr
Copyright © 2008 Dikte