1. 論ASR服務商提供的SDK、HTTP、MRCP服務:
  2. 寧衛通信
  3. 新聞動態
  4. 寧衛新聞
  5. 論ASR服務商提供的SDK、HTTP、MRCP服務

論ASR服務商提供的SDK、HTTP、MRCP服務

 之前本想寫一篇各ASR服務商比較的,但最后一想,還是算了吧!付多少錢得多少錢的果,即使都是車,那么多不同品牌的車,價格、性能、口碑都相差很大,更何況軟件這種車,有的都不需要考慮安全性、實用性、使用性,只要號稱有車,那么就會有大批的“流氓”去當倒爺,所以我們去夸ASR中的BBA,他們覺得理所應當,我們去實話實說有些只有方向盤和座椅的ASR“車”,又是得罪人的事,何必多說。

   之所以改成對SDK、HTTP、MRCP進行評論,這也是使用這些服務幾年來一點心得,同時也分享給對ASR服務有需求的人們,謹供參考!花錢是你花,也是花的你的錢,只能以我的思路帶著你捋一捋!

  我把ASR的三種服務方式有以下比喻(比喻中只是正常的情況,不含特效):

  SDK:對應自行車,靈活、適應各種路況、成本低廉,但對綜合技術有一定要求。

  HTTP:對應摩托車,也比較靈活、適應的路況比自行車少一些、成本低但要燒油,同時對開摩托車有駕照要求,綜合技術比SDK要求少一些,但對HTTP類的服務的技術要多些。

  MRCP:對應汽車,對路況要求相對苛刻,成本高,燒油高,汽車一中,時刻燒錢中,不光有駕照要求,綜合技術也要求比較多。

    按以上分類,我們在具體應用場景中,不光需要去了解技術問題,也要想好自己錢包少多少。而不是拍腦袋,為難著自己去采購一些不著調的產品。

 一、對業務場景進行分析,對自己的擅長技術進行分析,明確到自己能不能完成自己想要干的事。

 二、在小段語音識別情況下,SDK和HTTP方式一般夠用了。因為都是按照類似我們這種自己進行了VAD或完成錄音的情況下送到ASR引擎那邊,但按技術規范來說,SDK響應速度要比HTTP快些,因為SDK大部分可以理解成自定義的Socket通信來完成整個事,而HTTP的還要對HTTP協議進行解析和處理,如果說HTTP快,那只能說明ASR服務商花了更大代價在HTTP那塊。

 三、在大段語音實時識別要求中,MRCP應是當前不多的選擇之一。選擇這種方式是因為這是在RFC4487和RFC4463中定義了,不斷地把實時流傳給ASR引擎,所以對識別通道的占用和對硬件資源的消耗是非常大的。在大多數情況下,不提供標準的MRCP協議的一些引擎也會要求必須以實時流形式送到引擎來完成。

 四、在自建ASR服務環境下,對土豪公司我們不過多討論,但在成本預算和維護各方面不足的情況下,使用自建服務,就是給自己添堵,硬件配置不夠,跑不動怎么辦?維護人員素質跟不上,維護不了怎么辦?明明想買輛豪車,想什么時候走就什么時候走,結果因為被銷售人員忽悠著,只給了個豪車的殼,發動機是五流模具廠商壓出的外形,開動不起來怎么辦?所以各方面不到位的話,建議用比較好的公有云服務就好了,別總想著自建。

 五、雖然我在以上的例子中舉例ASR為車,但實際上,我們在具體應用中,真正的ASR只是作為汽油使用。好比我們的智能交互平臺中,在業務場景中,場景話術是發動機,播放的語音是車輪,ASR作為汽油使用,而我們的平臺應用是車架,由車架承載著發動機,經過汽油提供的動力,驅使著車輪走向正確的道。也許比喻中還缺些內容,但這個不重要,重要的是,作為平臺系統,各部件都好用才行,特別是車架需要更加的健壯和包容,才能讓不同的車輪,發動機,燃油結構相互配合達到一個好的效果。

   按以上所說的,其實有一個好的平臺應用,在應對相對狀況稍簡單的場景中,成本低廉的云的SDK、HTTP服務已可以滿足一般性的呼入呼出場景需求,而復雜的場景,則是靠成本往起堆的。在同一類的服務中,需要考察的方方面面比較多,很多小的ASR服務商,只是突出其在幾百個關鍵點中的某個點而已,只能作為小的參考之一,而不是綜合的考慮。

    整個應用場景中,考察和考慮到的不能只是ASR這一點,同時要考慮基礎平臺的扎實度和功能及性能等,而我們寧衛的產品在經過多年呼入呼出磨礪后,穩定性、并發性、實用性、易用性、邏輯性等各方面都有很棒的表現,希望大家一起合作!

ag真人视讯腾讯微博 足球总进球数秘诀 什么软件可以玩极速快3 号码遗漏四川快乐12 在线棋牌公司 重庆时时彩历史开奖期数 金蟾捕鱼秘诀 彩票站微信 浙江6+1玩法 体彩p5和值走势图新浪网 金蟾捕鱼大圣捕鱼 闲来宁夏麻将2021版本下载 3d开奖号码 删除福橙娱乐平台 中国福利彩票停售 2021年119期码报 四川金7乐奖金规定