日韩专区一区,亚洲va综合va国产va中文,黄色精品国产,欧美黑人一级视频

中文語(yǔ)音識(shí)別

中文語(yǔ)音識(shí)別

中文語(yǔ)音識(shí)別

語(yǔ)音轉(zhuǎn)文字樣例

功能:使用語(yǔ)音轉(zhuǎn)換模型對(duì)輸入語(yǔ)音進(jìn)行推理。
樣例輸入:由.wav文件轉(zhuǎn)換成的.bin文件。
樣例輸出:將.bin文件轉(zhuǎn)換成文本。

前置條件

請(qǐng)檢查以下條件要求是否滿(mǎn)足,如不滿(mǎn)足請(qǐng)按照備注進(jìn)行相應(yīng)處理。如果CANN版本升級(jí),請(qǐng)同步檢查第三方依賴(lài)是否需要重新安裝(5.0.4及以上版本第三方依賴(lài)和5.0.4以下版本有差異,需要重新安裝)。

條件 要求 備注
CANN版本 >=5.0.4 請(qǐng)參考CANN樣例倉(cāng)介紹中的安裝步驟完成CANN安裝,如果CANN低于要求版本請(qǐng)根據(jù)版本說(shuō)明切換samples倉(cāng)到對(duì)應(yīng)CANN版本
硬件要求 Atlas200DK/Atlas300(ai1s) 當(dāng)前已在Atlas200DK和Atlas300測(cè)試通過(guò),產(chǎn)品說(shuō)明請(qǐng)參考硬件平臺(tái) ,其他產(chǎn)品可能需要另做適配
第三方依賴(lài) ffmpeg+acllite 請(qǐng)參考第三方依賴(lài)安裝指導(dǎo)(C++樣例)完成對(duì)應(yīng)安裝

樣例準(zhǔn)備

  1. 獲取源碼包。

    可以使用以下兩種方式下載,請(qǐng)選擇其中一種進(jìn)行源碼準(zhǔn)備。

    • 命令行方式下載(下載時(shí)間較長(zhǎng),但步驟簡(jiǎn)單)。
      # 開(kāi)發(fā)環(huán)境,非root用戶(hù)命令行中執(zhí)行以下命令下載源碼倉(cāng)。    
      cd ${HOME}     
      git clone https://gitee.com/ascend/samples.git
       
      注:如果需要切換到其它tag版本,以v0.5.0為例,可執(zhí)行以下命令。
      git checkout v0.5.0
       
    • 壓縮包方式下載(下載時(shí)間較短,但步驟稍微復(fù)雜)。
      注:如果需要下載其它版本代碼,請(qǐng)先請(qǐng)根據(jù)前置條件說(shuō)明進(jìn)行samples倉(cāng)分支切換。
       # 1. samples倉(cāng)右上角選擇 【克隆/下載】 下拉框并選擇 【下載ZIP】。    
       # 2. 將ZIP包上傳到開(kāi)發(fā)環(huán)境中的普通用戶(hù)家目錄中,【例如:${HOME}/ascend-samples-master.zip】。     
       # 3. 開(kāi)發(fā)環(huán)境中,執(zhí)行以下命令,解壓zip包。     
       cd ${HOME}    
       unzip ascend-samples-master.zip
       
  2. 獲取此應(yīng)用中所需要的原始網(wǎng)絡(luò)模型。

    模型名稱(chēng) 模型說(shuō)明 模型下載路徑
    wav2word 語(yǔ)音轉(zhuǎn)文字推理模型。 請(qǐng)參考https://gitee.com/ascend
    /ModelZoo-TensorFlow/tree/master
    /TensorFlow/contrib/nlp/wav2word
    /ATC_wav2word_tf_AE
    目錄中README.md下載原始模型章節(jié)下載模型。
    # 為了方便下載,在這里直接給出原始模型下載及模型轉(zhuǎn)換命令,可以直接拷貝執(zhí)行。也可以參照上表在modelzoo中下載并手工轉(zhuǎn)換,以了解更多細(xì)節(jié)。     
    cd ${HOME}/samples/cplusplus/level2_simple_inference/5_nlp/WAV_to_word/model    
    wget https://modelzoo-train-atc.obs.cn-north-4.myhuaweicloud.com/003_Atc_Models/AE/ATC%20Model/Wav2word/Wav2word.pb  
    atc --input_shape="the_input:1,1600,200,1" --input_format=NHWC --output=voice --soc_version=Ascend310 --framework=3 --model="./Wav2word.pb"
     

樣例部署

執(zhí)行以下命令,執(zhí)行編譯腳本,開(kāi)始樣例編譯。

cd ${HOME}/samples/cplusplus/level2_simple_inference/5_nlp/WAV_to_word/scripts    
bash sample_build.sh
 

樣例運(yùn)行

注:開(kāi)發(fā)環(huán)境與運(yùn)行環(huán)境合一部署,請(qǐng)?zhí)^(guò)步驟1,直接執(zhí)行步驟2即可。

  1. 執(zhí)行以下命令,將開(kāi)發(fā)環(huán)境的 WAV_to_word 目錄上傳到運(yùn)行環(huán)境中,例如 /home/HwHiAiUser,并以HwHiAiUser(運(yùn)行用戶(hù))登錄運(yùn)行環(huán)境(Host)。
    # 【xxx.xxx.xxx.xxx】為運(yùn)行環(huán)境ip,200DK在USB連接時(shí)一般為192.168.1.2,300(ai1s)為對(duì)應(yīng)的公網(wǎng)ip。
    scp -r ${HOME}/samples/cplusplus/level2_simple_inference/5_nlp/WAV_to_word HwHiAiUser@xxx.xxx.xxx.xxx:/home/HwHiAiUser    
    ssh HwHiAiUser@xxx.xxx.xxx.xxx     
    cd ${HOME}/WAV_to_word/scripts
     
  2. 執(zhí)行運(yùn)行腳本,開(kāi)始樣例運(yùn)行。
    bash sample_run.sh
     

查看結(jié)果

運(yùn)行完成后,會(huì)在運(yùn)行環(huán)境的命令行中打印出推理結(jié)果。

常見(jiàn)錯(cuò)誤

請(qǐng)參考常見(jiàn)問(wèn)題定位對(duì)遇到的錯(cuò)誤進(jìn)行排查。如果wiki中不包含,請(qǐng)?jiān)趕amples倉(cāng)提issue反饋。

訂閱快訊

通過(guò)快訊訂閱,您將及時(shí)收到我們的信息更新通知。