功能:使用語(yǔ)音轉(zhuǎn)換模型對(duì)輸入語(yǔ)音進(jìn)行推理。
樣例輸入:由.wav文件轉(zhuǎn)換成的.bin文件。
樣例輸出:將.bin文件轉(zhuǎn)換成文本。
請(qǐng)檢查以下條件要求是否滿(mǎn)足,如不滿(mǎn)足請(qǐng)按照備注進(jìn)行相應(yīng)處理。如果CANN版本升級(jí),請(qǐng)同步檢查第三方依賴(lài)是否需要重新安裝(5.0.4及以上版本第三方依賴(lài)和5.0.4以下版本有差異,需要重新安裝)。
條件 | 要求 | 備注 |
---|---|---|
CANN版本 | >=5.0.4 | 請(qǐng)參考CANN樣例倉(cāng)介紹中的安裝步驟完成CANN安裝,如果CANN低于要求版本請(qǐng)根據(jù)版本說(shuō)明切換samples倉(cāng)到對(duì)應(yīng)CANN版本 |
硬件要求 | Atlas200DK/Atlas300(ai1s) | 當(dāng)前已在Atlas200DK和Atlas300測(cè)試通過(guò),產(chǎn)品說(shuō)明請(qǐng)參考硬件平臺(tái) ,其他產(chǎn)品可能需要另做適配 |
第三方依賴(lài) | ffmpeg+acllite | 請(qǐng)參考第三方依賴(lài)安裝指導(dǎo)(C++樣例)完成對(duì)應(yīng)安裝 |
獲取源碼包。
可以使用以下兩種方式下載,請(qǐng)選擇其中一種進(jìn)行源碼準(zhǔn)備。
# 開(kāi)發(fā)環(huán)境,非root用戶(hù)命令行中執(zhí)行以下命令下載源碼倉(cāng)。
cd ${HOME}
git clone https://gitee.com/ascend/samples.git
git checkout v0.5.0
# 1. samples倉(cāng)右上角選擇 【克隆/下載】 下拉框并選擇 【下載ZIP】。
# 2. 將ZIP包上傳到開(kāi)發(fā)環(huán)境中的普通用戶(hù)家目錄中,【例如:${HOME}/ascend-samples-master.zip】。
# 3. 開(kāi)發(fā)環(huán)境中,執(zhí)行以下命令,解壓zip包。
cd ${HOME}
unzip ascend-samples-master.zip
獲取此應(yīng)用中所需要的原始網(wǎng)絡(luò)模型。
模型名稱(chēng) | 模型說(shuō)明 | 模型下載路徑 |
---|---|---|
wav2word | 語(yǔ)音轉(zhuǎn)文字推理模型。 | 請(qǐng)參考https://gitee.com/ascend /ModelZoo-TensorFlow/tree/master /TensorFlow/contrib/nlp/wav2word /ATC_wav2word_tf_AE目錄中README.md下載原始模型章節(jié)下載模型。 |
# 為了方便下載,在這里直接給出原始模型下載及模型轉(zhuǎn)換命令,可以直接拷貝執(zhí)行。也可以參照上表在modelzoo中下載并手工轉(zhuǎn)換,以了解更多細(xì)節(jié)。
cd ${HOME}/samples/cplusplus/level2_simple_inference/5_nlp/WAV_to_word/model
wget https://modelzoo-train-atc.obs.cn-north-4.myhuaweicloud.com/003_Atc_Models/AE/ATC%20Model/Wav2word/Wav2word.pb
atc --input_shape="the_input:1,1600,200,1" --input_format=NHWC --output=voice --soc_version=Ascend310 --framework=3 --model="./Wav2word.pb"
執(zhí)行以下命令,執(zhí)行編譯腳本,開(kāi)始樣例編譯。
cd ${HOME}/samples/cplusplus/level2_simple_inference/5_nlp/WAV_to_word/scripts
bash sample_build.sh
注:開(kāi)發(fā)環(huán)境與運(yùn)行環(huán)境合一部署,請(qǐng)?zhí)^(guò)步驟1,直接執(zhí)行步驟2即可。
# 【xxx.xxx.xxx.xxx】為運(yùn)行環(huán)境ip,200DK在USB連接時(shí)一般為192.168.1.2,300(ai1s)為對(duì)應(yīng)的公網(wǎng)ip。
scp -r ${HOME}/samples/cplusplus/level2_simple_inference/5_nlp/WAV_to_word HwHiAiUser@xxx.xxx.xxx.xxx:/home/HwHiAiUser
ssh HwHiAiUser@xxx.xxx.xxx.xxx
cd ${HOME}/WAV_to_word/scripts
bash sample_run.sh
運(yùn)行完成后,會(huì)在運(yùn)行環(huán)境的命令行中打印出推理結(jié)果。
請(qǐng)參考常見(jiàn)問(wèn)題定位對(duì)遇到的錯(cuò)誤進(jìn)行排查。如果wiki中不包含,請(qǐng)?jiān)趕amples倉(cāng)提issue反饋。