慧听美式英语语音识别数据库-1500小时

發布日期:2019-01-23

美式英語音識別數據庫在美國進行語音采集工作。所有發音人的母語均為美語,發音自然流利,口語典型??偣餐瓿?400人共計1500小時的語音數據,發音人男女比例均衡,年齡覆蓋18-60歲。

錄音的設備是高性能桌面麥克風與高端智能手機,在相對安靜的室內使用這兩種設備同步采集。

該數據庫錄音數據的規格是:手機數據16kHz、16bit、MONO,桌面麥克風數據48kHz、16bit、MONO,均以非壓縮PCM格式存儲。

全部錄音數據與錄音文本均由標注團隊成員細心校對,保證句錯誤率低于5%。

該數據庫錄音人數多、年齡覆蓋廣泛、數據標注質量高,可用于美式英語語音識別系統訓練、測試、語音分析、發音研究等多種用途。

相關數據
财神彩票群