新浪科技訊 1月21日下午消息,MiniMax昨日升級發布T2A-01系列語音模型,并上線了海螺語音產品。新浪科技了解到,依托T2A-01系列語音模型,用戶在海螺AI僅需輸入文字即可生成自然、流暢的超擬人人聲,最長可輸入多達10000字符。同時,用戶還可以根據需要自由配置輸出語音的情緒、語速、音高,甚至調整音色效果,滿足復雜場景的精細化需求。
海螺語音支持中文、粵語、英語、日語、韓語、阿拉伯語等17種語言及上百種預置音色可選,能夠提供真正地道的語言輸出。在T2A-01模型的能力支持下,海螺語音在相似度、錯誤率和聽感評測上均領先于同類產品。使用Seed-TTS論文相同的評測集和評測工具來計算海螺語音的字錯率和相似度,結果顯示,海螺語音在中文的字錯率和相似度最好,英文的字錯率、相似度和真實錄音“Human”接近。
海螺語音具備情感理解能力,能夠智能地識別并重現語音中細微的情感差別,讓聲音更加鮮活,情緒表達更加精準。同時,還預置不同語種共計300+音色供用戶選擇,用戶可按語言、口音、性別和年齡分類篩選。音色多變,不羈、詼諧、慈祥等風格豐富多樣,有聲書、ASMR耳語、新聞播報等場景均可適用。(文猛)