【分享】AI音色克隆CosyVoiceV2

  阿里巴巴通义实验室语音团队于24年12月份发布了语言生成大模型CosyvoiceV2,这个模型的强大之处在于它能够3秒声音克隆,并且能够实现克隆声音说方言,跨语种复刻等。

  CosyvoiceV2的网站:https://funaudiollm,github,io/cosyvoice2/

  介绍了CosyVoiceV2的功能和特点

  里面提及可提取中文,英文,日语和韩语的音色并进行二次克隆的功能。

  以上为混合多语言的克隆,可同时输出多种语言的内容。

  带有感情色彩的克隆音色以及困难句顺口溜都可以复刻出来。

  在CosyVoiceV2模型出来的第二天,B站上就有up做出来了本地部署版的CosyVoiceV2模型,我在本章中仅作为介绍和分享。(满血版)

夸克网盘:https://pan,quark,cn/s/e3775fc74447

百度网盘:https://pan,baidu,com/s/1wyWodBnOR_MrZ3CopCfPIw?pwd=qhqm

下载之后解压001压缩包即可

  (文件整合包大小总共18.7G,GPU显存大小建议8G及以上,关于在线版在文章后)

  当启动后等待一会后就会弹出相应的网站

  这时候只需要上传一段3-10s的音频再输入音频里所说的文字,就可以让CosyVoiceV2克隆所上传音频的音色,最上面的是输入合成文本,就是你要克隆出来的语音文字,支持长文本克隆,大概500字左右是最好的。

  当选中自然语言控制时,输入instruct文本例如“使用粤语,使用川普”等它就可以输出相应的克隆语音,CosyVoiceV2模型的方言克隆已经改动的相较于上一个版本成熟了不少,粤语,川普,上海话都比较准确。

  那么以上就是本地部署的CosyVoiceV2模型,非常感谢up主与AI同行的分享。

  对于本地部署不了的,通义实验室也有做一个在线版的网页供使用,在1月6号所更新的CosyVoiceV2-0.5B

  网址为https://www,modelscope,cn/studios/iic/CosyVoice2-0.5B

  所有的排版都和本地部署的没有区别,不再介绍

关于CosyVoiceV2模型的应用场景主要有

• 智能客服 提供快速、准确的语音合成服务,提升客户满意度

• 虚拟助手 用户可以根据自己的喜好调整语音的情感和语气,使其更符合个人需求

• 教育与培训 帮助学生学习外语发音,提供个性化的教学体验

• 娱乐内容创作 可用于动画配音、名人模仿秀等,为创作者提供丰富的创意空间

• 无障碍交流 为视障用户生成听觉友好的语音内容,帮助无法说话的人拥有属于自己的“声音”

• 陪伴场景 复刻家人的声音用于智能助手或车载导航,提供个性化陪伴

• 整蛊朋友(bushi)

注意,这种语言合成工具是明确禁止以下行为

1. 侵犯他人声音权益2. 制作虚假或误导性内容3. 用于诈骗或其他非法活动4. 违背公序良俗或法律法规5. 未经授权的商业使用6. 损害他人名誉或形象7. 滥用技术进行恶意模仿

  最后祝大家玩的愉快,如果帮助到你记得双击屏幕给我一个免费的赞

更多游戏资讯请关注:电玩帮游戏资讯专区

电玩帮图文攻略 www.vgover.com