南洋才女,德艺双馨,孙燕姿本尊回应AI孙燕姿(基于Sadtalker/Python3.10)
孙燕姿果然不愧是孙燕姿,不愧为南洋理工大学的高材生,近日她在个人官方媒体博客上写了一篇英文版的长文,正式回应现在满城风雨的“AI孙燕姿”现象,流行天后展示了超人一等的智识水平,行文优美,绵恒隽永,对AIGC艺术表现得极其克制,又相当宽容,充满了语言上的古典之美,表现出了“任彼如泰山压顶,我只当清风拂面”的博大胸怀。
本次我们利用edge-tts和Sadtalker库让AI孙燕姿朗诵本尊的博文,让流行天后念给你听。
Sadtalker配置之前我们曾经使用百度开源的PaddleGAN视觉效果模型中一个子模块Wav2lip实现了人物口型与输入的歌词语音同步,但Wav2lip的问题是虚拟人物的动态效果只能局限在嘴唇附近,事实上,音频和不同面部动作之间的连接是不同的,也就是说,虽然嘴唇运动与音频的联系最强,但可以通过不同的头部姿势和眨眼来反作用于音频。
(相关资料图)
和Wav2lip相比,SadTaker是一种通过隐式3D系数调制的风格化音频驱动Talking头部视频生成的库,一方面,它从音频中生成逼真的运动系数(例如,头部姿势、嘴唇运动和眨眼),并单独学习每个运动以减少不确定性。对于表达,通过从的仅嘴唇运动系数和重建的渲染三维人脸上的感知损失(唇读损失,面部landmark loss)中提取系数,设计了一种新的音频到表达系数网络。
对于程序化的头部姿势,通过学习给定姿势的残差,使用条件VAE来对多样性和逼真的头部运动进行建模。在生成逼真的3DMM系数后,通过一种新颖的3D感知人脸渲染来驱动源图像。并且通过源和驱动的无监督3D关键点生成扭曲场,并扭曲参考图像以生成最终视频。
Sadtalker可以单独配置,也可以作为Stable-Diffusion-Webui的插件而存在,这里推荐使用Stable-Diffusion插件的形式,因为这样Stable-Diffusion和Sadtalker可以共用一套WebUI的界面,更方便将Stable-Diffusion生成的图片做成动态效果。
进入到Stable-Diffusion的项目目录:
cd stable-diffusion-webui
启动服务:
python3.10 webui.py
程序返回:
Python 3.10.11 (tags/v3.10.11:7d4cc5a, Apr 5 2023, 00:38:17) [MSC v.1929 64 bit (AMD64)] Version: v1.3.0 Commit hash: 20ae71faa8ef035c31aa3a410b707d792c8203a3 Installing requirements Launching Web UI with arguments: --xformers --opt-sdp-attention --api --lowvram Loading weights [b4d453442a] from D:\work\stable-diffusion-webui\models\Stable-diffusion\protogenV22Anime_protogenV22.safetensors load Sadtalker Checkpoints from D:\work\stable-diffusion-webui\extensions\SadTalker\checkpoints Creating model from config: D:\work\stable-diffusion-webui\configs\v1-inference.yaml LatentDiffusion: Running in eps-prediction mode DiffusionWrapper has 859.52 M params. Running on local URL: http://127.0.0.1:7860
代表启动成功,随后http://localhost:7860
选择插件(Extensions)选项卡
点击从url安装,输入插件地址:github.com/Winfredy/SadTalker
安装成功后,重启WebUI界面。
接着需要手动下载相关的模型文件:
https://pan.baidu.com/s/1nXuVNd0exUl37ISwWqbFGA?pwd=sadt
随后将模型文件放入项目的stable-diffusion-webui/extensions/SadTalker/checkpoints/目录即可。
接着配置一下模型目录的环境变量:
set SADTALKER_CHECKPOINTS=D:/stable-diffusion-webui/extensions/SadTalker/checkpoints/
至此,SadTalker就配置好了。
edge-tts音频转录之前的歌曲复刻是通过So-vits库对原歌曲的音色进行替换和预测,也就是说需要原版的歌曲作为基础数据。但目前的场景显然有别于歌曲替换,我们首先需要将文本转换为语音,才能替换音色。
这里使用edge-tts库进行文本转语音操作:
import asyncio import edge_tts TEXT = """ As my AI voice takes on a life of its own while I despair over my overhanging stomach and my children"s every damn thing, I can"t help but want to write something about it. My fans have officially switched sides and accepted that I am indeed 冷门歌手 while my AI persona is the current hot property. I mean really, how do you fight with someone who is putting out new albums in the time span of minutes. Whether it is ChatGPT or AI or whatever name you want to call it, this "thing" is now capable of mimicking and/or conjuring, unique and complicated content by processing a gazillion chunks of information while piecing and putting together in a most coherent manner the task being asked at hand. Wait a minute, isn"t that what humans do? The very task that we have always convinced ourselves; that the formation of thought or opinion is not replicable by robots, the very idea that this is beyond their league, is now the looming thing that will threaten thousands of human conjured jobs. Legal, medical, accountancy, and currently, singing a song. You will protest, well I can tell the difference, there is no emotion or variance in tone/breath or whatever technical jargon you can come up with. Sorry to say, I suspect that this would be a very short term response. Ironically, in no time at all, no human will be able to rise above that. No human will be able to have access to this amount of information AND make the right calls OR make the right mistakes (ok mayyyybe I"m jumping ahead). This new technology will be able to churn out what exactly EVERYTHING EVERYONE needs. As indie or as warped or as psychotic as you can get, there"s probably a unique content that could be created just for you. You are not special you are already predictable and also unfortunately malleable. At this point, I feel like a popcorn eater with the best seat in the theatre. (Sidenote: Quite possibly in this case no tech is able to predict what it"s like to be me, except when this is published then ok it"s free for all). It"s like watching that movie that changed alot of our lives Everything Everywhere All At Once, except in this case, I don"t think it will be the idea of love that will save the day. In this boundless sea of existence, where anything is possible, where nothing matters, I think it will be purity of thought, that being exactly who you are will be enough. With this I fare thee well. """ VOICE = "en-HK-YanNeural" OUTPUT_FILE = "./test_en1.mp3" async def _main() -> None: communicate = edge_tts.Communicate(TEXT, VOICE) await communicate.save(OUTPUT_FILE) if __name__ == "__main__": asyncio.run(_main())
音频使用英文版本的女声:en-HK-YanNeural,关于edge-tts,请移步:口播神器,基于Edge,微软TTS(text-to-speech)文字转语音免费开源库edge-tts语音合成实践(Python3.10),这里不再赘述。
随后再将音频文件的音色替换为AI孙燕姿的音色即可:AI天后,在线飙歌,人工智能AI孙燕姿模型应用实践,复刻《遥远的歌》,原唱晴子(Python3.10)。
本地推理和爆显存问题准备好生成的图片以及音频文件后,就可以在本地进行推理操作了,访问 localhost:7860
这里输入参数选择full,如此会保留整个图片区域,否则只保留头部部分。
生成效果:
SadTalker会根据音频文件生成对应的口型和表情。
这里需要注意的是,音频文件只支持MP3或者wav。
除此以外,推理过程中Pytorch库可能会报这个错误:
torch.cuda.OutOfMemoryError: CUDA out of memory. Tried to allocate 20.00 MiB (GPU 0; 6.00 GiB total capacity; 5.38 GiB already allocated; 0 bytes free; 5.38 GiB reserved in total by PyTorch) If reserved memory is >> allocated memory try setting max_split_size_mb to avoid fragmentation. See documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF
这就是所谓的"爆显存问题"。
一般情况下,是因为当前GPU的显存不够了所导致的,可以考虑缩小torch分片文件的体积:
set PYTORCH_CUDA_ALLOC_CONF=max_split_size_mb:60
如果音频文件实在过大,也可以通过ffmpeg对音频文件切片操作,分多次进行推理:
ffmpeg -ss 00:00:00 -i test_en.wav -to 00:30:00 -c copy test_en_01.wav
藉此,就解决了推理过程中的爆显存问题。
结语和Wav2Lip相比,SadTalker(Stylized Audio-Driven Talking-head)提供了更加细微的面部运动细节(如眼睛眨动)等等,可谓是细致入微,巨细靡遗,当然随之而来的是模型数量和推理成本以及推理时间的增加,但显然,这些都是值得的。
标签:
相关阅读
-
原神神工天巧宝录之章如何玩?原神星之秘宝在哪里?
原神神工天巧宝录之章如何玩?〓活动时间〓2023 06 08 10:00 ~ 2023 06 29 03:59〓参与条件〓冒...
2023-06-07
精彩推荐
阅读排行
相关词
- 三只松鼠:社区零食店首店本月初开启内测,第一批店近期将开业-环球热点
- 简单沙盒2好玩吗 简单沙盒2玩法简介 环球信息
- 快资讯:图知道|2023高考作文你想写哪篇
- 如何修复缺少defragres.dll文件的问题_天天热推荐
- 618第一波申通件量峰值呈现“两级跳”:单日揽收6000万_天天微速讯
- 神舟kbdclass.sys蓝屏怎么排查和修复|短讯
- 日本实际工资连续13个月同比减少
- 石家庄供电公司:“智慧巡检+网格布点”全力护航高考用电|环球热资讯
- 中证500ETF易方达(510580)上涨0.7%,IC下月合约剔除分红后年化升水3.82%
- U盘一插上电脑就蓝屏问题的高效解决方法-天天热门
- 环球资讯:Win10无缘无故蓝屏死机问题的排查和修复技巧
- 《神仙道3》预下载、预约奖励及内测充值返利说明
- 《青鸾繁华录》全新资料片——甜蜜邂逅|速讯
- 海南中学高中部考点:送考家长“花式”送祝福 为考生加油打气
- 【全球报资讯】《神仙道3》今日6月7日公测 李一桐喊你来双修
- 实时:河北2023高考作文题出来啦!你会怎么写?
- 四大错误用眼行为,看看你有没有
- 关注“一老一小”,龙津街道民生工作提质提效
- 【天天快播报】年轻人首选!十万级家轿新选择,试驾朗逸新锐
- 塞拉7号官网在哪下载 最新官方下载安装地址 当前报道
- 世界观点:墨西哥西北部发生4.0级地震
- 每日速看!银川灵武市2023城区一年级预报名材料有什么
- 哈尔滨商转公需要什么条件-天天实时
- 银川推动房地产业发展的举措有哪些|天天播报
- 银川灵武市2023城区一年级预报名要注意什么|全球快讯
- 甘肃下雪高速封路了吗(持更)
- 国科微:公司的NPU已实现前端IPC最高4T算力和后端NVR/DVR 9T算力
- 贵州村超比赛时间2023|天天报道
- 世界看热讯:银川带押过户具体内容是什么
- 2023辽宁高考考点查询查询入口及查询流程
- 环球速递!兰州高速有雪吗(持更)
- 热点评!民德电子:条码识别产品在彩票投注终端已有批量应用
- 天天快资讯:铁流股份:空心电机轴目前处在客户产品开发阶段
- 世界快报:爱情名言名句优美句子,句句走心!
- U盘导致电脑蓝屏原因及解决方法 天天观速讯
- 创业板指跌逾1% DRG/DIP板块大涨 数字水印、旅游酒店走强
- 甘肃高速公路24小时服务电话查询_快报
- 提示qtcore4.dll丢失报错如何解决-当前快讯
- 动态:mfc140ita.dll损坏修复方法
- pnpsetup.dll缺失修复方法 关注
- 环球微速讯:缺少netcenter.dll如何修复
- 精选 | 早盘期货要闻汇总 6月7日周三
- 铁流股份:空心电机轴目前处在客户产品开发阶段
- Yoga蓝屏问题的一键修复软件推荐 焦点简讯
- 世界新资讯:与爱情有关的名言名句大全
- 高考首日三亚现暴雨天气 老师焦急确认考生是否到场 时快讯
- 深交所向*ST东洋发出问询函
- 哪些方法可以解决 三国志13找不到d3dx9_43.dll问题
- 每日关注!视频|海口一考生被堵滨海立交桥 交警六分钟送达考点
- 当前要闻:华晨宇长沙演唱会什么时候开始抢票?
- 【独家】《暗黑破坏神4》全事件触发攻略大全
- 学雷锋手抄报简单字少
- 环球通讯!出行注意!海南还有强降雨!
- 今日快讯:南昌市部署开展对中高风险道路运输企业实地核查工作
- 江西抚州高新区开展电线电缆专项检查行动
- 福州连江片内生是什么意思-动态
- 《魔镜物语》游吟诗人&二次觉醒功能来袭! 天天热闻
- 全球热点评!连江县初中招生主要日程安排
- 当前快播:“新发展格局下自贸试验区(港)高质量发展与对标经贸新规则”专题培训班举办
- 天天微资讯!2023海口高考成绩什么时候出?
- 江西省莲花县开展电子计价秤专项整治行动
- 江西省鹰潭市市场监管局开展食品安全专项检查-当前速递
- 【新要闻】连江县城区小学招生划片范围
- 杭州:着力打造国际会展之都 天天速递
- 世界观热点:2023厦门翔安区秋季幼升小入学办法(港澳台等适龄儿童)
- 《寂静岭2重制版》PC配置公开 最低配置i5-8400+GTX 1080-当前通讯
- 天天热推荐:南昌龙舟赛现场景区免费游抽奖活动
- 南昌龙舟赛公交接驳二线运营时间+线路图2023
- 江西省南昌市市场监管局多措并举遏制市场经营主体虚假登记行为 世界资讯
- 《光环:无限》发布新生涯军衔系统 将于6月20日上线 当前消息
- 当前快看:2023年济南槐荫区户籍幼升小小学报名时间+入口
- 2023年海口高考成绩官方查询入口 世界最新
- 每日关注!26岁网红直播喝酒去世,留下妻子和儿子,上个月刚参加完好友葬礼
- 【当前独家】宿迁22家企业亮相跨博会
- 《漫威蜘蛛侠2》官方表示将在信心十足时公布发售日期 最新快讯
- 精选!喜报!恒伦医疗科技股份有限公司获评首批“太原老字号”
- 卡普空Steam开启40周年特卖 持续到6月21日 世界时讯
- 崩坏星穹铁道银狼无限推条队怎么搭配 银狼无限推条队搭配攻略_快播报
- 乘风2023四公淘汰名单了谁?乘风2023在哪个台播出的?
- 重返未来1999拉拉泉要培养吗 拉拉泉技能资料分析
- 环球要闻:暗黑4赋能收割者之威能介绍
- 会员权益 重磅焕新丨咪咕阅读品牌升级邀你与美好故事同频_天天通讯
- 全球快资讯丨塞尔达传说王国之泪斩风羽枪✨在哪里
- 暗黑4通用装备无星之空戒指有什么特点
- 太原祥云桥主桥荷载试验顺利完成_全球讯息
- 世界时讯:RCEP对15个签署国全面生效 为区域经济一体化注入强劲动力(经济新方位)
- 环球热门:天玑8200和骁龙888哪个好
- 全球快资讯:太原市设置21个交通应急救助站
- 今日要闻!太原人注意!“养生馆”成了诈骗馆 目标专盯中老年女性
- 天玑8200相当于骁龙什么水平-每日精选
- 如何通过安全模式解决NTFS_FILE_SYSTEM蓝屏错误_滚动
- 热头条丨高考来临,这些高考类诈骗套路千万别信!
- 华为畅享60pro参数配置
- 【全球报资讯】谁遗落了“潜水靴”?“北溪”管道爆炸新线索能否让真凶浮出水面
- 最新快讯!山西推进加氢站建设,太原吕梁长治临汾先行先试
- 当前热议!哪些方法可以解决尘埃2找不到xlive.dll问题
- 出现冒险岛canvas.dll文件被损伤了应该怎么做
- Win7中atikmdag.sys蓝屏问题的解决方法
- 天玑8200和骁龙8+对比-天天聚看点
- 王国之泪海利亚盾碎了怎么版 海利亚盾修补方法介绍
- 当前关注:暗黑4觅血者的威能介绍
- 天天观焦点:applessd.sys蓝屏windows10
- 中尼两国持续加强在互联互通、经贸投资、能源开发等领域务实合作 “携手共同建设更加美好的未来”(第一现场)
- 焦点热议:彻底实现本土化,红杉全球宣布三大区域将各自完全独立
- 外国csgo有哪些开箱平台 最专业正规的csgo饰品交易平台排名
- 美国童工问题触目惊心 多州却进一步放宽童工法律限制
- 滞困异星黎明EXTRA-TERRESTRIAL种子是什么
- 山西省交通运输厅又一民生实事落地,普货驾驶员从业资格证可直接申领
- 天天观察:市场监管总局:今年5月,11家车企共召回汽车超118万辆
- 随笔:美国“航行自由”的“神逻辑”-焦点
- 全球通讯!@太原人,预计未来三天山西省以晴到多云天气为主,6月7日太原最高气温31℃
- 【线路信息】太原公交865路恢复原线通行
- 汉字找茬王唤醒大郎怎么过 唤醒大郎关卡通关攻略_天天快资讯
- 全球今亮点!如何处理 红色警戒3找不到d3dx9_35.dll问题
- 环球实时:中国中免:存货周转率的变化主要是海南地区为销售旺季备货所致
- 我国牵头编制的零碳电力系统等三本国际标准化白皮书正式发布 天天报资讯
- 呼伦贝尔草原地带首次发现赭石岩画 今头条
- 蒋万安:两岸紧张双城论坛更显重要 有意义_每日播报
- 环球热门:越夜越精彩!海口火力全开
- 修复spfileq.dll缺失的最佳方案
- 虚拟数字人热度攀升 多家A股公司前瞻布局
- 联动科技:6月6日融资买入2182.02万元,融资融券余额8798.51万元-今日关注
- 经纬股份:6月6日融资买入999.55万元,融资融券余额3536.12万元
- 618火热来袭 券商看好消费股布局机遇 当前关注
- 快讯:如何修复联想ThinkPad蓝屏死机后无法开机的问题
- 世界速讯:wwdc23是什么意思
- 海南税务:个人股权转让涉税业务实现网上办理|今日快讯
- 骁龙7gen1增强版什么水平
- 商界奇迹首富养成计划什么时候出 公测上线时间预告
- 滞困异星黎明DUMA-KEY种子是什么 热推荐
- 湖南一监考老师忘带监考证 交警铁骑火速带老师取回
- 鬼谷八荒删了version.dll应该如何处理
- 外交部发言人:中洪关系实现“开门红”_天天信息
- 原创组图|高考进行时!考场外的守候是父母无声的爱
- Win10玩CF蓝屏原因及解决方法
- 高考首日衡水中学高考生6点跑操 成为考前一道靓丽风景线
- 速递!浙江省宁波市市场监督管理局高新技术产业开发区分局食品安全餐饮服务环节监督抽检信息通告(2023年第3期)
- 每日热闻!《暗黑破坏神4》惊骇缰绳获得方法
- 全球观察:港股倒跌 北水减磅净沽81亿
- 森泰股份:6月6日融资买入446万元,融资融券余额2054.12万元
- 自动修复dxpps.dll丢失方法_当前动态
- 天天即时:重庆市涪陵区市场监管局驻场式监管高考考点食品安全
- 天天头条:微软非法收集儿童信息 付1.6亿和解
- 世界热文:移动硬盘坏道修复工具哪个好
- 关于航天的知识简短|世界快看点
- 今日热搜:高校鼠头涉事窗口几乎没人去吃饭 校方监管局多方回应
- 全球微头条丨关于感恩老师的故事
- 世界即时看!奥海科技(002993):日K线呈现-“曙光初现”形态 后市看多(06-07)
- 天天速讯:北京发现两例猴痘病例 该如何预防猴痘?
- 帧帧光影壁彩生