图片
装置SadTalker这款AI一键让相片讲话的模子叫SadTalker,是由西安交通大学的商榷东谈主员提议的,它不错让相片里的东谈主物奴隶音频的输入动起来,且头部携带、面部颜料比拟信得过,下图是官方展示的遵守图,还在等什么呢,即刻领有它!
图片
①建议先部署SD(stable-diffusion-webui),不错参考以下著述:
AI杀疯了 | 从0运行学AI绘制
因为SD仍是营救了SadTalker的插件了,后续从SD生成的图片,齐不错径直一键生成讲话、唱歌视频。
(虽然了,你也不错不部署SD,径直使用SadTalker)
②装置SadTalker插件:
软件开发掀开并运行SD webui,然后采用“扩张”,在“从网址装置”里,输入以下地址:
https://github.com/OpenTalker/SadTalker
点击装置,需要恭候3~5分钟。
图片
装置完成后,重启一下SD webui,即可在功能栏里看到“SadTalker”插件栏了。
装置FFmpegFFmpeg是一套不错用来记载、转念数字音频、视频,并能将其回荡为流的开源计较机枢纽,是SadTalker运行的必要营救枢纽。不错从以下网址下载赢得:
https://www.gyan.dev/ffmpeg/builds/ffmpeg-git-full.7z
解压后,需要将FFmpeg的bin文献夹旅途添加到系统环境变量里:
图片
手动添加环境变量:死心面板→系统→高等系统开发→环境变量→Path→编订→添加
图片
下载模子运行SadTalker,做一个app得多少钱还需要下载一些模子,不错从以下蚁集赢得:
https://github.com/OpenTalker/SadTalker/releases
需要下载前边的10个文献:
图片
找到之前在SD里添加的SadTalker插件(在SD文献夹\extensions里),然后新建一个文献夹“checkpoints”:
图片
将上头下载的10个模子文献复制进去,其中BFM_Fitting和hub两个压缩文献还需要解压到checkpoints文献根目次中。
至此,你仍是领有了一键让图片讲话的手艺了。
试试遵守在SD webui的功能栏里,采用“SadTalker”,然后将图片(营救从SD中加载)和音频传入,音频建议在10秒以内,否则显卡压力有点大。点击“生成”按钮,即可一键使相片讲话。
磋商开发项讲解:
corp:图片被剪辑为方形(运算速率快,但淌若传入的图片不是方形,最终视频会变形)
resize:再行诊治尺寸,不错使脖子和头部衔尾当然,但代价是口型可能不太准
full:完好体验(基本即是选它了)
同期铭刻勾选“面部增强”,使举座面部遵守愈加当然些。
图片
最终得到了著述起原的会讲话、唱歌的姑娘姐了一个app的开发成本要多少钱,她还会很当然地眨眼睛呢,树立感满满有木有!感意思的小伙伴快去试试吧~
本站仅提供存储干事,通盘现实均由用户发布,如发现存害或侵权现实,请点击举报。