workspace目录下的文件,先了解下
1. 我们看到下面目录,可以看到都是批处理,这里我已经翻译成中文啦,非常好理解。我们双击它1)批处理,输入y之后,就会清理了,不需要清理就不用执行了。
2. 第二步,我们提取data_src视频,这里我们按照原视频帧数进行分解(如果要指定帧数,可以右击编辑)
分解完之后,我们打开workspace/data_src目录,可以看到分解出的图片
3. 同样的,我们将data_dst视频分解出图片,执行批处理
4. 分解出图片知道后,我们要图片中的人脸提取出来,先从data_src开始,我们用DLIB库提取人脸,双击 4) 单显卡DLIB库提取data_src人脸
提取好data_src的人脸之后,我们看到下面的批处理是排序,有兴趣的同学可以自己逐个执行看效果,这里我们跳过。
5.同样的,我们需要提取data_dst的人脸,这里我们也用DLIB来提取人脸,执行批处理开始(虽然命令是多显卡,但是单显卡没问题的)
提取的人脸,有些不是人脸,我们直接去掉,通过这几步,我们的素材都准备好了,下一篇我们开始来训练转换了。
1.人脸素材需要多少?
DST:尽量不要少,因为它是有限的且需要被替换的素材
SRC:根据各软件的脸图筛选规则和网上大神的建议,总体来说,SRC脸图最好是大概700~3999的数量,像Deepfacelab的作者,他就认为1500张够了。对于SRC,各种角度、各种表情、各种光照下的内容越多越好,很接近的素材没有用,会增加训练负担。
2.手动对齐识别人脸模式如何使用?
回车键:应用当前选择区域并跳转到下一个未识别到人脸的帧
空格键:跳转到下一个未识别到人脸的帧
鼠标滚轮:识别区域框,上滚放大下滚缩小
逗号和句号(要把输入法切换到英文):上一帧下一帧
Q:跳过该模式
老实说,这个功能极其难用,画面还放得死大……
3.MODEL是个什么东西?
MODEL是根据各种线条或其他奇怪的数据经过人工智能呈现的随机产生的假数据,就像PS填充里的“智能识别”
你可以从 https://affinelayer.com/pixsrv/ 这个网站里体验一下什么叫MODEL造假
4.MODEL使用哪种算法好?
各有千秋,一般Deepfacelab使用H128就好了,其他算法可以看官方在GitHub上写的介绍:https://github.com/iperov/DeepFaceLab
5.Batch Size是什么?要设置多大?
Batch Size的意思大概就是一批训练多少个图片素材,一般设置为2的倍数。数字越大越需要更多显存,但是由于处理内容更多,迭代频率会降低。一般情况在Deepfacelab中,不需要手动设置,它会默认设置显卡适配的最大值。
根据网上的内容和本人实际测试,在我们这种和128尺寸换脸的操作中,越大越好,因为最合理的值目前远超所有民用显卡可承受的范围。
6.MODEL训练过,还可以再次换素材使用吗?
换DST素材:
可以!而且非常建议重复使用。
新建的MODEL大概10小时以上会有较好的结果,之后换其他DST素材,仅需0.5~3小时就会有很好的结果了,前提是SRC素材不能换人。
换SRC素材,那么就需要考虑一下了:
第一种方案:MODEL重复用,不管换DST还是换SRC,就是所有人脸的内容都会被放进MODEL进行训练,结果是训练很快,但是越杂乱的训练后越觉得导出不太像SRC的脸。
第二种方案:新建MODEL重新来(也就是专人专MODEL)这种操作请先把MODEL剪切出去并文件夹分类,这种操作可以合成比较像SRC的情况,但是每次要重新10小时会很累。
第三种方案:结合前两种,先把MODEL练出轮廓后,再出来,每个MODEL每个SRC脸专用就好了。
掌上