硅基智能全球顶级商业AI数字人开源了,手把手教程,太细致了!

首先AI数字人,阁主用过不少,很多都是在线免费体验的,硅基智能的很早阁主也使用过,效果确实不错,不过价格比较贵,没想到的是最近居然开源了这个模型,实在太震惊了!

阁主第一时间去部署了,奈何之前很少部署开源模型,满满的艰辛路啊,好在有deepseek全程指导,遇到问题解决的是真不错!那么接下来就和大家一起来搭建一下,有兴趣的小伙伴可以一起,这个教程非常的细,尤其是纯小白,踩过的坑也给大家填平了!

硅基智能的Heygem是一款专为Windows系统设计的全离线视频合成工具,它能够精确克隆您的外貌和声音,让您的形象数字化。您可以通过文字和语音驱动虚拟形象,进行视频制作。无需联网,保护隐私的同时,也能享受到便捷和高效的数字体验。取的这个名字也很有意思heygem,另外一个很强的国外模型叫heygen,定制自己的数字人可以自己真人录播一段视频,阁主采用的是用heygen来生成,最后用硅基智能的heygem来部署创作,也能对比一下两者的效果!

本次的素材还是我们的老朋友,阁主AI生成的人物!就是下面的她!

图片[1]-硅基智能全球顶级商业AI数字人开源了,手把手教程,太细致了!-紫竹云轩

利用heygen生成一段口播视频,要8秒以上,没有遮挡,有动作的话,不能遮挡到人脸!录制好了备用,文后有视频对比!

HeyGem部署教程:

1、前提条件:

1.1 必须有 D 盘:主要用于后续数字人、作品等数据存储,空闲空间要求:大于30G

图片[2]-硅基智能全球顶级商业AI数字人开源了,手把手教程,太细致了!-紫竹云轩

1.2 用于存储服务镜像文件默认是C盘,安装完docker之后,可以选择其他盘,空闲空间要求:大于 100G

1.3 系统要求:目前支持 Windows 10 19042.1526 或更高版本

1.4 推荐配置:

  • CPU:第13代英特尔酷睿 i5-13400F
  • 内存:32G
  • 显卡:rtx-4070

阁主的配置是r9000p,16G内存+4060显卡,测试生成1分半视频用时10分钟左右(这里未开性能模式)

1.5 确保有英伟达显卡,并正确安装显卡驱动

官方参考中文文档地址:https://github.com/GuijiAI/HeyGem.ai/blob/main/README_zh.md

2、搭建步骤:

阁主就是根据官方这个文档来搭建的,里面有些对小白很不友好,也是花了很久才搭建成功。

图片[3]-硅基智能全球顶级商业AI数字人开源了,手把手教程,太细致了!-紫竹云轩

2.1 安装wsl(适用于Windows的子系统)

首次打开cmd,也就是命令提示符,用管理员身份运行,wsl –list –verbose 复制这段代码,ctrl+v复制进去,回车,查看你有没有安装wsl,没有的话就用下面这个代码安装 wsl –install

这里有个知识点,首先你的电脑系统不能设置了不更新,要不然就和阁主一样,安装不上!

2.2 安装docker,前往官网下载对应版本https://www.docker.com/,注意你的cpu架构,AMD的cpu就选amd版本,英特尔的处理器就选arm的版本,版本不对应是安装不上的。

安装完,最后重启一下电脑,再打开docker,首次打开注意按照下面来配置

图片[4]-硅基智能全球顶级商业AI数字人开源了,手把手教程,太细致了!-紫竹云轩

选择接受accept

图片[5]-硅基智能全球顶级商业AI数字人开源了,手把手教程,太细致了!-紫竹云轩

选择不登录(continue without signing in)

图片[6]-硅基智能全球顶级商业AI数字人开源了,手把手教程,太细致了!-紫竹云轩

最后选择跳过skip

到这里记得修改镜像文件的地址,开篇说的那个

3、安装服务端:

官方文档显示如下:

  1. docker-compose.yml文件在/deploy目录下。

  2. 在/deploy目录执行docker-compose up -d

  3. 耐心等待一段时间(半小时左右,速度取决于网速),下载会消耗70G左右流量,注意连WIFI

  4. 看到Dokcer 中出现三个服务,表示成功了

就这里对于小白来说,很可能卡了很久,尤其没接触过docker的,比如阁主就是。

3.1 这个yml文件是在官方的github文档里面的需要自己下载,阁主以为是要自己创建,摸索了好久才知道!大家可以去官方github下载,或者用阁主的连接下载!

图片[7]-硅基智能全球顶级商业AI数字人开源了,手把手教程,太细致了!-紫竹云轩

下载下来之后,新建个文件夹,把yml这个文件放在里面,然后点击上面的地址栏,删除,输入:cmd,然后回车,进入命令框。(注意这里全程都要打开docker)

或者第二种方法打开命令框:按住键盘shift,鼠标右键点击文件夹的空白处,出现弹窗后,选择“在此处打开PowerShell窗口”

图片[8]-硅基智能全球顶级商业AI数字人开源了,手把手教程,太细致了!-紫竹云轩

3.2 拉取镜像

根据刚才的方法进入cmd后,复制输入:docker-compose up -d 这个执行代码,然后就会自动拉取模型的镜像文件,总共70G左右,中间如果出现EOF等等网络原因,重新拉取即可。阁主动用了魔法,网络稳定点,不过下载慢,官方宣称半小时,我大概用了3个半小时,没办法网络速度不行!

或者大家可以单独拉三个镜像,执行代码如下:

  • docker pull guiji2025/fun-asr:1.0.2
  • docker pull guiji2025/fish-speech-ziming:1.0.39
  • docker pull guiji2025/heygem.ai:0.0.7_sdk_slim

图片[9]-硅基智能全球顶级商业AI数字人开源了,手把手教程,太细致了!-紫竹云轩

全程拉取镜像结束后,docker界面会显示三个镜像文件,这样就表示成功了!

图片[10]-硅基智能全球顶级商业AI数字人开源了,手把手教程,太细致了!-紫竹云轩

4、安装客户端:官方的github有releases有安装包,或者直接用阁主打包的本次教程的所有文件,安装完打开如上图。

5、创建自己的数字人:

图片[11]-硅基智能全球顶级商业AI数字人开源了,手把手教程,太细致了!-紫竹云轩

5.1 首先需要运行docker,让模型处于运行的状态,这里阁主就卡了好久,原因是不懂…docker里面找了半天也没启动起来。最后deepseek帮助下,回到之前yml的文件夹下面,运行cmd,输入:docker-compose up 启动模型

5.2 打开软件,选择快速定制,上传你的口播视频,很快就可以定制好自己的视频了。

图片[12]-硅基智能全球顶级商业AI数字人开源了,手把手教程,太细致了!-紫竹云轩

软件使用还是很简单的,把你需要的文案,输入进去,就可以使用数字人来合成口播视频,或者上传音频也可以。

到此就结束了这段开源部署的教程,制作不易,多多收藏,万一以后用的上呢?点个再看,多多分享吧!视频对比可以去紫竹云轩工作室(视频号查看)

yml文件和安装包:https://pan.baidu.com/s/1Sd5aqRQwEr49iEy5ptKwRw?pwd=kquq

yml文件和安装包:https://drive.uc.cn/s/55a6d69244904

© 版权声明
THE END
喜欢就支持一下吧
点赞14
评论 抢沙发

请登录后发表评论

    暂无评论内容