本文介绍如何在无显卡的云服务器上部署Fish Speech GUI,实现文字转语音(TTS)和声音克隆功能。
一、项目简介
Fish Speech 是一个中文语音合成平台,支持文本转语音和声音克隆。开源版本基于 FastAPI + Vue3,前后端分离,适合部署到私有服务器。
二、部署要求
项目 | 要求说明 |
---|---|
系统 | Ubuntu 20.04+ / Debian |
CPU | 至少 2 核 |
内存 | 推荐 4GB 及以上 |
显卡 | 可选,CPU 也支持 |
Python | 3.10+ |
Node.js | 18+ |
端口 | 默认使用 7860 |
三、准备环境
1. 安装依赖项
sudo apt update && sudo apt upgrade -y
sudo apt install -y python3.10 python3.10-venv python3.10-dev git curl ffmpeg build-essential
2. 安装 Node.js 18
curl -fsSL https://deb.nodesource.com/setup_18.x | sudo -E bash -
sudo apt install -y nodejs
---
四、克隆项目
使用 Git 克隆项目代码:
git clone https://github.com/AnyaCoder/fish-speech-gui.git
cd fish-speech-gui
---
五、部署后端
进入后端目录并创建 Python 虚拟环境:
cd backend
python3.10 -m venv venv
source venv/bin/activate
安装后端依赖:
pip install --upgrade pip
pip install -r requirements.txt
启动后端服务:
python main.py
---
六、构建前端
切换到前端目录,安装依赖并构建静态资源:
cd ../frontend
npm install
npm run build
构建完成后,会生成 dist/ 目录,里面是可部署的前端网页。
---
七、部署前端
你可以使用多种方式部署前端。推荐使用 serve 工具快速启动:
npm install -g serve
serve -s dist -l 7860
如果你想使用 Nginx 或其他 Web 服务器进行静态部署,也可以参考官方说明配置。
---
八、访问服务
部署完成后,在浏览器中访问你的云服务器:
http://<你的服务器IP>:7860
例如:
http://123.123.123.123:7860
---
九、主要功能
文本转语音(TTS)
语音克隆 (上传语音训练说话人声音)
任务历史记录
多模型支持 (FishStyle、Edge-TTS 等)
---
十、常见问题
没有显卡可以运行吗?
可以。Fish Speech 支持 CPU 推理,只是速度略慢。
声音克隆需要多少语音?
推荐上传清晰普通话语音,时长在 30 秒以上效果较佳。
初次使用很慢?
是正常现象,程序会自动拉取语音模型,请耐心等待。
---
十一、后续可选项
使用 pm2 或 systemd 进行服务守护
配置 HTTPS 和域名反代(如 Nginx + Certbot)
接入语音录音上传页面、移动端