问题不大
发布于 2025-06-01 / 0 阅读

使用云服务器部署+Fish+Speech:中文语音合成与声音克隆平台

本文介绍如何在无显卡的云服务器上部署Fish Speech GUI,实现文字转语音(TTS)和声音克隆功能。


一、项目简介

Fish Speech 是一个中文语音合成平台,支持文本转语音和声音克隆。开源版本基于 FastAPI + Vue3,前后端分离,适合部署到私有服务器。


二、部署要求

项目要求说明
系统Ubuntu 20.04+ / Debian
CPU至少 2 核
内存推荐 4GB 及以上
显卡可选,CPU 也支持
Python3.10+
Node.js18+
端口默认使用 7860

三、准备环境

1. 安装依赖项

sudo apt update && sudo apt upgrade -y
sudo apt install -y python3.10 python3.10-venv python3.10-dev git curl ffmpeg build-essential

2. 安装 Node.js 18

curl -fsSL https://deb.nodesource.com/setup_18.x | sudo -E bash -
sudo apt install -y nodejs


---

四、克隆项目

使用 Git 克隆项目代码:

git clone https://github.com/AnyaCoder/fish-speech-gui.git
cd fish-speech-gui


---

五、部署后端

进入后端目录并创建 Python 虚拟环境:

cd backend
python3.10 -m venv venv
source venv/bin/activate

安装后端依赖:

pip install --upgrade pip
pip install -r requirements.txt

启动后端服务:

python main.py


---

六、构建前端

切换到前端目录,安装依赖并构建静态资源:

cd ../frontend
npm install
npm run build

构建完成后,会生成 dist/ 目录,里面是可部署的前端网页。


---

七、部署前端

你可以使用多种方式部署前端。推荐使用 serve 工具快速启动:

npm install -g serve
serve -s dist -l 7860

如果你想使用 Nginx 或其他 Web 服务器进行静态部署,也可以参考官方说明配置。


---

八、访问服务

部署完成后,在浏览器中访问你的云服务器:

http://<你的服务器IP>:7860

例如:

http://123.123.123.123:7860


---

九、主要功能

文本转语音(TTS)

语音克隆 (上传语音训练说话人声音)

任务历史记录

多模型支持 (FishStyle、Edge-TTS 等)



---

十、常见问题

没有显卡可以运行吗?
可以。Fish Speech 支持 CPU 推理,只是速度略慢。

声音克隆需要多少语音?
推荐上传清晰普通话语音,时长在 30 秒以上效果较佳。

初次使用很慢?
是正常现象,程序会自动拉取语音模型,请耐心等待。



---

十一、后续可选项

使用 pm2 或 systemd 进行服务守护

配置 HTTPS 和域名反代(如 Nginx + Certbot)

接入语音录音上传页面、移动端