a2f-service/README.md

# Audio2Face Python Service

这是一个基于NVIDIA Audio2Face的Python服务项目，提供音频到面部表情的转换功能，支持3D模型实时表情驱动。

## 项目结构

```
pyservice/
├── examples/       # 示例代码和资源
├── scripts/        # 工具脚本
├── services/       # 核心服务实现
└── external/       # 外部依赖库（需手动下载）
```

## 快速开始

### 1. 下载外部依赖

请下载NVIDIA Audio2Face-3D-Samples并放置到项目根目录的`external/`文件夹中：

```bash
git clone https://github.com/NVIDIA/Audio2Face-3D-Samples.git external/Audio2Face-3D-Samples
```

或直接下载并解压到`external/`目录：
<mcurl name="Audio2Face-3D-Samples" url="https://github.com/NVIDIA/Audio2Face-3D-Samples?tab=readme-ov-file"></mcurl>

### 2. 创建虚拟环境

```bash
# 创建虚拟环境
python -m venv a2f_venv

# 激活虚拟环境（Windows）
a2f_venv\Scripts\Activate.ps1

# 激活虚拟环境（Linux/Mac）
# source a2f_venv/bin/activate
```

### 3. 安装依赖

导航到服务目录并安装所需依赖：

```bash
cd services/a2f_api
pip install -r requirements.txt
```

### 4. 运行服务

```bash
# 在services/a2f_api目录下运行
python app.py
```

### 5. 查看示例

打开3D示例目录并启动本地服务器：

```bash
cd examples/3d
live-server index.html
```

然后在浏览器中访问显示的URL即可查看3D表情驱动示例。

## 主要功能

- 音频到面部表情转换服务
- 文本转语音集成
- 3D模型实时表情驱动
- 支持多种表情数据格式

## 技术栈

- Python
- Flask/FastAPI (API服务)
- Babylon.js (3D渲染示例)
- NVIDIA Audio2Face技术

## 注意事项

- 确保已安装最新版本的Python 3.7+
- 部分功能可能需要NVIDIA GPU支持
- 首次运行可能需要较长时间加载模型

## 联系方式

如有问题或建议，请联系项目维护人员。