refactor: 合并 claude-marketplace,重构目录结构为单一仓库
- 重命名 plugins/ → skills/,个人插件迁移到 skills-personal/(gitignore) - 更新 generate-marketplace.py 支持 config 读取和 skills-personal 扫描 - 新增 claude-config.yaml(技能启用/禁用 + MCP 配置) - 新增 init.sh(交互式 MCP 初始化,支持 stdio/SSE 模式) - 新增 CLAUDE.md 项目说明 - 重写 README.md 反映新结构 - 删除过时脚本:PUSH.sh、generate-marketplace.sh、convert-skills.sh Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
This commit is contained in:
200
skills/doubao-voice-plugin/STATUS.md
Normal file
200
skills/doubao-voice-plugin/STATUS.md
Normal file
@@ -0,0 +1,200 @@
|
||||
# 豆包语音插件 - 开发状态
|
||||
|
||||
**更新时间**: 2026-02-07
|
||||
**版本**: 1.0.0
|
||||
|
||||
---
|
||||
|
||||
## ✅ 已完成功能
|
||||
|
||||
### 1. TTS (文字转语音) - 完全可用 ✅
|
||||
|
||||
**测试状态**: 通过
|
||||
**API版本**: V1
|
||||
**可用音色**:
|
||||
- BV700_V2_streaming (通用女声)
|
||||
- BV701_V2_streaming (通用男声)
|
||||
- BV406_streaming (温柔女声)
|
||||
- BV158_streaming (活泼女声)
|
||||
- BV115_streaming (磁性男声)
|
||||
|
||||
**测试命令**:
|
||||
```bash
|
||||
source scripts/setup_env.sh
|
||||
python3 scripts/voice_converter.py tts "你好世界" -o hello.mp3
|
||||
```
|
||||
|
||||
**测试结果**:
|
||||
- ✅ HTTP 200 OK
|
||||
- ✅ Code 3000 Success
|
||||
- ✅ 成功生成 MP3 文件
|
||||
- ✅ 音质正常
|
||||
|
||||
---
|
||||
|
||||
## ⚠️ 待完成功能
|
||||
|
||||
### 2. ASR (语音转文字) - 待启用服务
|
||||
|
||||
**问题**: Code 1001 - "requested resource not granted"
|
||||
|
||||
**原因**: ASR 服务未在火山引擎控制台正确启用
|
||||
|
||||
**解决步骤**:
|
||||
1. 访问: https://console.volcengine.com/speech/service
|
||||
2. 找到 "语音识别 (ASR)" 服务
|
||||
3. 确保服务已启用并勾选必要选项
|
||||
4. 等待服务生效(可能需要几分钟)
|
||||
5. 重新测试
|
||||
|
||||
**测试命令** (服务启用后):
|
||||
```bash
|
||||
python3 scripts/voice_converter.py asr audio.mp3
|
||||
```
|
||||
|
||||
---
|
||||
|
||||
### 3. V3 API / 豆包2.0音色 - 调试中
|
||||
|
||||
**问题**: Code 45000000 - "get resource id empty"
|
||||
|
||||
**已尝试的方法**:
|
||||
- [x] Resource-Id header
|
||||
- [x] X-Resource-Id header
|
||||
- [x] resource_id query parameter
|
||||
- [x] resource_id in app config
|
||||
- [x] 多种 resource_id 值: volc.bigmodel.tts, volc.seed-tts.default, volc.tts.default
|
||||
|
||||
**当前状态**: 所有方法均返回相同错误
|
||||
|
||||
**可能原因**:
|
||||
1. V3 API 可能需要不同的认证方式 (IAM签名)
|
||||
2. 需要特殊的服务实例配置
|
||||
3. Resource-Id 的获取或配置方法不正确
|
||||
|
||||
**建议**:
|
||||
- 联系火山引擎技术支持获取 V3 API 正确配置方法
|
||||
- 或继续使用 V1 API (已满足基本需求)
|
||||
|
||||
---
|
||||
|
||||
## 📁 项目文件结构
|
||||
|
||||
```
|
||||
plugins/doubao-voice-plugin/
|
||||
├── .claude-plugin/
|
||||
│ └── plugin.json # 插件元数据
|
||||
├── skills/
|
||||
│ └── SKILL.md # 技能定义和文档
|
||||
├── scripts/
|
||||
│ ├── voice_converter.py # 主转换工具 (V1 API, 可用)
|
||||
│ ├── voice_converter_v2.py # 手动签名版本 (待测试)
|
||||
│ ├── voice_converter_sdk.py # SDK版本 (待测试)
|
||||
│ ├── check_credentials.py # 凭证检查工具
|
||||
│ ├── test_services.py # 服务状态测试
|
||||
│ ├── test_v3_debug.py # V3 API 调试脚本
|
||||
│ ├── setup_env.sh # 环境变量配置脚本
|
||||
│ └── README_TEST.md # 测试报告
|
||||
├── README.md # 用户文档
|
||||
└── STATUS.md # 本文件 (开发状态)
|
||||
```
|
||||
|
||||
---
|
||||
|
||||
## 🔧 诊断工具
|
||||
|
||||
### 检查凭证配置
|
||||
```bash
|
||||
python3 scripts/check_credentials.py
|
||||
```
|
||||
显示当前环境变量配置状态
|
||||
|
||||
### 测试服务状态
|
||||
```bash
|
||||
python3 scripts/test_services.py
|
||||
```
|
||||
测试 TTS 和 ASR 服务是否可用
|
||||
|
||||
### V3 API 调试
|
||||
```bash
|
||||
python3 scripts/test_v3_debug.py
|
||||
```
|
||||
测试多种 V3 API 配置方式
|
||||
|
||||
---
|
||||
|
||||
## 📊 当前凭证配置
|
||||
|
||||
```bash
|
||||
DOUBAO_APP_ID="your_app_id"
|
||||
DOUBAO_ACCESS_TOKEN="your_access_token"
|
||||
|
||||
# V3 可选配置 (暂不可用)
|
||||
# DOUBAO_USE_V3="true"
|
||||
# DOUBAO_RESOURCE_ID="volc.bigmodel.tts"
|
||||
```
|
||||
|
||||
**Access Key 信息** (用于签名认证,暂未使用):
|
||||
- Access Key ID: your_access_key_id
|
||||
- Secret Access Key: your_secret_access_key
|
||||
|
||||
---
|
||||
|
||||
## 🎯 下一步计划
|
||||
|
||||
### 立即可用
|
||||
1. ✅ **使用 TTS 功能**
|
||||
- 集成到应用中
|
||||
- 测试不同音色
|
||||
- 生产环境部署
|
||||
|
||||
### 短期目标 (1-3天)
|
||||
2. ⚠️ **启用 ASR 服务**
|
||||
- 在控制台启用服务
|
||||
- 测试语音识别功能
|
||||
- 完善错误处理
|
||||
|
||||
### 长期目标 (可选)
|
||||
3. 🔄 **V3 API 支持**
|
||||
- 联系火山引擎技术支持
|
||||
- 获取正确的 Resource-Id 配置方法
|
||||
- 支持豆包2.0高级音色
|
||||
|
||||
---
|
||||
|
||||
## 📞 技术支持
|
||||
|
||||
### 火山引擎
|
||||
- 文档: https://www.volcengine.com/docs/6561/1329505
|
||||
- 控制台: https://console.volcengine.com/speech/app
|
||||
- 服务管理: https://console.volcengine.com/speech/service
|
||||
|
||||
### 常见问题解决
|
||||
1. **TTS 可用但 ASR 不可用**
|
||||
- 检查控制台 ASR 服务是否启用
|
||||
- 确认勾选了"语音识别"选项
|
||||
|
||||
2. **V3 API 持续报错**
|
||||
- 暂时使用 V1 API
|
||||
- 联系火山引擎技术支持
|
||||
|
||||
3. **认证失败**
|
||||
- 检查环境变量是否正确设置
|
||||
- 确认 Access Token 格式正确
|
||||
- 注意 Authorization header 使用 `Bearer;{token}` (有分号)
|
||||
|
||||
---
|
||||
|
||||
## ✨ 总结
|
||||
|
||||
**当前可用**: TTS (文字转语音) 功能完全可用,可以投入使用
|
||||
|
||||
**待解决**:
|
||||
1. 在控制台启用 ASR 服务
|
||||
2. (可选) 解决 V3 API 配置问题
|
||||
|
||||
**建议**: 先使用 V1 API 的 TTS 功能,满足基本语音合成需求。ASR 功能在控制台启用服务后即可使用。V3 API 的豆包2.0音色为可选功能,可以后续再解决。
|
||||
|
||||
---
|
||||
|
||||
*Generated by Claude Code on 2026-02-07*
|
||||
Reference in New Issue
Block a user