AI 模型配置
NOLUX 的 AI 能力贯穿全部六大模块。本指南介绍如何配置 AI 模型提供商、管理配额和监控用量。
概述
NOLUX AI 服务层采用 模型路由(AI Router) 架构,支持灵活的多提供商切换:
业务请求 → AI Router → 检查租户配置
├── 默认提供商:通义千问(Qwen)
├── BYOM 模式:使用租户自有模型
└── 用量计量 → 返回结果默认 AI 提供商
NOLUX 默认使用**通义千问(Qwen)**作为 AI 服务提供商,所有方案开箱即用:
| 模型 | 用途 | 说明 |
|---|---|---|
| Qwen-Max | 复杂推理 | Copilot 对话、Campaign AI |
| Qwen-Plus | 通用任务 | 情感分析、报告生成 |
| Qwen-Turbo | 快速响应 | 关键词挖掘、信号检测 |
默认配置无需任何设置,开通租户后即可使用。
BYOM(自带模型)
Growth 及以上方案支持 BYOM(Bring Your Own Model)功能,允许租户使用自有的 AI 模型服务。
支持的模型提供商
| 提供商 | 模型 | 接入方式 |
|---|---|---|
| 通义千问 | Qwen 系列 | API Key |
| 文心一言 | ERNIE 系列 | API Key + Secret Key |
| DeepSeek | DeepSeek-V3/R1 | API Key |
| 智谱 AI | GLM 系列 | API Key |
| 月之暗面 | Moonshot | API Key |
| 自定义 | OpenAI 兼容接口 | Base URL + API Key |
配置 BYOM
- 进入 管理 → AI 配置
- 点击 「添加模型提供商」
- 选择提供商类型并填写凭证:

json
{
"provider": "deepseek",
"display_name": "DeepSeek V3",
"api_key": "sk-***",
"base_url": "https://api.deepseek.com/v1",
"model_id": "deepseek-chat",
"is_active": true
}- 点击 「连通性测试」 验证配置
- 保存配置
安全提示
API Key 通过 AES-256 加密存储,系统中不会明文显示。配置完成后仅显示密钥末尾 4 位用于识别。
功能级模型分配
配置多个提供商后,可为不同功能指定不同的模型:
| 功能 | 推荐模型 | 原因 |
|---|---|---|
| Copilot 对话 | 强推理模型(Qwen-Max / DeepSeek-R1) | 需要复杂上下文理解 |
| 情感分析 | 通用模型(Qwen-Plus) | 分类任务,性价比优先 |
| 关键词挖掘 | 快速模型(Qwen-Turbo) | 批量处理,速度优先 |
| 报告生成 | 强推理模型 | 需要长文本生成能力 |
| 广告文案 | 创意模型 | 需要创造性输出 |
配置方式:
- 进入 AI 配置 → 功能映射
- 为每个功能类别选择首选提供商
- 设置降级策略(首选不可用时的备选方案)
连通性测试
配置新的模型提供商后,务必执行连通性测试:
- 在提供商配置页点击 「测试连接」
- 系统自动发送测试请求,验证:
- API 端点可达性
- 认证凭证有效性
- 模型响应正常性
- 响应延迟基准值
测试结果示例:
连通性测试结果
├── 端点可达: ✓ (延迟 45ms)
├── 认证验证: ✓
├── 模型响应: ✓ (首 token 延迟 320ms)
└── 综合评估: 可用配额监控
查看用量
进入 管理 → AI 配置 → 用量统计,查看实时和历史用量数据:

监控维度包括:
| 指标 | 说明 |
|---|---|
| Token 消耗 | 输入 / 输出 Token 分别统计 |
| 调用次数 | 按功能类别和提供商分类 |
| 平均延迟 | 各模型的响应时间趋势 |
| 错误率 | 失败请求占比 |
| 配额使用率 | 当月已用 / 总配额百分比 |
用量告警
系统自动发送用量告警:
| 阈值 | 动作 |
|---|---|
| 80% | 发送邮件提醒至租户管理员 |
| 95% | 发送紧急提醒 + 系统内通知 |
| 100% | 进入超额计费模式,继续可用 |
用量明细
每次 AI 调用都记录详细的计量信息:
json
{
"request_id": "req_abc123",
"tenant_id": "tenant_brand_x",
"user_id": "user_001",
"function": "copilot_chat",
"provider": "qwen",
"model": "qwen-max",
"input_tokens": 1250,
"output_tokens": 680,
"latency_ms": 2340,
"status": "success",
"timestamp": "2026-03-14T10:30:00Z"
}最佳实践
成本优化
- 按需分配模型:不是所有功能都需要最强模型,关键词挖掘等批量任务使用 Turbo 级别即可
- 设置超额预警:在达到配额前及时升级方案或购买加量包
- BYOM 成本对比:当默认配额不足时,对比 NOLUX 超额费率和自有模型成本,选择更经济的方案
可靠性保障
- 配置降级策略:为每个功能设置至少一个备选提供商
- 定期测试连通性:每周执行一次连通性测试,确保服务可用
- 监控错误率:错误率持续高于 5% 时,检查提供商状态或切换备选方案