AI 模型配置

NOLUX 的 AI 能力贯穿全部六大模块。本指南介绍如何配置 AI 模型提供商、管理配额和监控用量。

概述

NOLUX AI 服务层采用 模型路由（AI Router） 架构，支持灵活的多提供商切换：

业务请求 → AI Router → 检查租户配置
                      ├── 默认提供商：通义千问（Qwen）
                      ├── BYOM 模式：使用租户自有模型
                      └── 用量计量 → 返回结果

默认 AI 提供商

NOLUX 默认使用**通义千问（Qwen）**作为 AI 服务提供商，所有方案开箱即用：

模型	用途	说明
Qwen-Max	复杂推理	Copilot 对话、Campaign AI
Qwen-Plus	通用任务	情感分析、报告生成
Qwen-Turbo	快速响应	关键词挖掘、信号检测

默认配置无需任何设置，开通租户后即可使用。

BYOM（自带模型）

Growth 及以上方案支持 BYOM（Bring Your Own Model）功能，允许租户使用自有的 AI 模型服务。

支持的模型提供商

提供商	模型	接入方式
通义千问	Qwen 系列	API Key
文心一言	ERNIE 系列	API Key + Secret Key
DeepSeek	DeepSeek-V3/R1	API Key
智谱 AI	GLM 系列	API Key
月之暗面	Moonshot	API Key
自定义	OpenAI 兼容接口	Base URL + API Key

配置 BYOM

进入 管理 → AI 配置
点击 「添加模型提供商」
选择提供商类型并填写凭证：

AI 模型配置

json

{
  "provider": "deepseek",
  "display_name": "DeepSeek V3",
  "api_key": "sk-***",
  "base_url": "https://api.deepseek.com/v1",
  "model_id": "deepseek-chat",
  "is_active": true
}

点击 「连通性测试」 验证配置
保存配置

安全提示

API Key 通过 AES-256 加密存储，系统中不会明文显示。配置完成后仅显示密钥末尾 4 位用于识别。

功能级模型分配

配置多个提供商后，可为不同功能指定不同的模型：

功能	推荐模型	原因
Copilot 对话	强推理模型（Qwen-Max / DeepSeek-R1）	需要复杂上下文理解
情感分析	通用模型（Qwen-Plus）	分类任务，性价比优先
关键词挖掘	快速模型（Qwen-Turbo）	批量处理，速度优先
报告生成	强推理模型	需要长文本生成能力
广告文案	创意模型	需要创造性输出

配置方式：

进入 AI 配置 → 功能映射
为每个功能类别选择首选提供商
设置降级策略（首选不可用时的备选方案）

连通性测试

配置新的模型提供商后，务必执行连通性测试：

在提供商配置页点击 「测试连接」
系统自动发送测试请求，验证：
- API 端点可达性
- 认证凭证有效性
- 模型响应正常性
- 响应延迟基准值

测试结果示例：

连通性测试结果
├── 端点可达: ✓ (延迟 45ms)
├── 认证验证: ✓
├── 模型响应: ✓ (首 token 延迟 320ms)
└── 综合评估: 可用

配额监控

查看用量

进入 管理 → AI 配置 → 用量统计，查看实时和历史用量数据：

AI 用量监控

监控维度包括：

指标	说明
Token 消耗	输入 / 输出 Token 分别统计
调用次数	按功能类别和提供商分类
平均延迟	各模型的响应时间趋势
错误率	失败请求占比
配额使用率	当月已用 / 总配额百分比

用量告警

系统自动发送用量告警：

阈值	动作
80%	发送邮件提醒至租户管理员
95%	发送紧急提醒 + 系统内通知
100%	进入超额计费模式，继续可用

用量明细

每次 AI 调用都记录详细的计量信息：

json

{
  "request_id": "req_abc123",
  "tenant_id": "tenant_brand_x",
  "user_id": "user_001",
  "function": "copilot_chat",
  "provider": "qwen",
  "model": "qwen-max",
  "input_tokens": 1250,
  "output_tokens": 680,
  "latency_ms": 2340,
  "status": "success",
  "timestamp": "2026-03-14T10:30:00Z"
}

最佳实践

成本优化

按需分配模型：不是所有功能都需要最强模型，关键词挖掘等批量任务使用 Turbo 级别即可
设置超额预警：在达到配额前及时升级方案或购买加量包
BYOM 成本对比：当默认配额不足时，对比 NOLUX 超额费率和自有模型成本，选择更经济的方案

可靠性保障

配置降级策略：为每个功能设置至少一个备选提供商
定期测试连通性：每周执行一次连通性测试，确保服务可用
监控错误率：错误率持续高于 5% 时，检查提供商状态或切换备选方案

AI 模型配置 ​

概述 ​

默认 AI 提供商 ​

BYOM（自带模型） ​

支持的模型提供商 ​

配置 BYOM ​

功能级模型分配 ​

连通性测试 ​

配额监控 ​

查看用量 ​

用量告警 ​

用量明细 ​

最佳实践 ​

成本优化 ​

可靠性保障 ​

AI 模型配置

概述

默认 AI 提供商

BYOM（自带模型）

支持的模型提供商

配置 BYOM

功能级模型分配

连通性测试

配额监控

查看用量

用量告警

用量明细

最佳实践

成本优化

可靠性保障