Skip to content

AI 模型配置

NOLUX 的 AI 能力贯穿全部六大模块。本指南介绍如何配置 AI 模型提供商、管理配额和监控用量。

概述

NOLUX AI 服务层采用 模型路由(AI Router) 架构,支持灵活的多提供商切换:

业务请求 → AI Router → 检查租户配置
                      ├── 默认提供商:通义千问(Qwen)
                      ├── BYOM 模式:使用租户自有模型
                      └── 用量计量 → 返回结果

默认 AI 提供商

NOLUX 默认使用**通义千问(Qwen)**作为 AI 服务提供商,所有方案开箱即用:

模型用途说明
Qwen-Max复杂推理Copilot 对话、Campaign AI
Qwen-Plus通用任务情感分析、报告生成
Qwen-Turbo快速响应关键词挖掘、信号检测

默认配置无需任何设置,开通租户后即可使用。

BYOM(自带模型)

Growth 及以上方案支持 BYOM(Bring Your Own Model)功能,允许租户使用自有的 AI 模型服务。

支持的模型提供商

提供商模型接入方式
通义千问Qwen 系列API Key
文心一言ERNIE 系列API Key + Secret Key
DeepSeekDeepSeek-V3/R1API Key
智谱 AIGLM 系列API Key
月之暗面MoonshotAPI Key
自定义OpenAI 兼容接口Base URL + API Key

配置 BYOM

  1. 进入 管理 → AI 配置
  2. 点击 「添加模型提供商」
  3. 选择提供商类型并填写凭证:

AI 模型配置

json
{
  "provider": "deepseek",
  "display_name": "DeepSeek V3",
  "api_key": "sk-***",
  "base_url": "https://api.deepseek.com/v1",
  "model_id": "deepseek-chat",
  "is_active": true
}
  1. 点击 「连通性测试」 验证配置
  2. 保存配置

安全提示

API Key 通过 AES-256 加密存储,系统中不会明文显示。配置完成后仅显示密钥末尾 4 位用于识别。

功能级模型分配

配置多个提供商后,可为不同功能指定不同的模型:

功能推荐模型原因
Copilot 对话强推理模型(Qwen-Max / DeepSeek-R1)需要复杂上下文理解
情感分析通用模型(Qwen-Plus)分类任务,性价比优先
关键词挖掘快速模型(Qwen-Turbo)批量处理,速度优先
报告生成强推理模型需要长文本生成能力
广告文案创意模型需要创造性输出

配置方式:

  1. 进入 AI 配置 → 功能映射
  2. 为每个功能类别选择首选提供商
  3. 设置降级策略(首选不可用时的备选方案)

连通性测试

配置新的模型提供商后,务必执行连通性测试:

  1. 在提供商配置页点击 「测试连接」
  2. 系统自动发送测试请求,验证:
    • API 端点可达性
    • 认证凭证有效性
    • 模型响应正常性
    • 响应延迟基准值

测试结果示例:

连通性测试结果
├── 端点可达: ✓ (延迟 45ms)
├── 认证验证: ✓
├── 模型响应: ✓ (首 token 延迟 320ms)
└── 综合评估: 可用

配额监控

查看用量

进入 管理 → AI 配置 → 用量统计,查看实时和历史用量数据:

AI 用量监控

监控维度包括:

指标说明
Token 消耗输入 / 输出 Token 分别统计
调用次数按功能类别和提供商分类
平均延迟各模型的响应时间趋势
错误率失败请求占比
配额使用率当月已用 / 总配额百分比

用量告警

系统自动发送用量告警:

阈值动作
80%发送邮件提醒至租户管理员
95%发送紧急提醒 + 系统内通知
100%进入超额计费模式,继续可用

用量明细

每次 AI 调用都记录详细的计量信息:

json
{
  "request_id": "req_abc123",
  "tenant_id": "tenant_brand_x",
  "user_id": "user_001",
  "function": "copilot_chat",
  "provider": "qwen",
  "model": "qwen-max",
  "input_tokens": 1250,
  "output_tokens": 680,
  "latency_ms": 2340,
  "status": "success",
  "timestamp": "2026-03-14T10:30:00Z"
}

最佳实践

成本优化

  1. 按需分配模型:不是所有功能都需要最强模型,关键词挖掘等批量任务使用 Turbo 级别即可
  2. 设置超额预警:在达到配额前及时升级方案或购买加量包
  3. BYOM 成本对比:当默认配额不足时,对比 NOLUX 超额费率和自有模型成本,选择更经济的方案

可靠性保障

  1. 配置降级策略:为每个功能设置至少一个备选提供商
  2. 定期测试连通性:每周执行一次连通性测试,确保服务可用
  3. 监控错误率:错误率持续高于 5% 时,检查提供商状态或切换备选方案

相关文档

AI 驱动商务操作系统