易盾核心架构
整体技术架构
┌─────────────────────────────────────────────────────────────┐
│ 接入层 │
│ REST API / SDK(iOS、Android、Web) / 私有化部署 │
└──────────────────────────┬──────────────────────────────────┘
│
┌──────────────────────────▼──────────────────────────────────┐
│ 网关与路由层 │
│ 鉴权(AppID + SecretKey) 限流 负载均衡 灰度发布 │
└──────────────────────────┬──────────────────────────────────┘
│
┌──────────────────────────▼──────────────────────────────────┐
│ 核心检测引擎 │
│ ┌─────────────┐ ┌─────────────┐ ┌─────────────────────┐ │
│ │ 内容安全 │ │ 业务安全 │ │ 游戏安全 │ │
│ │ 检测引擎 │ │ 风控引擎 │ │ 反外挂引擎 │ │
│ └─────────────┘ └─────────────┘ └─────────────────────┘ │
└──────────────────────────┬──────────────────────────────────┘
│
┌──────────────────────────▼──────────────────────────────────┐
│ AI 能力层 │
│ 图像识别模型 NLP 文本模型 多模态模型 风控模型 行为模型 │
└──────────────────────────┬──────────────────────────────────┘
│
┌──────────────────────────▼──────────────────────────────────┐
│ 数据与样本层 │
│ 违规样本库 黑产特征库 设备指纹库 规则引擎 知识图谱 │
└─────────────────────────────────────────────────────────────┘内容安全检测引擎
图像检测流水线
输入图片(URL 或 Base64)
↓
图片预处理
├── 格式转换(统一为 JPEG/PNG)
├── 尺寸归一化
└── 质量检测(模糊/过暗图片特殊处理)
↓
多模型并行检测
├── 色情检测模型(CNN + 注意力机制)
├── 暴恐检测模型
├── 政治敏感检测模型
├── 广告/水印检测模型
└── OCR 文字提取 → 文本检测
↓
结果融合与置信度计算
↓
规则引擎二次过滤
↓
返回检测结果(label + score + suggestion)返回结果示例:
json
{
"code": 200,
"result": {
"suggestion": "block",
"label": "porn",
"subLabels": [
{ "label": "sexy", "score": 0.92 }
],
"taskId": "xxx"
}
}suggestion 取值:
pass:正常,直接放行review:疑似违规,进入人工审核队列block:确定违规,直接拦截
文本检测流水线
输入文本
↓
文本预处理
├── 编码统一(UTF-8)
├── 变体字还原(①②③ → 123,A → A)
├── 谐音字还原(涩情 → 色情)
└── 图片文字(OCR 提取后检测)
↓
多维度检测
├── 关键词匹配(黑名单词库)
├── NLP 语义分类(BERT 微调)
├── 上下文理解(多轮对话场景)
└── 自定义规则
↓
结果输出文本检测覆盖类型:
| 违规类型 | 说明 |
|---|---|
| 色情低俗 | 性暗示、色情描述 |
| 暴力恐怖 | 暴力内容、恐怖主义 |
| 政治敏感 | 涉政内容 |
| 广告营销 | 垃圾广告、引流 |
| 辱骂攻击 | 人身攻击、歧视 |
| 违禁信息 | 毒品、赌博、诈骗 |
| 自定义 | 客户自定义敏感词 |
音视频检测
音视频检测采用异步检测模式(同步检测延迟过高):
提交检测任务
↓
返回 taskId
↓
后台异步处理
├── 视频:抽帧(每秒 N 帧)→ 图像检测
├── 音频:ASR 语音转文字 → 文本检测
└── 直播:实时流抽帧 + 实时 ASR
↓
结果回调(Webhook)或主动查询业务安全风控引擎
设备指纹技术
设备指纹是业务安全的基础能力,用于识别设备唯一性:
设备指纹采集维度(App SDK)
├── 硬件信息
│ ├── CPU 型号、核数
│ ├── 内存大小
│ ├── 屏幕分辨率
│ └── 传感器列表
├── 系统信息
│ ├── OS 版本
│ ├── 系统语言
│ └── 时区
├── 网络信息
│ ├── IP 地址
│ ├── 运营商
│ └── WiFi SSID(哈希)
└── 行为特征
├── 触摸压力、速度
├── 陀螺仪数据
└── 使用习惯指纹稳定性:设备重装 App、清除数据后,指纹仍可识别同一设备(稳定率 > 95%)
风险评分模型
输入特征
├── 设备指纹
├── 账号信息(注册时间、历史行为)
├── 行为特征(操作速度、轨迹)
├── 环境特征(IP、时间、地理位置)
└── 业务上下文(操作类型、金额)
↓
特征工程
↓
风险评分模型(XGBoost + 深度学习)
↓
风险等级:低风险 / 中风险 / 高风险
↓
处置建议:放行 / 验证 / 拦截智能验证码技术原理
无感验证(核心创新)
传统验证码(图形验证码、短信验证码)用户体验差。易盾智能验证码通过行为分析实现无感验证:
用户访问页面
↓
后台静默采集行为数据
├── 鼠标移动轨迹(Web)
├── 触摸轨迹(App)
├── 页面停留时间
├── 滚动行为
└── 设备指纹
↓
AI 模型实时评分
├── 正常用户(评分高)→ 直接通过,无感验证
├── 可疑用户(评分中)→ 弹出滑动验证码
└── 机器人(评分低)→ 弹出图文验证码或直接拦截验证码类型
| 类型 | 适用场景 | 安全级别 |
|---|---|---|
| 无感验证 | 低风险操作 | ★★★ |
| 滑动拼图 | 注册、登录 | ★★★★ |
| 文字点选 | 高风险操作 | ★★★★★ |
| 图标点选 | 高风险操作 | ★★★★★ |
| 短信验证码 | 支付、修改密码 | ★★★★★ |
对抗黑产
黑产攻击手段 vs 易盾对抗
├── 打码平台(人工识别验证码)
│ └── 对抗:行为分析,人工操作也有特征差异
├── 机器学习破解
│ └── 对抗:验证码动态生成,样本不可复用
├── 模拟器/云手机
│ └── 对抗:环境检测,识别虚拟设备
└── 代理 IP 池
└── 对抗:IP 信誉库,识别代理/机房 IP高可用架构
易盾服务高可用设计
├── 多机房部署(华东主 + 华北备)
├── 自动故障切换(< 30s)
├── 限流熔断(防止雪崩)
├── 异步队列(削峰填谷)
└── SLA:99.9%(内容安全),99.95%(验证码)私有化部署架构
客户私有云
├── 接入层(Nginx 集群)
├── 核心服务(Docker + K8s)
│ ├── 内容安全服务
│ ├── 业务安全服务
│ └── 管理控制台
├── AI 推理层
│ ├── GPU 服务器(图像/视频检测)
│ └── CPU 服务器(文本检测)
└── 数据层
├── MySQL(配置、规则)
├── Redis(缓存、限流)
└── 对象存储(样本、模型)
最小化部署:3 台服务器(1 GPU + 2 CPU)
推荐生产:5+ 台(2 GPU + 3 CPU)