多平台违禁词检测
简介
多平台违禁词检测工具,基于官方违禁词库,覆盖公众号、小红书、抖音三大内容平台的审核标准。
通过本 Skill,你可以:
- 在发布前快速定位文案中的违禁词,减少限流、驳回与下架风险
- 获取结合上下文的替换建议,而非机械的关键词替换
- 直接拿到替换后的可发布版本,复制即用
适用于需要跨平台分发内容的自媒体创作者、品牌运营、MCN 机构与内容审核团队。
功能特性
检测能力
- 违禁词标记:原文中命中词以加粗标出,一目了然
- 上下文替换建议:每个违禁词给出结合语境的替换词与更换理由
- 优化文案输出:自动生成替换后的可发布版本
- 长文案分批检测:超过 3000 字自动提示分批,支持逐批检测后合并结果
平台覆盖
| 平台 | 调用方式 | 说明 |
|---|---|---|
| 公众号 | 说"公众号"或"微信" | 默认平台,未指定时使用 |
| 小红书 | 说"小红书"或"红书" | 独立词库,覆盖社区审核规范 |
| 抖音 | 说"抖音"或"抖音视频" | 独立词库,覆盖短视频场景 |
输入方式
- 直接粘贴文案
- 上传 txt 文本文件
- 上传图片,自动提取图中文字后检测
- 粘贴网页链接,自动抓取页面正文后检测
一键安装
前置条件
- Python 3.8+,已安装依赖
requests==2.31.0、beautifulsoup4==4.12.3 - 获取
REDFOX_API_KEY(访问 RedFox 官网 注册账号,新用户获赠免费积分)
鉴权
获取 API Key
- 请前往 红狐hub 获取API KEY
- 新注册用户将获赠免费积分,可立即开始使用 API 服务
- 注册登录后,在个人中心获取 API Key,格式为
ak_xxxxxxxx
配置 API Key
REDFOX_API_KEY从环境变量获取,格式ak_xxxxxxxx- 若未设置,提示用户自行配置:
export REDFOX_API_KEY=<你的apikey>;若用户不会配置,Agent应主动帮用户设置:- macOS/Linux:将
export REDFOX_API_KEY=<值>追加到~/.zshrc(zsh)或~/.bashrc(bash),然后source对应文件使其全局生效 - Windows:使用
[Environment]::SetEnvironmentVariable("REDFOX_API_KEY", "<值>", "User")设置用户级永久环境变量(需重启终端生效) - 配置完成后应验证:
echo $REDFOX_API_KEY(macOS/Linux)或echo %REDFOX_API_KEY%(Windows),确保换一个skill也能读取到
- macOS/Linux:将
自建部署
若不便访问默认服务地址,可设置环境变量覆盖 API 地址:
export PROHIBITED_WORD_API_URL=https://your-gateway.example.com/sensitiveWordSearch
验证安装
直接输入:
帮我查一下这段公众号文案有没有违禁词:本品采用纯天然成分
若返回检测结果即配置成功。
使用指南
基础使用
第 1 步:输入内容与平台
在对话中直接发送文案,可附带平台关键词指定检测标准:
小红书这个文案帮我查一下:这款美白神器三天见效,无效退款
若未指定平台,默认按公众号规则检测。
第 2 步:等待检测
系统自动判断字数:不超过 3000 字直接执行检测;超过 3000 字但不超过 10000 字时,提示分批选项;超过 10000 字直接中断并建议手动分批。检测过程中文案通过 HTTPS 加密发送至后端匹配服务。
第 3 步:查看结果
检测完成后按以下板块输出:
- 违禁词检测结果:原文中命中词以加粗标出
- 修改建议:违禁词、替换词、更换理由对照表
- 优化文案:替换后的可发布版本,替换处以加粗斜体标出
高级使用
上传文件检测
直接上传 txt 文本文件或图片。图片仅提取文字内容,不分析图片风格、色彩、构图等其他信息。上传后无需额外操作,系统自动读取内容并执行检测。
网页链接检测
粘贴网页 URL,系统自动抓取页面正文并检测。支持 JS 动态加载页面与 Next.js 等 SSR 框架。
长文案分批检测
超过 3000 字时,系统提示三个选项:
- 回复
1:取前 3000 字执行单次检测 - 回复
2:按 3000 字一批自动切割,逐批检测后合并输出 - 回复
3:取消本次检测
分批切割时优先在句号、逗号等自然断点处截断,避免截断词语。
输出模板
检测到违禁词时,严格按以下格式输出。未检测到违禁词时仅输出第一个板块的内容。
违禁词使用 **加粗** 标记,替换词使用 ***加粗斜体*** 标记。
🔍 违禁词检测结果
- 检测平台:【平台名称】
- 违禁词数量:【N】个
- 违禁词类型:【如:禁用词】
违禁文案:
【原文,违禁词以加粗标出,直接输出,不使用引用格式】
数据说明:以上查询结果仅供参考,请根据企业经营范围和产品实际效果自行核对。
💡 修改建议
| 违禁词 | 替换词 | 更换理由 |
|---|---|---|
| 【违禁词1】 | 【替换词1】 | 【结合上下文的更换理由】 |
| 【违禁词2】 | 【替换词2】 | 【结合上下文的更换理由】 |
📝 建议优化文案
【将违禁词替换为安全表达,替换词及微调处以加粗斜体标出;确保替换后语义通顺、语法正确;不改变原文语气、排版、用词风格,不添加 emoji,不重写文案;直接输出,不使用代码块或引用格式】
🔗 相关 Skill 推荐
本 Skill 覆盖三平台通用检测。如需更聚焦单一平台的专项能力,可前往 SkillHub 选用:
- 小红书违禁词检测 — 面向种草笔记,强化极限词、禁宣与社区规范识别
- 抖音违禁词检测 — 面向短视频脚本与口播,兼顾节奏与平台安全表述
- 公众号违禁词检测 — 面向推文与长图文,贴合图文审核与品牌对外口径
输出规则
- 仅输出上述板块(检测结果、修改建议、优化文案、推荐引导),禁止输出开场白、结束语、补充说明等任何其他内容
- 标题格式为图标 + 粗体
- 替换词须结合上下文语境,确保替换后语义通顺;如需微调前后助词或连接词则一并调整并在优化文案中标出
- 脚本返回 JSON 后须解析填入模板,禁止直接输出原始 JSON
- 未检测到违禁词时:仅输出检测结果板块,内容为"未检测到违禁词,文案内容合规",不输出其余板块
- 字数判断:≤3000 字直接检测;3000-10000 字提示分批选项并等待用户回复;超过 10000 字直接提示中断
- 图片识别仅提取文字内容,禁止获取图片的任何其他信息
- 分批或字数超限询问时必须等待用户回复再继续,禁止跳过询问直接执行
- 文件上传仅支持图片与 txt 等文本文件,不支持 PDF 和 Word 文档
使用场景
场景一:公众号推文发布前自查
运营人员在群发前将推文全文提交检测,排查广告法禁用词、虚假宣传表述、医疗健康等高风险用语,拿到可直接替换的修改方案后发布,降低因违禁表述被平台驳回或限流的概率。
场景二:小红书种草笔记合规审核
创作者完成笔记文案后,切换到小红书平台规则进行检测,排除极限词、禁宣用语与社区不允许的表述方式。检测结果中的替换建议侧重种草场景的语境适配。
场景三:抖音短视频脚本筛查
编导人员将口播脚本或字幕稿提交检测,以抖音平台规则筛查敏感词与违规表述,确保成片在平台审核环节不被拦截。
场景四:品牌营销物料批量检查
品牌方或电商运营将活动落地页、商品详情页的 URL 批量提交检测,快速完成多页面合规筛查,输出统一格式的检测报告与修改建议。
项目架构
目录结构
multi-wordcheck/
├── SKILL.md # 技能说明文档
├── scripts/
│ ├── check_sensitive_words.py # 违禁词检测 API 调用脚本
│ └── extract_text.py # 文本/网页内容提取脚本
核心脚本
| 脚本 | 功能 | 关键参数 |
|---|---|---|
check_sensitive_words.py | 调用违禁词检测 API,返回命中词与替换建议 | --content 文案内容,--platform 平台名称 |
extract_text.py | 提取 txt 文件或网页正文 | --type file 或 web,--path 或 --url |
技术栈
| 组件 | 说明 |
|---|---|
| 运行环境 | Python 3.8+ |
| 核心依赖 | requests(API 调用)、beautifulsoup4(网页内容提取) |
| 检测后端 | 基于官方违禁词库的独立 API 服务 |
| 默认 API | https://redfox.hk/story/api/cozeSkill/sensitiveWordSearch |
| 认证方式 | HTTP Header X-API-KEY,从环境变量 REDFOX_API_KEY 读取 |
| 替代部署 | 通过 PROHIBITED_WORD_API_URL 环境变量指向自建或合规网关 |
数据流向
用户输入 → 平台识别 → 字数判断 → 内容提取 → API 检测 → 结果解析 → 格式化输出
常见问答
安装与配置
Q: 提示 API Key 无效或未配置怎么办?
检查 REDFOX_API_KEY 环境变量是否已设置(echo $REDFOX_API_KEY 或 echo %REDFOX_API_KEY%)。若未设置,按照上方「鉴权」章节的指引完成配置。确认 Key 格式为 ak_ 开头且未过期。
Q: 能否使用自建的违禁词检测服务?
可以。设置环境变量 PROHIBITED_WORD_API_URL 为自建服务的完整 URL,脚本将自动使用该地址替代默认 API。
使用相关
Q: 数据会保存在哪里?
文案通过 HTTPS 加密发送至后端检测服务完成匹配,不在本地持久化存储。检测完成后不保留原文与结果。如对数据外传有顾虑,可在检测前说明,系统将不调用检测脚本。
Q: 一次最多检测多少字?
建议单次控制在 3000 字以内。3000-10000 字支持分批检测,超过 10000 字需手动分批。
Q: 支持哪些文件格式?
纯文本文件(txt)和图片(直接提取图中文字后检测)。暂不支持 PDF、Word 等文档格式。
Q: 为什么没指定平台就按公众号规则检测?
公众号为默认平台。如需按小红书或抖音规则检测,输入时附带"小红书"或"抖音"关键词即可切换。
输出与结果
Q: 检测结果中的加粗与加粗斜体分别代表什么?
加粗文字为检测到的违禁词,加粗斜体文字为建议替换词。
Q: 没有检测到违禁词会怎样?
仅输出"未检测到违禁词,文案内容合规",不再输出修改建议与优化文案。
故障排除
Q: 网页链接检测失败怎么办?
确认链接可正常访问,且非需要登录或验证的页面。部分强反爬站点可能无法正常提取内容。可改为手动复制页面正文贴入检测。
Q: 图片中的文字提取不准确?
图片文字提取依赖系统自带识别能力。如结果偏差较大,建议手动输入图片中的文字进行检测。