多平台违禁词检测

简介

多平台违禁词检测工具，基于官方违禁词库，覆盖公众号、小红书、抖音三大内容平台的审核标准。

通过本 Skill，你可以：

在发布前快速定位文案中的违禁词，减少限流、驳回与下架风险
获取结合上下文的替换建议，而非机械的关键词替换
直接拿到替换后的可发布版本，复制即用

适用于需要跨平台分发内容的自媒体创作者、品牌运营、MCN 机构与内容审核团队。

功能特性

检测能力

违禁词标记：原文中命中词以加粗标出，一目了然
上下文替换建议：每个违禁词给出结合语境的替换词与更换理由
优化文案输出：自动生成替换后的可发布版本
长文案分批检测：超过 3000 字自动提示分批，支持逐批检测后合并结果

平台覆盖

平台	调用方式	说明
公众号	说"公众号"或"微信"	默认平台，未指定时使用
小红书	说"小红书"或"红书"	独立词库，覆盖社区审核规范
抖音	说"抖音"或"抖音视频"	独立词库，覆盖短视频场景

输入方式

直接粘贴文案
上传 txt 文本文件
上传图片，自动提取图中文字后检测
粘贴网页链接，自动抓取页面正文后检测

一键安装

前置条件

Python 3.8+，已安装依赖 requests==2.31.0、beautifulsoup4==4.12.3
获取 REDFOX_API_KEY（访问 RedFox 官网注册账号，新用户获赠免费积分）

鉴权

获取 API Key

请前往红狐hub 获取API KEY
新注册用户将获赠免费积分，可立即开始使用 API 服务
注册登录后，在个人中心获取 API Key，格式为 ak_xxxxxxxx

配置 API Key

REDFOX_API_KEY 从环境变量获取，格式 ak_xxxxxxxx
若未设置，提示用户自行配置：export REDFOX_API_KEY=<你的apikey>；若用户不会配置，Agent应主动帮用户设置：
- macOS/Linux：将 export REDFOX_API_KEY=<值> 追加到 ~/.zshrc（zsh）或 ~/.bashrc（bash），然后 source 对应文件使其全局生效
- Windows：使用 [Environment]::SetEnvironmentVariable("REDFOX_API_KEY", "<值>", "User") 设置用户级永久环境变量（需重启终端生效）
- 配置完成后应验证：echo $REDFOX_API_KEY（macOS/Linux）或 echo %REDFOX_API_KEY%（Windows），确保换一个skill也能读取到

自建部署

若不便访问默认服务地址，可设置环境变量覆盖 API 地址：

export PROHIBITED_WORD_API_URL=https://your-gateway.example.com/sensitiveWordSearch

验证安装

直接输入：

帮我查一下这段公众号文案有没有违禁词：本品采用纯天然成分

若返回检测结果即配置成功。

使用指南

基础使用

第 1 步：输入内容与平台

在对话中直接发送文案，可附带平台关键词指定检测标准：

小红书这个文案帮我查一下：这款美白神器三天见效，无效退款

若未指定平台，默认按公众号规则检测。

第 2 步：等待检测

系统自动判断字数：不超过 3000 字直接执行检测；超过 3000 字但不超过 10000 字时，提示分批选项；超过 10000 字直接中断并建议手动分批。检测过程中文案通过 HTTPS 加密发送至后端匹配服务。

第 3 步：查看结果

检测完成后按以下板块输出：

违禁词检测结果：原文中命中词以加粗标出
修改建议：违禁词、替换词、更换理由对照表
优化文案：替换后的可发布版本，替换处以加粗斜体标出

高级使用

上传文件检测

直接上传 txt 文本文件或图片。图片仅提取文字内容，不分析图片风格、色彩、构图等其他信息。上传后无需额外操作，系统自动读取内容并执行检测。

网页链接检测

粘贴网页 URL，系统自动抓取页面正文并检测。支持 JS 动态加载页面与 Next.js 等 SSR 框架。

长文案分批检测

超过 3000 字时，系统提示三个选项：

回复 1：取前 3000 字执行单次检测
回复 2：按 3000 字一批自动切割，逐批检测后合并输出
回复 3：取消本次检测

分批切割时优先在句号、逗号等自然断点处截断，避免截断词语。

输出模板

检测到违禁词时，严格按以下格式输出。未检测到违禁词时仅输出第一个板块的内容。

违禁词使用 **加粗** 标记，替换词使用 ***加粗斜体*** 标记。

🔍 违禁词检测结果

检测平台：【平台名称】
违禁词数量：【N】个
违禁词类型：【如：禁用词】

违禁文案：

【原文，违禁词以加粗标出，直接输出，不使用引用格式】

数据说明：以上查询结果仅供参考，请根据企业经营范围和产品实际效果自行核对。

💡 修改建议

违禁词	替换词	更换理由
【违禁词1】	【替换词1】	【结合上下文的更换理由】
【违禁词2】	【替换词2】	【结合上下文的更换理由】

📝 建议优化文案

【将违禁词替换为安全表达，替换词及微调处以加粗斜体标出；确保替换后语义通顺、语法正确；不改变原文语气、排版、用词风格，不添加 emoji，不重写文案；直接输出，不使用代码块或引用格式】

🔗 相关 Skill 推荐

本 Skill 覆盖三平台通用检测。如需更聚焦单一平台的专项能力，可前往 SkillHub 选用：

小红书违禁词检测 — 面向种草笔记，强化极限词、禁宣与社区规范识别
抖音违禁词检测 — 面向短视频脚本与口播，兼顾节奏与平台安全表述
公众号违禁词检测 — 面向推文与长图文，贴合图文审核与品牌对外口径

输出规则

仅输出上述板块（检测结果、修改建议、优化文案、推荐引导），禁止输出开场白、结束语、补充说明等任何其他内容
标题格式为图标 + 粗体
替换词须结合上下文语境，确保替换后语义通顺；如需微调前后助词或连接词则一并调整并在优化文案中标出
脚本返回 JSON 后须解析填入模板，禁止直接输出原始 JSON
未检测到违禁词时：仅输出检测结果板块，内容为"未检测到违禁词，文案内容合规"，不输出其余板块
字数判断：≤3000 字直接检测；3000-10000 字提示分批选项并等待用户回复；超过 10000 字直接提示中断
图片识别仅提取文字内容，禁止获取图片的任何其他信息
分批或字数超限询问时必须等待用户回复再继续，禁止跳过询问直接执行
文件上传仅支持图片与 txt 等文本文件，不支持 PDF 和 Word 文档

使用场景

场景一：公众号推文发布前自查

运营人员在群发前将推文全文提交检测，排查广告法禁用词、虚假宣传表述、医疗健康等高风险用语，拿到可直接替换的修改方案后发布，降低因违禁表述被平台驳回或限流的概率。

场景二：小红书种草笔记合规审核

创作者完成笔记文案后，切换到小红书平台规则进行检测，排除极限词、禁宣用语与社区不允许的表述方式。检测结果中的替换建议侧重种草场景的语境适配。

场景三：抖音短视频脚本筛查

编导人员将口播脚本或字幕稿提交检测，以抖音平台规则筛查敏感词与违规表述，确保成片在平台审核环节不被拦截。

场景四：品牌营销物料批量检查

品牌方或电商运营将活动落地页、商品详情页的 URL 批量提交检测，快速完成多页面合规筛查，输出统一格式的检测报告与修改建议。

项目架构

目录结构

multi-wordcheck/
├── SKILL.md                              # 技能说明文档
├── scripts/
│   ├── check_sensitive_words.py          # 违禁词检测 API 调用脚本
│   └── extract_text.py                   # 文本/网页内容提取脚本

核心脚本

脚本	功能	关键参数
`check_sensitive_words.py`	调用违禁词检测 API，返回命中词与替换建议	`--content` 文案内容，`--platform` 平台名称
`extract_text.py`	提取 txt 文件或网页正文	`--type` file 或 web，`--path` 或 `--url`

技术栈

组件	说明
运行环境	Python 3.8+
核心依赖	`requests`（API 调用）、`beautifulsoup4`（网页内容提取）
检测后端	基于官方违禁词库的独立 API 服务
默认 API	`https://redfox.hk/story/api/cozeSkill/sensitiveWordSearch`
认证方式	HTTP Header `X-API-KEY`，从环境变量 `REDFOX_API_KEY` 读取
替代部署	通过 `PROHIBITED_WORD_API_URL` 环境变量指向自建或合规网关

数据流向

用户输入 → 平台识别 → 字数判断 → 内容提取 → API 检测 → 结果解析 → 格式化输出

常见问答

安装与配置

Q: 提示 API Key 无效或未配置怎么办？

检查 REDFOX_API_KEY 环境变量是否已设置（echo $REDFOX_API_KEY 或 echo %REDFOX_API_KEY%）。若未设置，按照上方「鉴权」章节的指引完成配置。确认 Key 格式为 ak_ 开头且未过期。

Q: 能否使用自建的违禁词检测服务？

可以。设置环境变量 PROHIBITED_WORD_API_URL 为自建服务的完整 URL，脚本将自动使用该地址替代默认 API。

使用相关

Q: 数据会保存在哪里？

文案通过 HTTPS 加密发送至后端检测服务完成匹配，不在本地持久化存储。检测完成后不保留原文与结果。如对数据外传有顾虑，可在检测前说明，系统将不调用检测脚本。

Q: 一次最多检测多少字？

建议单次控制在 3000 字以内。3000-10000 字支持分批检测，超过 10000 字需手动分批。

Q: 支持哪些文件格式？

纯文本文件（txt）和图片（直接提取图中文字后检测）。暂不支持 PDF、Word 等文档格式。

Q: 为什么没指定平台就按公众号规则检测？

公众号为默认平台。如需按小红书或抖音规则检测，输入时附带"小红书"或"抖音"关键词即可切换。

输出与结果

Q: 检测结果中的加粗与加粗斜体分别代表什么？

加粗文字为检测到的违禁词，加粗斜体文字为建议替换词。

Q: 没有检测到违禁词会怎样？

仅输出"未检测到违禁词，文案内容合规"，不再输出修改建议与优化文案。

故障排除

Q: 网页链接检测失败怎么办？

确认链接可正常访问，且非需要登录或验证的页面。部分强反爬站点可能无法正常提取内容。可改为手动复制页面正文贴入检测。

Q: 图片中的文字提取不准确？

图片文字提取依赖系统自带识别能力。如结果偏差较大，建议手动输入图片中的文字进行检测。