multi-wordcheck

v2026.05.29

基于官方违禁词库,覆盖公众号、小红书、抖音三大平台审核标准,支持文案、文件、图片、链接多形式输入,快速输出违禁词标记与上下文替换建议。

GitHub
CLI command
npx skhub add redfox-data/multi-wordcheck
Markdown
SKILL.md

多平台违禁词检测

简介

多平台违禁词检测工具,基于官方违禁词库,覆盖公众号、小红书、抖音三大内容平台的审核标准。

通过本 Skill,你可以:

  • 在发布前快速定位文案中的违禁词,减少限流、驳回与下架风险
  • 获取结合上下文的替换建议,而非机械的关键词替换
  • 直接拿到替换后的可发布版本,复制即用

适用于需要跨平台分发内容的自媒体创作者、品牌运营、MCN 机构与内容审核团队。


功能特性

检测能力

  • 违禁词标记:原文中命中词以加粗标出,一目了然
  • 上下文替换建议:每个违禁词给出结合语境的替换词与更换理由
  • 优化文案输出:自动生成替换后的可发布版本
  • 长文案分批检测:超过 3000 字自动提示分批,支持逐批检测后合并结果

平台覆盖

平台调用方式说明
公众号说"公众号"或"微信"默认平台,未指定时使用
小红书说"小红书"或"红书"独立词库,覆盖社区审核规范
抖音说"抖音"或"抖音视频"独立词库,覆盖短视频场景

输入方式

  • 直接粘贴文案
  • 上传 txt 文本文件
  • 上传图片,自动提取图中文字后检测
  • 粘贴网页链接,自动抓取页面正文后检测

一键安装

前置条件

  • Python 3.8+,已安装依赖 requests==2.31.0beautifulsoup4==4.12.3
  • 获取 REDFOX_API_KEY(访问 RedFox 官网 注册账号,新用户获赠免费积分)

鉴权

获取 API Key

  1. 请前往 红狐hub 获取API KEY
  2. 新注册用户将获赠免费积分,可立即开始使用 API 服务
  3. 注册登录后,在个人中心获取 API Key,格式为 ak_xxxxxxxx

配置 API Key

  • REDFOX_API_KEY 从环境变量获取,格式 ak_xxxxxxxx
  • 若未设置,提示用户自行配置:export REDFOX_API_KEY=<你的apikey>;若用户不会配置,Agent应主动帮用户设置:
    • macOS/Linux:将 export REDFOX_API_KEY=<值> 追加到 ~/.zshrc(zsh)或 ~/.bashrc(bash),然后 source 对应文件使其全局生效
    • Windows:使用 [Environment]::SetEnvironmentVariable("REDFOX_API_KEY", "<值>", "User") 设置用户级永久环境变量(需重启终端生效)
    • 配置完成后应验证:echo $REDFOX_API_KEY(macOS/Linux)或 echo %REDFOX_API_KEY%(Windows),确保换一个skill也能读取到

自建部署

若不便访问默认服务地址,可设置环境变量覆盖 API 地址:

export PROHIBITED_WORD_API_URL=https://your-gateway.example.com/sensitiveWordSearch

验证安装

直接输入:

帮我查一下这段公众号文案有没有违禁词:本品采用纯天然成分

若返回检测结果即配置成功。


使用指南

基础使用

第 1 步:输入内容与平台

在对话中直接发送文案,可附带平台关键词指定检测标准:

小红书这个文案帮我查一下:这款美白神器三天见效,无效退款

若未指定平台,默认按公众号规则检测。

第 2 步:等待检测

系统自动判断字数:不超过 3000 字直接执行检测;超过 3000 字但不超过 10000 字时,提示分批选项;超过 10000 字直接中断并建议手动分批。检测过程中文案通过 HTTPS 加密发送至后端匹配服务。

第 3 步:查看结果

检测完成后按以下板块输出:

  • 违禁词检测结果:原文中命中词以加粗标出
  • 修改建议:违禁词、替换词、更换理由对照表
  • 优化文案:替换后的可发布版本,替换处以加粗斜体标出

高级使用

上传文件检测

直接上传 txt 文本文件或图片。图片仅提取文字内容,不分析图片风格、色彩、构图等其他信息。上传后无需额外操作,系统自动读取内容并执行检测。

网页链接检测

粘贴网页 URL,系统自动抓取页面正文并检测。支持 JS 动态加载页面与 Next.js 等 SSR 框架。

长文案分批检测

超过 3000 字时,系统提示三个选项:

  • 回复 1:取前 3000 字执行单次检测
  • 回复 2:按 3000 字一批自动切割,逐批检测后合并输出
  • 回复 3:取消本次检测

分批切割时优先在句号、逗号等自然断点处截断,避免截断词语。

输出模板

检测到违禁词时,严格按以下格式输出。未检测到违禁词时仅输出第一个板块的内容。

违禁词使用 **加粗** 标记,替换词使用 ***加粗斜体*** 标记。


🔍 违禁词检测结果

  • 检测平台:【平台名称】
  • 违禁词数量:【N】个
  • 违禁词类型:【如:禁用词】

违禁文案:

【原文,违禁词以加粗标出,直接输出,不使用引用格式】

数据说明:以上查询结果仅供参考,请根据企业经营范围和产品实际效果自行核对。

💡 修改建议

违禁词替换词更换理由
【违禁词1】【替换词1】【结合上下文的更换理由】
【违禁词2】【替换词2】【结合上下文的更换理由】

📝 建议优化文案

【将违禁词替换为安全表达,替换词及微调处以加粗斜体标出;确保替换后语义通顺、语法正确;不改变原文语气、排版、用词风格,不添加 emoji,不重写文案;直接输出,不使用代码块或引用格式】

🔗 相关 Skill 推荐

本 Skill 覆盖三平台通用检测。如需更聚焦单一平台的专项能力,可前往 SkillHub 选用:

输出规则

  1. 仅输出上述板块(检测结果、修改建议、优化文案、推荐引导),禁止输出开场白、结束语、补充说明等任何其他内容
  2. 标题格式为图标 + 粗体
  3. 替换词须结合上下文语境,确保替换后语义通顺;如需微调前后助词或连接词则一并调整并在优化文案中标出
  4. 脚本返回 JSON 后须解析填入模板,禁止直接输出原始 JSON
  5. 未检测到违禁词时:仅输出检测结果板块,内容为"未检测到违禁词,文案内容合规",不输出其余板块
  6. 字数判断:≤3000 字直接检测;3000-10000 字提示分批选项并等待用户回复;超过 10000 字直接提示中断
  7. 图片识别仅提取文字内容,禁止获取图片的任何其他信息
  8. 分批或字数超限询问时必须等待用户回复再继续,禁止跳过询问直接执行
  9. 文件上传仅支持图片与 txt 等文本文件,不支持 PDF 和 Word 文档

使用场景

场景一:公众号推文发布前自查

运营人员在群发前将推文全文提交检测,排查广告法禁用词、虚假宣传表述、医疗健康等高风险用语,拿到可直接替换的修改方案后发布,降低因违禁表述被平台驳回或限流的概率。

场景二:小红书种草笔记合规审核

创作者完成笔记文案后,切换到小红书平台规则进行检测,排除极限词、禁宣用语与社区不允许的表述方式。检测结果中的替换建议侧重种草场景的语境适配。

场景三:抖音短视频脚本筛查

编导人员将口播脚本或字幕稿提交检测,以抖音平台规则筛查敏感词与违规表述,确保成片在平台审核环节不被拦截。

场景四:品牌营销物料批量检查

品牌方或电商运营将活动落地页、商品详情页的 URL 批量提交检测,快速完成多页面合规筛查,输出统一格式的检测报告与修改建议。


项目架构

目录结构

multi-wordcheck/
├── SKILL.md                              # 技能说明文档
├── scripts/
│   ├── check_sensitive_words.py          # 违禁词检测 API 调用脚本
│   └── extract_text.py                   # 文本/网页内容提取脚本

核心脚本

脚本功能关键参数
check_sensitive_words.py调用违禁词检测 API,返回命中词与替换建议--content 文案内容,--platform 平台名称
extract_text.py提取 txt 文件或网页正文--type file 或 web,--path--url

技术栈

组件说明
运行环境Python 3.8+
核心依赖requests(API 调用)、beautifulsoup4(网页内容提取)
检测后端基于官方违禁词库的独立 API 服务
默认 APIhttps://redfox.hk/story/api/cozeSkill/sensitiveWordSearch
认证方式HTTP Header X-API-KEY,从环境变量 REDFOX_API_KEY 读取
替代部署通过 PROHIBITED_WORD_API_URL 环境变量指向自建或合规网关

数据流向

用户输入 → 平台识别 → 字数判断 → 内容提取 → API 检测 → 结果解析 → 格式化输出

常见问答

安装与配置

Q: 提示 API Key 无效或未配置怎么办?

检查 REDFOX_API_KEY 环境变量是否已设置(echo $REDFOX_API_KEYecho %REDFOX_API_KEY%)。若未设置,按照上方「鉴权」章节的指引完成配置。确认 Key 格式为 ak_ 开头且未过期。

Q: 能否使用自建的违禁词检测服务?

可以。设置环境变量 PROHIBITED_WORD_API_URL 为自建服务的完整 URL,脚本将自动使用该地址替代默认 API。

使用相关

Q: 数据会保存在哪里?

文案通过 HTTPS 加密发送至后端检测服务完成匹配,不在本地持久化存储。检测完成后不保留原文与结果。如对数据外传有顾虑,可在检测前说明,系统将不调用检测脚本。

Q: 一次最多检测多少字?

建议单次控制在 3000 字以内。3000-10000 字支持分批检测,超过 10000 字需手动分批。

Q: 支持哪些文件格式?

纯文本文件(txt)和图片(直接提取图中文字后检测)。暂不支持 PDF、Word 等文档格式。

Q: 为什么没指定平台就按公众号规则检测?

公众号为默认平台。如需按小红书或抖音规则检测,输入时附带"小红书"或"抖音"关键词即可切换。

输出与结果

Q: 检测结果中的加粗与加粗斜体分别代表什么?

加粗文字为检测到的违禁词,加粗斜体文字为建议替换词。

Q: 没有检测到违禁词会怎样?

仅输出"未检测到违禁词,文案内容合规",不再输出修改建议与优化文案。

故障排除

Q: 网页链接检测失败怎么办?

确认链接可正常访问,且非需要登录或验证的页面。部分强反爬站点可能无法正常提取内容。可改为手动复制页面正文贴入检测。

Q: 图片中的文字提取不准确?

图片文字提取依赖系统自带识别能力。如结果偏差较大,建议手动输入图片中的文字进行检测。

Discovery
Tags

No tags published for this skill.

Version
Latest version metadata

Version

v2026.05.29

Published

May 29, 2026

Category

Uncategorized

License

Not specified

Source path

skills/multi-wordcheck

Default branch

main

Latest commit

933b569

Tree SHA

8cc9ca4