wordfilter敏感词过滤工具

联合创作 · 2023-09-29 05:05

wordfilter 是一个用 DFA 算法实现的敏感词过滤工具,支持 Skip 参数控制敏感词干扰噪音,支持白名单跳过白名单词汇,支持在线添加和删除敏感词,管理敏感词库。

API 预览

  • 敏感词替换

    String text = "我们决定紧急征调5000人前往宅区帮助灾民,并且决定为紧急事件打开绿灯";
    filter.replace(text);

     

  • 是否包含敏感词

    String text = "我小时候有个朋友叫张三,现在和他几乎没联系了";
    filter.include(text);

     

  • 获取敏感词数

    String text = "我小时候有个朋友叫张三,现在和他几乎没联系了";
    int result = filter.wordCount(text);

     

  • 获取敏感词列表

    String text = "我小时候有个朋友叫张三,现在和他几乎没联系了";
    List<String> words = filter.wordList(text);

     

  • 增加白名单功能

    - blacklist.txt
    - whitelist.txt

     

  • 增加方法重载

    - replace(final String text)                     // distance=0&symbol=*
    - replace(final String text, final char symbol)  // distance=0
    - include(final String text)                     // distance=0
    - wordCount(final String text)                   // distance=0
    - wordList(final String text)                    // distance=0

     

  • 增加在线添加敏感词方法

    //此处将5000加入黑名单
    context.addWord(Collections.singletonList("5000"), WordType.BLACK);

     

  • 增加在线删除敏感词方法

    //此处将5000移出黑名单(若黑名单没有该词组将忽略)
    context.removeWord(Collections.singletonList("5000"), WordType.BLACK);
    //此处将紧急事件移出白名单(若白名单没有该词组将忽略)
    context.removeWord(Collections.singletonList("紧急事件"), WordType.WHITE);
浏览 6
点赞
评论
收藏
分享

手机扫一扫分享

编辑
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

编辑
举报