时间:2021-07-01 10:21:17 帮助过:76人阅读
评论区敏感词替换,如果在评论中发现敏感词存入数据库之前,进行替换敏感词,用正则的话该如何做?假如如果想替换“鸡蛋”这个词,但文章中有“臭鸡蛋”这个词,如何保证鸡蛋被替换而臭鸡蛋不被替换?
感谢邀请。
如果是我的话只会进行检查,然后给出敏感词提示,不会直接进行替换的。首先,我个人不喜欢这个事情,因为替换后肯定词不达意,而且这种检查作用比想象的小的多的多,有心人会避开检查机制,甚至不使用敏感词一样可以表达不好的言论,所以治标不治本。其次,本来正常的内容因此变得难以阅读。
必要的话你可以搜索这方面的插件,应该是一个很简单的类或者函数外带一个词库数据,逻辑上没什么讨论价值。因为你举得例子就不恰当,如果“鸡蛋”是敏感词,臭“鸡蛋”一样是被网监监控的,而不是你想象的情况,所以实际上根本没必要考虑分词问题。
最好有个敏感词库 去库里面匹配就行了
这个不现实...
那就用多音字 或者 繁体字,或者拼音