不良文本及其变体信息的检测过滤技术研究

上传人:月下人间 文档编号:5830943 上传时间:2021-07-12 格式:PDF 页数:66 大小:3.19MB
返回 下载 相关 举报
不良文本及其变体信息的检测过滤技术研究_第1页
第1页 / 共66页
不良文本及其变体信息的检测过滤技术研究_第2页
第2页 / 共66页
点击查看更多>>
资源描述

《不良文本及其变体信息的检测过滤技术研究》由会员分享,可在线阅读,更多相关《不良文本及其变体信息的检测过滤技术研究(66页珍藏版)》请在维思文库上搜索。

1、指导小组成员名单 张世永教授 钟亦平教授 吴杰教授 吴承荣副教授 曾剑平副教授 目录 摘要 ; A b s t r a ct ii 第l章绪论 1 】1 研究背景和意义 1 1 2 国内外研究现状 2 1 3 研究内容与论文框架 4 第2 章相关理论与技术介绍 7 2 1 常用的字符串相似度计算方法 7 2 1 1 基于J a cca r d 的相似度计算 7 2 1 2 基于N g r a m 的相似度计算 7 2 ,1 3 基于编辑距离的相似度计算 8 2 1 4 基于Y o o n sm e t h o d 的相似度计算 9 2 2W M 算法 9 2 3T r ie 树( 字典树) 1

2、 0 2 4 众包( C r o w d s o u r cin g ) 1 1 2 5 评价标准 。1 2 2 6 文本过滤方法综述 1 2 第3 章 面向变体关键词的字符串相似度计算 1 5 3 1 变体关键词的相似度计算思路 1 5 3 2 不良词汇变形整理及处理方法 1 6 3 2 1 不良词汇变形情况整理 1 7 3 2 1 1 含有特殊字符的变形体 1 7 3 2 1 2 不含有特殊字符的变形体 1 8 3 2 2 不良词汇变形体处理方法 1 8 3 3 不良词汇变体相似度计算公式 1 9 3 3 1 公式1 。1 9 3 3 2 公式2 2 1 3 3 3 相似度计算算法描述 2

3、 2 3 4 相似度计算算法分析 2 4 3 5 本章小结 2 5 第4 章不良文本信息检测过滤框架研究 2 6 4 1 客户端扫描过滤不良文本信息研究 2 6 4 1 1 客户端扫描总体流程 2 6 4 1 2 客户端相似度计算层次过滤 2 7 4 1 2 1 相关数据结构定义 2 8 4 1 2 ,2 基于集合相似度过滤 3 0 4 1 2 3 变体关键词相似度计算处理流程 3 1 4 2 服务端变体关键词识别的研究 3 2 4 2 1 众包”在数据处理中的相关应用 3 2 4 2 2 影响“众包”标记效果的因素分析 3 3 4 2 2 1 对恶意标记的因素分析 3 3 4 2 2 - 2 对标记意愿的因素分析 3 4 4 2 2 3 对标记质量的因索分析 3 5 4 2 3 “众包”标记用户选择分析 3 5 4 2 4 “众包”

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 文献资料 >

备案号: 苏ICP备18070066号 

 电信经营许可证:苏B2-20220079 

出版物经营许可证:新出发2018字第HZ-026号 

 苏公网安备 32070502010811号

本站为信息分享及获取平台,本站所有文档下载所得收益归上传人(含作者)所有。

不确保部分用户上传资料的来源及知识产权归属。