计算机工程与应用

2020, v.56;No.963(20) 132-137

[打印本页] [关闭]
本期目录(Current Issue) | 过刊浏览(Past Issue) | 高级检索(Advanced Search)

结合触发事件及词性分析的敏感信息识别方法
Sensitive Information Recognition Method Combining Trigger Event and Part of Speech Analysis

刘聪;王永利;周子韬;犹锋;张才俊;

摘要(Abstract):

针对传统敏感信息识别方法忽略了上下文语境和关键词词性而导致的漏报、误报问题,提出一种改进文本敏感信息识别的方法STEAP。构建暴恐敏感词典;通过敏感触发事件的抽取构建敏感触发事件序列,结合敏感触发事件及关键词的词性为待识别的信息分配权重;将构建的触发事件与词向量、暴恐敏感词典进行相似度的计算,结合权重获得文本的敏感度。实验结果证明,与传统敏感信息识别方法相比,STEAP方法能够有效识别出文本中的敏感信息,并且在精确度上得到了一定提高。

关键词(KeyWords): 敏感触发事件;词性序列;敏感信息识别;文本相似度

Abstract:

Keywords:

基金项目(Foundation): 国家自然科学基金(No.61170035,No.61272420,No.81674099,No.61502233);; 中央高校基本科研业务费专项资金项目(No.30916011328,No.30918015103);; 南京市科技计划项目(No.201805036);; “十三五”装备领域基金(No.61403120501);; 中国工程院2019年度咨询研究项目(No.2019-ZD-1-02-02)

作者(Author): 刘聪;王永利;周子韬;犹锋;张才俊;

Email:

DOI:

参考文献(References):

扩展功能
本文信息
服务与反馈
本文关键词相关文章
本文作者相关文章
中国知网
分享