关键词识别方法、装置、电子设备和计算机可读存储介质与流程

文档序号:35671313发布日期:2023-10-07 19:44阅读:17来源:国知局
导航: X技术> 最新专利> 计算;推算;计数设备的制造及其应用技术
关键词识别方法、装置、电子设备和计算机可读存储介质与流程

本发明涉及通信,具体涉及一种关键词识别方法、装置、电子设备和计算机可读存储介质。


背景技术:

1、近年来,随着互联网技术的飞速发展,通过网络进行各种信息交互也变得日益频繁,比如,针对特定对象或物品的投诉等反馈信息。为了利用这些反馈信息维护网络安全环境,就需要在这些反馈信息中识别出关键词。现有的关键词识别方法往往都是通过人工审核的方式进行识别。

2、在对现有技术的研究和实践过程中,本发明的发明人发现由于反馈信息的文本数据量较大,而且数据结构也非一般结构化数据,不同的审核人员审核的结果往往也存在差异,因此,导致关键词识别的准确率较低。


技术实现思路

1、本发明实施例提供一种关键词识别方法、装置、电子设备和计算机可读存储介质,可以提高关键词识别的准确率。

2、一种关键词识别方法,包括:

3、获取针对至少一个对象的反馈信息,并在所述反馈信息中提取出待识别文本;

4、对所述待识别文本进行特征提取,得到所述待识别文本的文本特征;

5、根据所述文本特征,确定所述待识别文本对应的反馈类型和反馈参数,所述反馈类型用于指示所述反馈信息的类型,所述反馈参数用于指示所述待识别文本在所述反馈类型中的重要程度;

6、基于所述反馈类型和反馈参数,对所述待识别文本进行排序,以筛选出至少一个目标文本;

7、对所述目标文本进行分词,并根据分词后的文本词的词属性信息,在所述文本词中识别出至少一个关键词,所述词属性信息用于指示所述文本词在所述目标文本中的重要程度。

8、相应的,本发明实施例提供一种关键词识别装置,包括:

9、获取单元,用于获取针对至少一个对象的反馈信息,并在所述反馈信息中提取出待识别文本;

10、提取单元,用于对所述待识别文本进行特征提取,得到所述待识别文本的文本特征;

11、确定单元,用于根据所述文本特征,确定所述待识别文本对应的反馈类型和反馈参数,所述反馈类型用于指示所述反馈信息的类型,所述反馈参数用于指示所述待识别文本在所述反馈类型中的重要程度;

12、筛选单元,用于基于所述反馈类型和反馈参数,对所述待识别文本进行排序,以筛选出至少一个目标文本;

13、识别单元,用于对所述目标文本进行分词,并根据分词后的文本词的词属性信息,在所述文本词中识别出至少一个关键词。

14、可选的,在一些实施例中,所述筛选单元,具体可以用于根据所述反馈类型,对所述待识别文本进行分类,得到每一反馈类型对应的待识别文本集合;基于所述反馈参数,对所述待识别文件集合中的待识别文本进行排序;根据排序信息,对所述待识别文本集合中的待识别文本进行有效性过滤,得到至少一个目标文本。

15、可选的,在一些实施例中,所述筛选单元,具体可以用于

16、根据排序信息,在所述待识别文件集合中筛选出排序位置未超过预设排序位置阈值的待识别文本,得到至少一个无效待识别文本;在所述待识别文本集合中对所述无效待识别文本进行过滤,得到至少一个目标文本。

17、可选的,在一些实施例中,所述识别单元,具体可以用于统计所述目标文本的文本数量,得到第一文本数量;根据所述第一文本数量,确定分词后的每一文本词的词属性信息;基于所述词属性信息和所述反馈类型,在所述文本词中筛选出至少一个关键词。

18、可选的,在一些实施例中,所述识别单元,具体可以用于在所述目标文本中统计出包含所述文本词的文本数量,得到第二文本数量;根据所述第一文本数量和第二文本数量,计算每一所述文本词的词频和逆文档频率;将所述词频和逆文档频率进行融合,得到所述文本词的词属性信息。

19、可选的,在一些实施例中,所述识别单元,具体可以用于在所述目标文本中筛选出每一反馈类型对应的反馈文本,并统计所述反馈文本的文本数量,得到第三文本数量;在所述文本词中识别出文本字符,并根据所述第三文本数量和文本字符,计算每一所述文本词的后验概率,所述后验概率用于指示所述文本词出现特定反馈类型的目标文本中的概率;根据所述词属性信息和后验概率,在所述文本词中筛选出至少一个关键词。

20、可选的,在一些实施例中,所述识别单元,具体可以用于根据所述第三文本数量,计算所述每一文本词的分布概率,得到词分布概率;基于所述文本字符、第一文本数量和第三文本数量,计算所述文本字符的分布概率,得到字符分布概率;将所述词分布概率和字符分布概率进行融合,得到所述文本词的后验概率。

21、可选的,在一些实施例中,所述识别单元,具体可以用于根据所述后验概率,对所述文本词进行过滤,得到过滤后文本词;基于所述词属性信息,对所述过滤后文本词进行排序;根据排序信息,在所述过滤后文本词中筛选出至少一个关键词。

22、可选的,在一些实施例中,所述确定单元,具体可以用于采用训练后文本处理模型在所述文本特征中提取出反馈类型特征;根据所述反馈类型特征,确定所述待识别文本对应的反馈类型;采用所述训练后文本处理模型将所述文本特征转换为所述待识别文本的反馈有效性特征,以得到反馈参数。

23、可选的,在一些实施例中,所述关键词识别装置还可以训练单元,所述训练单元,具体可以用于获取至少一个样本对象的反馈文本样本集合,所述反馈文本样本集合包括至少一个标注对象类型和标注反馈类型的反馈文本样本;采用预设文本处理模型预测所述反馈文本样本的反馈类型,得到预测反馈类型;根据所述反馈文本样本,采用所述预设文本处理模型预测所述样本对象的对象类型,得到预测对象类型;根据所述标注对象类型、标注反馈类型、预测反馈类型和预测对象类型,对所述预设文本处理模型进行收敛,得到训练后文本处理模型。

24、可选的,在一些实施例中,所述训练单元,具体可以用于采用所述预设文本处理模型对所述反馈文本样本进行特征提取,并将提取出的样本文本特征转换为样本反馈有效性特征;根据所述样本反馈有效性特征,确定所述反馈文本样本的样本反馈参数,并基于所述样本反馈参数,计算每一所述反馈文本样本的反馈权重;基于所述反馈权重,对所述样本文本特征进行融合,并基于融合后样本文本特征,确定所述样本对象的对象类型,得到预测对象类型。

25、可选的,在一些实施例中,所述训练单元,具体可以用于根据所述标注对象类型和预测对象类型,确定所述反馈文本样本的对象损失信息;基于所述标注反馈类型和预测反馈类型,确定所述反馈文本样本的反馈损失信息;获取所述反馈损失信息的融合参数,并基于所述融合参数,将所述反馈损失信息和对象损失信息进行融合;基于融合后损失信息对所述预设文本处理模型进行收敛,得到训练后文本处理模型。

26、可选的,在一些实施例中,所述训练单元,具体可以用于获取至少一个样本对象的原始反馈文本样本集合;当所述原始反馈文本样本集合中的反馈文本样本数量超过预设数量阈值时,根据所述反馈文本样本的时间信息,在所述原始反馈文本样本集合中采样出预设数量的基础反馈文本样本,得到剩余反馈文本样本;根据所述预设数量阈值和预设数量,确定反馈文本样本的剩余采样数量;在所述剩余反馈文本样本中随机采样出所述剩余采样数量对应的目标反馈文本样本;将所述基础返利文本样本和目标反馈文本样本进行融合,得到所述样本对象的反馈文本样本集合。

27、可选的,在一些实施例中,所述获取单元,具体可以用于在所述反馈信息中提取出原始文本,并在所述原始文本中筛选出目标字符;根据所述目标字符的字符类型,在预设替换字符集合中筛选出所述目标字符对应的替换字符;在所述原始文本中将所述目标字符替换为所述替换字符,得到待识别文本。

28、此外,本发明实施例还提供一种电子设备,包括处理器和存储器,所述存储器存储有应用程序,所述处理器用于运行所述存储器内的应用程序实现本发明实施例提供的关键词识别方法。

29、此外,本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行本发明实施例所提供的任一种关键词识别方法中的步骤。

30、本发明实施例在获取针对至少一个对象的反馈信息,并在反馈信息中提取出待识别文本后,对待识别文本进行特征提取,得到待识别文本的文本特征,然后,根据文本特征,确定待识别文本对应的反馈类型和反馈参数,基于反馈类型和反馈参数,对待识别文本进行排序,以筛选出至少一个目标文本,然后,对目标文本进行分词,并根据分词后的文本词的词属性信息,在文本词中识别出至少一个关键词;由于该方案在提取出反馈信息的待识别文本之后,通过文本特征可以确定出待识别文本对应的反馈类型和反馈参数,将反馈类型和反馈参数作为先验知识,就可以准确的在待识别文本中筛选出目标文本,从而在目标文本识别出关键词,因此,可以提升关键词识别的准确率。

完整全部详细技术资料下载
当前第1页 1  2 
相关技术
  • 轨迹数据库创建方法、装置、查...
  • 虚拟形象的处理方法及相关产品...
  • 用于监控相机的变换矩阵的确定...
  • 一种业务数据管理的方法和装置...
  • 环境优先控制污染物风险评估推...
  • 图像生成器生成方法、图像生成...
  • 一种信息确定方法、装置、设备...
  • 一种应用转化归因方法、装置、...
  • 一种电网设备运行调度智能优化...
  • 采购方案的智能化确定方法及装...
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1

哆哆女性网笔记本显卡能换吗SEO网站推广期货周末能交易吗制作一个网站的费用是多少周公解梦梦见乌龟涂惠元起名测字测试打分结果韩国seo极品特工王妃听说你只把我当朋友设计网站专业柘城微粉起个四个字的名称吴波周易宜兴网站建设公司产品起名网免费名字大全服装店起名简洁大气女装青岛如何制作网站qq怎样关闭个性签名想给商店起名宝宝起名字2019邱姓起名男宝宝名字柘城中标公示重庆网站优化品牌seo 课程培训给牛宝宝起什么名字好有孩子起名叫般若的吗深圳网站制作公司推荐周易测姓名打分网上银行开通淀粉肠小王子日销售额涨超10倍罗斯否认插足凯特王妃婚姻不负春光新的一天从800个哈欠开始有个姐真把千机伞做出来了国产伟哥去年销售近13亿充个话费竟沦为间接洗钱工具重庆警方辟谣“男子杀人焚尸”男子给前妻转账 现任妻子起诉要回春分繁花正当时呼北高速交通事故已致14人死亡杨洋拄拐现身医院月嫂回应掌掴婴儿是在赶虫子男孩疑遭霸凌 家长讨说法被踢出群因自嘲式简历走红的教授更新简介网友建议重庆地铁不准乘客携带菜筐清明节放假3天调休1天郑州一火锅店爆改成麻辣烫店19岁小伙救下5人后溺亡 多方发声两大学生合买彩票中奖一人不认账张家界的山上“长”满了韩国人?单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#青海通报栏杆断裂小学生跌落住进ICU代拍被何赛飞拿着魔杖追着打315晚会后胖东来又人满为患了当地回应沈阳致3死车祸车主疑毒驾武汉大学樱花即将进入盛花期张立群任西安交通大学校长为江西彩礼“减负”的“试婚人”网友洛杉矶偶遇贾玲倪萍分享减重40斤方法男孩8年未见母亲被告知被遗忘小米汽车超级工厂正式揭幕周杰伦一审败诉网易特朗普谈“凯特王妃P图照”考生莫言也上北大硕士复试名单了妈妈回应孩子在校撞护栏坠楼恒大被罚41.75亿到底怎么缴男子持台球杆殴打2名女店员被抓校方回应护栏损坏小学生课间坠楼外国人感慨凌晨的中国很安全火箭最近9战8胜1负王树国3次鞠躬告别西交大师生房客欠租失踪 房东直发愁萧美琴窜访捷克 外交部回应山西省委原副书记商黎光被逮捕阿根廷将发行1万与2万面值的纸币英国王室又一合照被质疑P图男子被猫抓伤后确诊“猫抓病”

哆哆女性网 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化