| 文档关键词提取系统I3S KeyExtrator 1.0 |
| 软件大小: | 4867KB | | | 软件语言: | 简体中文 | | 软件类别: | 国产软件 / 编辑版 / 编辑软件 | | 运行环境: | Win9x/Me/NT/2000/XP/2003 | | 加入时间: | 2007-6-1 2:35:54 | | 下载次数: | 16709 | | 软件等级: |      | | 联 系 人: | support@i3s.ac.cn | | 开 发 商: | Home Page | 软件介绍:
关键词抽取(Keywords Extraction)指的是如何从一篇文档(或多篇相关文档)中自动抽取出能很好地代表文档主题的若干个词或短语。关键词抽取技术广泛应用于信息检索、文本分类/聚类、信息过滤、文档摘要等各种智能文本信息处理领域,具有很好的应用价值。 > > I3S KeyExtrator采用适合于汉语特点的关键词抽取技术。该系统基于中科院计算所多年积累的背景知识库,将汉语智能分词算法与基于AV邻接的新词/短语识别方法有机结合,并利用信息论方法对抽取出的词和短语进行重要性评估,同时借助模糊匹配技术对中间抽取结果进行冗余过滤,使抽取出的关键词具有很好的主题代表性和区分度。 |
| | | |