文档大数据管理平台提供全生命周期管理,包括题录的采集、加工(著录、分类、语义标引)、维护、代替作废管理,全文的内容挖掘、段落拆分,体系与明细表构建,最终实现基于文献的知识服务。平台的业务功能成熟、稳定性高、伸缩性强,可根据用户需求(如权限分组等)进行配置管理,目前已经应用在多个信息管理与知识服务的场合。
功能模块
模块 | 描述 |
---|---|
自动化OCR工具 | 提供将图像版文件进行文字识别转换为DOC/PDF/TEXT等格式文档的功能,并可自动、批量处理文档。 |
段落拆分工具 | 将DOC格式的文件进行段落拆分,读取题录信息、结构信息等等。 |
内容结构化审校工具 | 提供PDF/DOC/JSON三种数据格式的展示比对功能,供加工人员进行内容结构化审校 |
内容段落关联标注工具 | 帮助专家建立某一领域的知识结构树,并对指定的文件进行内容段落与知识点的关联标注。 |
内容指标数据库加工工具 | 在全文检索的基础上进行内容指标的提取和人工辅助提取功能。 |
阅读工具 | 提供PC电脑端、Web端以及移动客户端的文献阅读功能。 |
比对工具 | 提供同一对象在不同体系中的差异、相似比对功能。 |
查新(查重)工具 | 提供在多个文献中查找重复度、相似度等指标。 |
结构分析工具 | 结构分析工具提供在多个文献中建立某些对象的结构体系并进行分析。 |
指标统计分析工具 | 指标统计分析工具提供在多个文献中查找指标的差异、相似性并进行分析。 |
系统应用案例
时间 | 单位 | 项目 |
---|---|---|
2019 | 标新科技(北京)有限公司 | 体育化研究服务保障技术服务系统 |
2019 | 北京天宇智通信息技术有限公司 | 电子地图系统 |