标准文档大数据处理平台

赛智科技针对大量标准文档资源提供的大数据处理解决方案

标准文档大数据管理平台提供标准全生命周期管理,包括标准题录的采集、加工(著录、分类、语义标引)、维护、代替作废管理,标准全文的内容挖掘、段落拆分,标准体系与明细表构建,最终实现基于标准文献的知识服务。平台的业务功能成熟、稳定性高、伸缩性强,可根据用户需求(如权限分组等)进行配置管理,目前已经应用在多个标准信息管理与知识服务的场合。

DEMO 演示

功能模块
模块 描述
标准自动化OCR工具 提供将图像版标准文件进行文字识别转换为DOC/PDF/TEXT等格式文档的功能,并可自动、批量处理文档。
标准段落拆分工具 将DOC格式的标准文件进行段落拆分,读取标准题录信息、标准结构信息等等。
标准内容结构化审校工具 提供PDF/DOC/JSON三种数据格式的展示比对功能,供加工人员进行标准内容结构化审校
标准内容段落关联标注工具 帮助专家建立某一领域的知识结构树,并对指定的标准文件进行内容段落与知识点的关联标注。
标准内容指标数据库加工工具 在全文检索的基础上进行内容指标的提取和人工辅助提取功能。
阅读工具 提供PC电脑端、Web端以及移动客户端的标准文献阅读功能。
比对工具 提供同一标准对象在不同标准体系中的差异、相似比对功能。
查新(查重)工具 提供在多个标准文献中查找重复度、相似度等指标。
结构分析工具 标准结构分析工具提供在多个标准文献中建立某些对象的结构体系并进行分析。
指标统计分析工具 标准指标统计分析工具提供在多个标准文献中查找指标的差异、相似性并进行分析。
系统应用案例
时间 单位 项目
2018 中国标准化研究院 军民通用标准数据结构化加工服务系统
2019 标新科技(北京)有限公司 体育标准化研究服务保障技术服务系统
2019 北京天宇智通信息技术有限公司 标准电子地图系统

Page rendered in 0.0642 seconds. CodeIgniter Version 3.0.1