湖北教育出版社数字出版技术布局方案2012.6目录一、总体框架二、数据加工系统三、资源库系统四、内容发布系统五、资源发布系统六、电子商务系统七、身份管理系统八、碎片化内容管理系统一、总体框架与传统出版相比,数字出版具有海量存储、搜索便捷、传输快速、成本低廉、互动性强、环保低碳等特点,数字出版也是出版业的未来发展趋势。当前阶段,我社数字出版技术布局的重点,是将现有出版资源打散后对出版内容进行面向细分用户群的定向重组及服务,因此“内容管理、信息检索、文本挖掘、图书服务”是起支撑作用的核心技术。我社数字出版技术布局方案顶层设计架构分为支撑环境、数据层、支撑平台层、服务渠道及展现层。支撑环境:包括服务器、网络等软硬件支撑环境,为整个数字出版解决方案的运行提供可靠的“地基”。数据层:实现经过OCR扫描和碎片化后的数字出版领域的信息资产,结合出版领域信息资源的特点进行资源的描述、组织管理与对象存储。支撑平台层:是核心“躯干”,实现数字出版全业务生命周期的管理,通过数据加工系统实现出版单位数字资源的碎片化和智能加工;结合文本挖掘技术和全文检索技术实现资源的动态组织管理和服务供应;通过碎片化管理系统实现专业的服务支撑;通过内容管理系统、资源库系统、电子商务系统和版权保护系统(DMA核心技术)实现出版单位数字资源的发布、管理、营销和版权管理。服务渠道及展现层:为用户提供信息和服务的获取渠道,方便用户个性化的获取信息资源和服务。安全保障体系和标准规范体系:安全保障体系与标准规范体系是解决方案的保障机制,为数字出版领域的信息化建设提供应用安全、资源管理、服务发布等全方位的指导,保证数字出版业务的规范化。二、数据加工系统我社的历史出版资源基本是以方正书版PS和大样、PDF等版式文件形式存在。数字出版要求将这些版式文件进行分析、拆分、标引等,输出基于XML的结构化数据,满足各种数字出版应用的需要。例如:★转换为结构化XML,用于专业数据库建设★转换为流式EPUB或类似格式,用于手机阅读★转换为HTML,用于网络出版主要技术功能和特点:★支持PS、PDF等开放格式的图书,不局限于任何特定系统。★全面的图书内容自动分析,包括章节、段落、图片(图题、图注)、表格(表题、表注)、公式、上下标、注释、页码、版芯、目录、索引、参考文献、补字等等。可以自定义识别对象和识别规则。★超高效率:自动分析正确率达95%以上,并辅以完善高效的人工干预...