UNComtrade数据共享平台设计与实现*叶思菁1)宋长青1,2)†程昌秀1,2)高剑波1,2)高培超1)胡洛铭2)(1)北京师范大学地表过程与资源生态国家重点实验室,100875,北京;2)北京师范大学地理科学学部,100875,北京)摘要UNComtrade(UnitedNationsinternationaltradestatisticsdatabase)是全球最大且应用最为广泛的国际贸易数据库,具有高权威性与完整性.本文在框架体系结构设计与数据表结构设计基础上构建UNComtrade数据共享平台,以期为地理学研究提供数据与工具支撑.在数据聚合策略方面,平台通过综合集成数据爬取、加载模块并嵌套多种错误修正方法,实现5亿多条商品贸易记录的动态高容错聚合.在检索策略方面,平台通过分区复合索引提升数据检索指令执行效率与可扩展性.检索试验表明,平台能够在80用户并发模式下稳定执行不同类型检索指令,并且通过调用ODBC/JDBC接口将计算过程融入检索任务,可以更加有效利用服务器端资源并节省数据传输与读写耗时,具有效率更高、简化数据处理过程等优点.2017年平台被应用于中-美商品显性比较优势特征检索-计算-格网化表达-对比分析,案例表明平台具有高效、稳定的并发检索效率,以及高可扩展性等优点,可以为贸易特征计算与分析提供便捷快速、形式多样的数据共享服务.关键词国际贸易;大数据;格网;显示性比较优势指数;地理信息系统中图分类号K902DOI:10.12202/j.0476-0301.20212790引言当今全球化时代,各国通过签署双边贸易协定,以不同形式参与经济一体化,贸易成为影响现代社会政治、经济、科技、文化、民生与国家安全的重要因素.双边商品贸易数据在分析国家间贸易竞争与合作态势以及解析全球生态系统服务流动格局等方面发挥越来越重要的作用.UNComtrade数据库(UnitedNationsinternationaltradestatisticsdatabase)是全球最大且应用最为广泛的国际贸易数据库,具有高权威性与完整性.每年全球超过200多个国家或地区分别以记录国(reporter)的角色向该数据库汇交它们与其他贸易伙伴国家(partner)的年度商品(或服务)贸易额分类统计数据.汇交过程中,这些数据记录被基于联合国统计司统一标准规范执行分类编码(例如HS、SITC、BEC等)与核算.发展至今,UNComtrade数据库存储记录总量超过30亿,记录日期可以追溯到1962年.UNComtrade(http://comtrade.un.org)为众多不同领域研究做出了重要贡献.1)UNComtrade为丰富贸易理论,加强贸易系统规律及其驱动因素认知提供数据支撑.例如:Fadeyi等[...