GeoScene空间大数据解决方案易智瑞研究院大数据事业部产品经理常亚敏1.GeoScene空间大数据建设体系2.GeoScene空间大数据产品核心能力3.应用场景4.总结目录一、GeoScene空间大数据建设体系•认识数据•感知数据•理解数据•应用数据认识数据是综合了解数据的来源和生成方式,数据的时空特征及元数据信息从数据中发掘出有用的信息,通过不同数据之间的关联关系实现知识发现、知识推理的过程支撑不同行业和领域的具体应用场景,辅助决策的过程,实现应用的自动化构建、服务能力迭代升级的过程深入洞察数据的体系结构,对数据变化情况进行追溯,同时挖掘数据的价值空间大数据时代的难题和挑战空间大数据分布式计算框架HDFSApacheSparkHBase云存储数据库其他存储方式文件型存储ApacheFlinkMapReduce计算引擎交换机大量的、复杂的需要迭代和交互式处理的分析任务,各计算单元之间有频繁的数据交换和读写处理长事务性计算/航天/航空/地表移动物体感知数据/地表非移动物体人工建筑数据地质体地形土地覆盖自然对象自然气象业务单位/业务领域互联网实时/交易时空数据来源多样化全国激光点云数据一年超过130PB国家级国土三调矢量数据超过1TB城市级车辆运行轨迹数据,每天超过1亿条城市级手机信令数据,每天超过10亿条省级气象观测数据,每月超过2亿条省级生态红线数据单个要素节点数超过100万个时空数据规模日益庞大GeoScene空间大数据建设流程数据注册数据汇聚数据质检数据治理数据分析模型构建洞察挖掘业务应用•CSV数据读取•Shp数据读取•Parquet、ORC数据读取文件型数据源•Oracle数据源•PostgreSQL数据源•达梦数据源•Hbase数据源•FileGDB数据源读取数据库数据源分布式文件系统•HDFS云存储•阿里云•华为云•AWS云存储•微软云存储连接描述感知监测关系追溯数据治理、模型训练、知识服务差异检测压盖检测拓扑检查空值检测空间投影数据偏移数据清洗节点计算质心提取数据融合数据追加空间融合属性融合数据状态管理时空关系梳理时空语义描述属性连接空间连接业务应用交通大数据犯罪分析自然资源大数据工具服务算子服务模型服务接口服务资源管理服务算子算法工具模型应用决策数据维度业务维度样本标注样本导出模型训练场景推理分类聚类回归预测深度学习最大似然分类支持向量机随机森林分类与回归时空聚类目标检测语义分割对象分类视频检测矢量栅格融合分析栅格数据读取处理点云分割实例分割自然语言处理数据血缘关系追溯管理知识推理语义关系实体关系知...