数据治理与大模型探索北京捷泰云际信息技术有限公司郝苗北京捷泰云际信息技术有限公司简介所属领域:大数据与云计算;主要研究方向:将地理信息科学、大数据与遥感科学、人工智能等技术交叉融合,以多源异构大数据汇聚、治理与时空知识图谱为主要研究方向,不断发展数据治理、挖掘分析与时空知识图谱技术;办公地点:总部位于北京,在武汉、成都、西安设有分支机构;企业资质:国家级高新技术企业认证、中关村高新技术企业认证、ISO9001质量管理体系认证及ISO27001信息安全管理体系认证。主要业务领域目录01数据治理的必要性02数据治理技术路线03知识图谱与大模型应用探索01数据治理的必要性为什么要做数据治理?汇聚和整合跨部门、跨领域、多源异构数据资源,进行数据清洗与治理,解决数据准确性与一致性等问题,面向业务应用提供统一的数据底座。为什么要做数据治理?将多来源的数据资源进行融合与联接,采用面向对象的思想,构建“对象画像”,全面展示各个对象实体的基础信息、业务信息、空间形态、健康状况、管理状况、关系图谱等,反映对象实体的全貌。为什么要做数据治理?为数据挖掘分析、二次开发、行业知识图谱构建、智能分析与决策打下坚实的基础。数据治理目标通过数据治理,建立一个数据“可获取、可连接、可分析、可评价”的数据底座。02数据治理技术路线基于时空数据中台的数据治理体系数据存储体系解决异构数据如何存储、组织问题。数据汇聚体系解决多源、多时效场景下数据如何采集问题。数据治理体系解决全域数据质量、安全与开发等问题。数据服务体系解决高质量数据资产如何高效应用问题。数据治理实施步骤1.理数据3.汇数据4.做治理5.成资产6.享服务2.建模型数据开发人员成果阶段数据治理阶段时数据建模/管理员业务应用人员数据管理员数据建模人员项目/产品/建模前期阶段事物连接至平台理清数据源•数据类型•存储位置规划数据存储•存储分层•计算引擎机构/用户/角色分析业务实体数据分级分类数据建模•概念模型•逻辑模型元数据整理模型关系维护数据汇聚•普通汇聚•业务数据•空间数据汇聚•非结构化汇聚•监测数据汇聚汇聚流程编排数据开发数据质检•质检规则•质检配置•质检报告数据安全•数据权限数据治理成果•关系图谱•资产目录•资产地图•全域检索数据分析数据服务•业务服务•空间服务•第三方服务数据分发/数据申领录入至平台平台中处理数据管理成果展示数据使用系统管理/初始化数据标准数据汇聚...