【地方案例】北京储备项目:科研可信数据空间

建设单位:清华大学

运营单位:清华大学计算社会科学与国家治理实验室

现有基础

主体方面:清华大学共设33个学院、54个系、12个书 院,是一所设有12个学科门类的综合性、研究型、开放式 大学。学校长期重视数据科学以及交叉领域的学科建设和科 学研究,在数据驱动的新兴学科领域和基于数据的科学研究 支撑服务等方面具有较为扎实的工作基础。清华大学计算社 会科学与国家治理实验室于2021年12月经教育部批准成立, 是清华大学促进文科与理工学科交叉融合的综合性支撑平台 与创新基地,承担清华大学科研公共数据资源整合与开发利 用工作,具备丰富的大型数据系统开发、运营经验。

数据方面:当前已积累少量校内科研数据,主要涵盖实 验观测数据、学术研究数据、学科专题数据等类型,初步形 成数据存储体系。但数据规模与多样性仍存在显著缺口,覆 盖类型有限。

业务基础:清华大学正在推进科研公共数据平台建设,  将以此为基础提升为“科研可信数据空间”,并将对接校内 外科研数据,积极与地方政府开展数据开发利用方面的合作, 将这些丰富的数据资源应用于科学研究。已建立数据、技术、 管理等相关的管理办法与规范,为校内部分老师提供服务,  实现多租户模式下的团队数据共享与协作功能。

拟解决的痛点难点问题

不同地方公共数据格式、标准、管理机制差异大,整合 难度高。部分地方出于数据安全、部门利益等考量,对接积 极性不高,导致数据流通受阻。数据权属界定、使用权限划 分等缺乏明确规范,增加了对接复杂度,阻碍科研可信数据 空间与地方公共数据的有效融合。

建设方案

集成清华大学优秀的人工智能、区块链、隐私保护计算 等技术成果,基于信息化技术中心的智能算力与云服务,联 合多家技术伙伴,打造科研新基建“科研可信数据空间”。 旨在集成多源异构数据、构建安全可信环境,从数据、工具、 服务等方面助力科研,激发跨域创新乘数效应,推动数字化 转型下新型科研基础设施建设与数据要素流通。建设内容包 括:

多源异构数据集成:将公共数据、科研实验数据、物联 网终端数据、互联网数据等多类型数据源无缝汇聚,支持通 过标准化API 接口与主流数据库协议级互操作。

智能化数据处理与分析: 面向科学研究提供可视化、低 代码智能化建模、分析工具,支持对接大模型的赋能逻辑推 理、知识分析能力。

团队协作与数据共享: 支持多租户模式,提供独立工作 台和数据资源库,支持团队协同工作,共享数据资源与分析 成果。

数据治理与运维支持:构建全栈式数据治理功能矩阵,  涵盖数据质量监控、标准制定管理、结构化处理及展示优化,提供高效管理方案。

数据安全与可信计算:遵循国家信息安全等级保护相关 标准,保障数据全生命周期安全;通过颗粒化权限管理、动 态调整及全链路操作日志审计,实现数据合规流转;运用隐 私保护计算技术,兼顾数据可用性与隐私性。

开放技术架构构建: 公开应用开发规范,通过激励措施 吸引优秀开发者和团队部署应用工具,丰富科研人员可用资 源,提供多样化高质量应用服务。

公平透明的运营模式:以公益科研为主要目免费或低付 费接入公共数据,建立科研人员数据汇聚激励和按量付费的 数据定价规则,以及运营方、数据方、工具提供方、服务方 等各方之间按贡献收益分配机制。

预期成效

预期在1年内,集成公共数据、科研实验数据等数据源, 实现与5个以上地方公共数据平台的标准化对接(逻辑连通, 按需限期汇聚),对接校内外系统10+个,汇聚校内外科研 数据至少100T;  连通校内用户1000+,校外用户3000+,创 建100+科研团队协作空间。

资料来源:2025年7月,北京市政务服务和数据管理局发布《北京市第一批可信数据空间储备项目》,共21个,本文内容根据公开信息整理,如有侵权,请联系我们删除。

相关新闻

联系我们

联系我们

13965147580

在线咨询:点击这里给我发消息

邮件:674290@qq.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
关注微信
分享本页
返回顶部