
全国政协委员,九三学社中央常委,中国科学院院士,清华大学化学系教授、清华大学分析中心主任 李景虹
当前,“人工智能+”行动已上升为国家战略,成为培育新质生产力、驱动产业升级的关键引擎。人工智能正在经历从“通用能力”向“专业赋能”演进的关键阶段。但在调研中发现,我国在推动行业大模型发展过程中,存在高质量专业数据供给不足、数据治理规则不健全、数据共享机制不畅等问题。行业数据的系统性建设与创新性治理,已成为“人工智能+”能否走深走实的关键变量。
为此,建议从规划引领、设施建设、开放共享、规则明晰四个维度协同发力,构建支撑“人工智能+”纵深发展的行业数据生态:
一是加强规划引领,以重点行业试点牵引高质量数据体系建设。建议相关部门优先选取生物医药、高端材料、精细化工、智能制造等数据价值密度高、智能化需求迫切的行业,开展“人工智能+行业数据”试点。针对试点行业研究制定《行业高质量数据发展指南》,明确该领域高质量数据的定义标准、技术规范、关键缺失清单及阶段性建设目标。通过试点先行,形成可复制、可推广的经验,逐步构建覆盖重点行业的专业数据资源体系。
二是提供设施支撑,建设生产与共享数据的新型基础设施。布局行业级“数据工场”。 设立专项资金,引导社会资本参与,支持行业龙头企业、国家级科研平台、高等院校联合建设一批自动化实验室、数字孪生平台、行业知识库等数据生产型基础设施。探索“共建共享池”机制。 在试点行业内,由行业协会或第三方可信机构牵头,探索建立基于“贡献度评价与权益分配”的数据共享联盟。在保障安全和隐私的前提下,逐步开放行业相关的非涉密数据资源,打通数据壁垒,形成协同效应。
三是加强开放共享,加速公共资助科学数据的流通利用。强化公共数据开放制度,推行数据标准与国际规范。 制定并推广科学数据管理的国家标准,提升数据的可用性与兼容性。鼓励国内数据平台与国际主流平台的标准对接,促进数据的跨项目、跨机构、跨国家融合利用。
四是进一步明晰规则,构建促进数据安全流通与价值回流的制度环境。建议由相关主管部门结合行业特点,研究制定场景数据用于模型优化的合规指引。引导高价值场景用户优先选择云服务模式,在保障数据安全的前提下,使模型能够获得真实场景的反馈数据,形成“应用-反馈-优化-更好应用”的数据飞轮,加速模型在产业实践中持续迭代、走向成熟。
(清华新闻网3月6日电)
记者:王晓霞
编辑:李华山
审核:吕婷 郭玲