4月25日,北京市经济和信息化局、北京市网络信息办在2024年中关村论坛年会上,依托北京市数据基础制度先行区、北京市人工智能数据培训基地提供的可信空间和强大的智算资源,组织有关单位建立北京市人工智能数据培训基地监管沙盒机制,形成多项人工智能培训数据应用创新机制。为大型企业模型培训提供“强大计算能力” 海量数据 “监管合规”的完整训练要素,成为我国首个在人工智能领域应用监管沙盒机制的成功案例。

《北京人工智能数据培训基地监管沙盒》成果公布 探索人工智能可控发展的创新手段  第1张

据北京市经济和信息化局副局长、一级巡视员毛东军介绍,监管沙盒是一种机制,允许创新的产品技术服务或商业模式在真实的市场环境中以真实用户为对象,在风险可控的前提下,通过设立限制性条件和制定风险控制措施进行深度测试。监管沙盒机制是人工智能在人工智能领域探索人工智能可控发展的创新手段。在世界范围内,欧盟最近颁布的《人工智能法》明确要求其成员国创建人工智能监管沙箱,挪威、西班牙等国家也开始对沙箱相关工作进行监管。

在中国,北京率先探索和实践沙盒创新机制,在《北京市关于加快全球数字经济标杆城市建设的实施方案》和《关于更好地发挥数据要素进一步加快数字经济实施的意见》文件中,明确支持建立监管沙盒创新机制。

2023年底,北京市经济和信息化局、北京市委网络信息办联合发布了《北京市数据流通与安全管理监督沙盒一般实施方案》和《智能联网汽车、医疗卫生、人工智能大模型三大数字经济重点领域监督沙盒实施方案》。北京市人工智能大模型数据流通与安全管理监管沙盒实施方案的重要探索与实践,是北京市人工智能数据培训基地监管沙盒的成果。

今年3月29日,北京市人工智能数据培训基地正式启用,配备建立监管沙盒机制,为大型企业的模型培训提供强大的计算能力。 海量数据 全国首个人工智能领域监管沙盒,开创了国内人工智能产业创新机制的先河,监管合规的完整培训要素。

通过弱版权保护政策,通知移除规则、创新纠纷解决机制、风险补偿等创新政策,在培训基地制定了人工智能数据培训基地和监管沙盒运行规则,降低了数据版权风险。采取强有力的技术安全措施,减少数据安全隐患,包括数据存储安全、数据加工安全、数据交付安全和数据监管合规。同时,培训基地监管沙盒还将为企业提供申请入箱、完整性审核、方案评估、培训验证、初核退核、成果转化、宣传推广等全过程服务。培训基地依托北京数据基础系统先行区提供的可信空间,为数据企业提供了数据交易和使用环境的复杂所有权,为模型企业提供了大规模、优质的中文数据使用合规渠道。

在管理方面,利用监管沙箱管理机制,帮助企业在合法合规的范围内规避数据风险,保障大模型规范化培训和价值挖掘。

从技术上讲,模型企业和数据企业通过数据加密、脱敏技术、云桌面操作、安全管理等先进技术,真正实现了数据的可用性、可见性和不可用性,避免了数据泄露等高风险事件。北京国际数字经济治理研究院、北京国际计算能力服务有限公司、北京国际大数据交易所共同承担培训基地监管沙箱的具体运营,主要负责监管沙箱机制、基地运营机制和数据交易规则。

四月十九日,人工智能大模型训练营第一期在北京人工智能数据训练基地监管沙盒机制建立后正式启动。同方知网、希尔贝壳、北京汽车网等14家数据企业,以及稀宇极智、中科闻歌、网智天元等3家模型企业。共有17家企业成为第一批试点企业。训练营一期推出近20家人工智能大模型高质量数据集,总数超过7000GB,覆盖多模态语料,涉及近10个领域的应用场景。在监管沙盒机制的保障下,这些数据企业和大型企业将开展模型培训,切实推动高质量数据的价值释放,在“开放、融合、安全、共赢”原则的基础上,帮助人工智能大模型迭代优化,促进数据模型的协同合作,实现价值共创。

文章/北京青年报记者 温婧

编辑/樊宏伟