南方财经全媒体记者 石恩泽 深圳报导

在刚刚过去的深圳“两会”上,ChatGPT成为参会委员和代表热议的话题。

深圳市政协委员、中国安然研究院院长肖京在提案中写道,“国内数字经济和人工智能开展亟需一个坚实的数字底座。尤其是ChatGPT的胜利,愈加印证了强大数字底座的重要性。”

数字底座的建造,离不开被喻为新“石油”的数据要素。而数据也是大模子时代的最核心要素。目前国内固然有良多数据,但可用的高量量数据远低于国外。因而,“目前中国亟需加强数据建立,把零星数据酿成有效的数据资本。”肖京在提案中建议道。

2022年11月,深圳数据交易所揭牌成立,同时启动首批线上数据交易。至此,北上广深均开启了新的数据交易摸索。此中,截至1月末,深圳数据交易所已完成注销存案的数据交易总计505笔,累计交易金额超越14亿元。

“数据治理是数据畅通的关键一步。只要颠末治理之后的数据,才气停止畅通。”深圳数据交易所董事长李红光近日在媒体沟通交换会上如斯说道。

同时,若想在人工智能范畴开展上有所打破,就要“喂”取机器足够高量量的数据,而高量量数据就需要尺度化的治理。“目前市场上畅通的数据产物大部门都属于金字塔更底层的流量型产物,用专业的术语来说,就是低维度应用。表现在数据产物上,就是只要单一数据或者单一数据库里面某几个字段组合出来产物。”李红光暗示。

但ChatGPT已经进化到需要文字、图片、语音、视频等多模态数据集的交融应用了。“从那点上来说,ChatGPT与将来用于数据交易的产物之间,有彼此可借鉴的处所。”李红光说。

打造中国版ChatGPT,深圳数据交易所要做“数据养料”  第1张

构建“动态”合规系统,降低数据畅通成本

在实现ChatGPT级此外数据产物开发和应用之前,还有一个大前提,就是数据可以有序、大规模且低成本的畅通。而实现那一步,就需要在法令层面实现一个尺度化的系统。

目前各地交易所都有一套本身的交易规则和手艺尺度,同时各行各业又有差别的监管要求。因而,在落地和监管上,还有待进一步同一。

起首,在落地机造方面,目前场内数据交易的合规机造还比力僵化。“传统的场内数据交易是静态的合规形式,即入场一次就要求企业供给一个由律师出具的合规评估陈述。那关于频繁交易的企业来说,将面对极大的合规成本。”深圳数据交易所合规部负责人王青兰说。

为处理那个问题,深圳数据交易所正在全国初创“动态合规系统”。王青兰介绍,深圳数据交易所创始性的把“信誉”东西引入数据交易合规系统的建立中,横坐标是“4+N”道合规审核防线,纵坐标是“3+N”套市场参与主体的诚信合规评级轨制。“相当于给契合要求的企业,打上一个‘绿色免检标签’。”

在上述根底上,深圳数据交易所还将引入独立的第三方信誉机构对那个“绿色标签”停止动态评级。王青兰暗示,在那个动态化的系统下,入场交易有了了了的合规指引,企业之间有了同一信赖的尺度,不再需要每出场一次就评估一次了。同时,动态合规系统将一切流程尺度化,不只可以为企业的数字资产带来诺言增值,还有助于倒逼场外不合规、低量量的交易,转向场内高量量的数据交易。

此外,在差别行业上,深圳数据交易所也正在停止单点打破,本年估计将在2个行业上实现打破,以点及面,在细分范畴上争取打通监管协同。

“深圳拥有特区立法权和综合受权变革两大立异兵器,能够护航我们合规系统的变革向‘深水区’挺进。”王青兰说。届时,深圳有望给国度层面的数据要素畅通相关立法,供给更多可实操、可落地的标杆级案例经历,构成数据交易的“深圳尺度”。

找寻场景闭环,以河套和前海为深港跨境数据交易打破口

除了降低数据畅通成本,另一个有利于深圳打造出中国版ChatGPT的机遇在于,操纵好邻接香港的优势天文位置,实现跨境数据的互联互通。

从深港两地根底看,深圳市高科技财产根底雄厚、数据资本富集、交融应用场景丰硕,并于2022年5月落地了中国首批场内跨境数据交易产物。

截至1月31日,数据供给方、数据商、数据需求方等参与主体共计605家,交易注销存案集中涉及73类应用场景;跨境交易共14笔,累计交易金额1115万元。恰好印证了深圳市和深圳数据交易所具备抓住机遇的才能。

反却是香港地域数字经济财产特色不敷明显。在致公党深圳市委会配合提交的一份提案中写道,“因为香港地域经济构造和规模,但其区位优势尚未以数据形式办事大湾区整体经济,本身数字经济开展也面对‘区位塌陷’的情况。内地互联网企业国际化规划已久,但遍及仅把香港地域单纯用做为融资中介平台;全球互联网巨头仅在港供给通用性互联网办事,也并未赐与响应研发等重视规划。”

关于上述问题,该份提案建议,在河套深港科技立异合做区根底长进一步完美深港跨境数据要故旧易平台。

而以河套和前海地域为跨境数据畅通交易摸索,恰是深圳数据交易所本年工做的一大重点。“接下来我们将重点围绕深港澳跨境数据畅通场景打造闭环案例。”深圳数据交易所运营部负责人说。

在场景选择上,该负责人进一步介绍称,前海和河套基于政策前提、财产优势、数据跨境根底设备等差别,估计选择的示范场景也会差别。

培育数据人才,从“数据开发者方案”发掘更多企业需求

正所谓交易讲求两方实力对等,也就是生态的平衡。在供应端要包管数据可畅通、有应用场景,在需求端则是要发掘出企业潜在的需求。

然而,发掘那个过程,需要大量懂数据的专业人才。对此,深圳数据交易所在2022年中国互联网大会上,推出了一项“数据开发者培育方案。”

那项方案将由深圳数据交易所结合政府机构、数据源方以及数据畅通手艺方等模仿数据交易市场,为广阔的开发者、高校、学生、企业开发者供给基于数据平安可信的情况,构建基于开发者本身认知的行业应用孵化场景。

“那将有效处理‘有原料,缺厨师’的问题。”深圳数据交易所市场部负责人李东阳比方道,同时,那也是深圳为数据要素市场化建立提出的一个重要理念,为广阔学生、社会工做者供给一个新的手艺应用赛道,在数据应用侧,为市场培育一批数据开发标的目的的稀缺人才。同时,此方案所产出的数据产物,也将回馈市场,以需求为导向,构成深度的产物规划才能,撑持深圳企业在数字经济财产变革中走在前列。

“深圳数据交易所接下来将基于数据开发者培育方案,打造一个持续的开发者大赛活动,构成具有全国影响力的赛事。”李东阳说,同时借助赛事,搭建企业需求者、数据开发者、数据供给方三方配合交换的桥梁,抱负形态是每年在那个时间轴里都能够产生新的内容、新的需求、新的应用。

更多内容请下载21财经APP