北京市人大常委会主任屠昆:创造高质量数据是人工智能更好发展的前提-新京报

新京报贝壳财经讯(记者罗一丹)北京市十六届人大四次会议1月25日开幕,数字经济、人工智能等科技问题备受与会代表关注。成方金融科技有限公司北京市人大代表涂坤先生提出了《关于打造高质量数据产业生态中心的建议》。涂坤,北京市人大副委员。涂坤先生(受访者提供)告诉新京报贝壳财经记者,目前大规模模型性能有限的原因之一是垂直数据封闭,公共数据已经无法满足专门场景的需求。 “尽管目前大模型技术已经普及,但在专业领域的应用仍然存在精度不足的问题。这种现象的本质是互联网上的公开数据被过度利用。”已被充分挖掘,高质量的训练数据面临耗尽的危险。 “很多数据都保存在不同的行业组织中,尚未实现有效分配。”他将此归因于合规和高效的数据共享,但面临着确权困难、估值缺失、利益共享机制缺失等诸多挑战。对此,涂坤先生提出建立“数据体系试验区”,推动数据体系实验与数据创新实践相结合。围绕数据所有权、分配交易、收益共享和安全治理,建立全面、审慎、灵活的监管模式,促进数据体系创新。快速部署数据应用,并根据具体应用场景探索系统实施和创新途径,在此过程中探索建立了基本的制度框架,例如在领域进行试点。比如自动驾驶、医药健康等。实施与修改同时进行的模式,形成了“制定→实施→总结→反馈→审核”的快速良性循环。通过具体实施发现问题、解决问题,逐步建立可行、有效的数据体系。我来了。对于高质量数据集,涂坤建议,应在整个数据生命周期、跨行业口开展数据资产登记、人工智能数据集质量评估等标准制定和试点工作。这些标准应引领提高数据质量并创建跨多个学科的高质量工业数据集。同时,鼓励创新试验区探索融合、跨领域的数据应用。 “我们的理念是‘先行动,再改进’。通过实际操作,发现问题,为问题提供支撑。”法律法规、监管标准和市场机制建设逐步推进。同时,实验区将推动数据预处理环节的产业化发展,包括数据清洗、标签、质量评估等,形成新的就业形态和经​​济链条。比如,以“高质量工业数据集”建设为起点,同时鼓励和促进数据管理与清洗(数据准备)、数据评估(数据质量)、数据标注、数据安全与隐私保护等各个数据相关环节的基础服务规模化、产业化,构建可靠的数据空间。编辑:王金玉,校对:张彦军。

推荐文章

发表评论

邮箱地址不会被公开。 必填项已用*标注