近日
广州城市可信数据空间上线
暨首批高质量数据集发布会
成功举行
广州全面启动
城市可信数据空间
和高质量数据集建设
其中
广州开发区、黄埔区
5个高质量数据集全部入选

此次发布会中,首批共发布16家单位的28个高质量数据集,广州开发区、黄埔区3家企业申报的5个数据集全部入选并在发布会现场完成了供需对接签约。
包括:
-
广州金域医学检验集团股份有限公司的金域医学呼吸道病原体靶向测序数据集、金域医学宫颈癌筛查数据集、金域医学过敏原监测数据集;
-
广州奥凯信息咨询有限公司的全球深加工专利信息数据集;
-
广州博士信息技术研究院有限公司的全国多模态政策数据集。
什么是高质量数据集?
它有什么用处?
高质量数据集是按照特定标准,依次开展数据采集、数据清洗、数据归类和数据标注等智能化处理,并具备更新和维护机制的数据集合。
以金域医学宫颈癌筛查数据集为例,该数据集源于金域医学进行宫颈癌筛查相关检测获得的医学检验数据,覆盖了HPV核酸检测、细胞病理、组织病理三大检测类型。
数据经过清洗、标准化等操作形成数据库表,数据字段包含样本送检信息和检测结果信息,支持用于多主题的数据分析和数据建模。该数据集的应用,可提升宫颈癌筛查率和公卫防控能力,降低宫颈癌发病率,助力疫苗研发推广。
基于宫颈癌数据的开发利用,金域医学打造了“数据驱动的宫颈癌早筛及防控方案”,斩获2024年“数据要素×”大赛全国总决赛医疗健康赛道的“商业价值奖”。

本次广州开发区、黄埔区入选的5个数据集主要集中在医疗健康、知识产权、政策分析等领域,包含多模态政策数据、专利信息数据、宫颈癌筛查数据等多种类型。
此次发布的高质量数据集,既有助力科技转化的通用数据集,又有助力医疗健康精准应用的行业专用数据集,意味着广州开发区、黄埔区率先在构建丰富、多层次、多类别的高质量“数据集市”中走在前列。
建设高质量数据集是落实《中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见》《“数据要素×”三年行动计划(2024—2026年)》,推动数据产业和数据标注产业高质量发展,推进“人工智能+”行动的重要抓手。
下一步,广州开发区、黄埔区将以广州城市可信数据空间上线暨首批高质量数据集发布会为契机,摸底区内各行业数据集资源,继续推动高质量数据集建设,持续增加数据供给,促进相关企业、科研机构等围绕高质量数据集开展供需对接和生态合作,推动“人工智能+”行动,加快数据要素赋能千行百业。
来源丨区政数局、广州高新区发布
