公司动态
我国成功研发全球最大AI天文训练数据集
近日,贵州大学张莉教授团队成功开发出全球最大、最全的天文AI训练数据集——ADAM(Astronomical Data for AI Modeling)。这一成果在贵州省贵阳市正式向全球发布。这标志着我国射电天文学与人工智能交叉领域的重大突破。这为应对射电天文学观测数据吸收和影响分析的双重挑战奠定了关键而坚实的数据库基础。
当前,全球天文学正面临数据爆炸性增长带来的严峻挑战。随着国际重大科学工程SKA(平方公里阵列)、中国500米口径球面射电望远镜主阵等新一代望远镜阵列的研制或使用,海量观测数据中的各种复杂效应和多效应耦合干扰已成为制约科学观测的主要瓶颈。对天文数据的准确和基本解释。
人工智能技术被认为是解决这一问题的好办法,而高质量、大规模的数据集是深度挖掘天文数据价值和技术转移的基础。张莉教授团队花费数年时间研究并系统复制射电望远镜阵列的观测效果,最终创建了亿级天文AI训练数据集(ADAM)。目前,数据集规模达到61248万张图像,并且数据还在不断增长。如果按照5MB的镜像存储容量计算,其总容量超过304TB,相当于152万个2GB U盘的总存储容量。
ADAM数据集的构建打破了传统的单维度研发模式,创新性地采用了“多观测效果协同模拟”方法。它全面涵盖了模拟观测SKA中低频阵列、FAST核心阵列和FAST阵列。它不仅具有多维特性,还充分再现了真实观测中的复杂效果,为AI模型学习与实际观测相符的天文规律提供训练素材。
该数据集将为多场景应用程序提供支持。它可以支持恒星演化和星系形成等基础课题的研究,并帮助探测脉冲星和超新星爆炸等未知天体。在大型科学项目中,可用于验证望远镜性能、优化观测计划、提高设备运行效率。在人工智能领域,为天体识别、数据降噪等模型训练提供基础素材,推动AI技术与天文研究的深度融合。此外,处理数据集的方法可以转移到现场,可视化数据也可以从而起到科普教育的作用,激发公众探索宇宙的兴趣。
ADAM数据集是全球首个系统涵盖射电天文主要效应和多效应耦合场景的人工智能训练资源,填补了射电天文效应观测人工智能训练数据集的空白。将有力支撑科研领域“东数西数”工程的实施和应用,优化国家天文资料资源配置。将深度强化“人工智能+天文”行动,加快AI天文与技术的融合创新,为全球射电天文研究和科学成果提供重要数据支撑,推动天文智能计算中心建设。进一步提高我国无线电能力 天文学优势地位继续保持领先地位这个领域。
作为“科学研究的无限源泉”,这一成果已成为国际天文合作的重要纽带,有助于构建开放共享的治理结构,为人类认识宇宙提供坚实的数据基础。 “ADAM不是‘终点’,而是支撑‘人工智能+全球天文学’研究的‘起点’。”张莉教授表示,团队将继续深化数据复制,推动跨领域合作,推动重大科学突破。 (照片已获得高鑫许可)
以上内容为宣传信息,所涉及内容不代表本网站观点,不构成投资建议或消费建议。
版权保护:本网站发布的内容(包括文字、图片、多媒体信息等)的版权属于中国日报网(中国日报国际文化传媒(北京)有限公司)有限公司)仅供邦格使用,未经中国日报网事先同意和授权,禁止复制和使用。向中国日报提交评论:rx@chinadaily.com.cn 上一篇:连接欧洲科技资源与技术创新 上海宝山区与西班 下一篇:没有了
