政协委员支招AI研发:弹性分配算力资源,适当开放政府数据
【资料图】
近日,对话AI模型ChatGPT因极其出色的文本生成和对话交互能力在世界范围内迅速走红,五天内用户破百万,两个月用户破亿。在代表委员们即将带上全国两会的提案建议中,它也是当仁不让的热话题。
ChatGPT的爆火折射出我国人工智能发展存在哪些问题?带来了哪些启示?今年两会,全国政协委员、民建四川省委副主委、西南财经大学大数据研究院院长寇纲提交了《关于大力发展自主创新的人工智能通用基石模型的提案》,针对我国人工智能领域当前存在的自主研发能力不足、算力资源协同不够等问题提出解决办法。
寇纲在提案中指出,我国人工智能领域自主研发能力亟待提升。具体而言,目前我国底层架构软硬件基础几乎都由国外公司垄断,高质量的数据集已经成为制约人工智能领域发展的瓶颈之一,比如很多国外数据集限制国内IP或直接不向国内用户提供服务。
对此,寇纲建议加大对人工智能基础领域自主研发的创新扶持。由工信部和科技部牵头,出台激励和引导人工智能大模型关键技术攻关和应用生态建设专项政策;通过科技部、自然基金委等发布专项支持高质量人工智能数据集建设;构建平台和生态系统,建立高校、科研机构与企业开展联合创新的机制。
寇纲还指出,一方面,我国算力资源调配协同能力有待加强,当前各地算力使用分布不均,无法实现跨域的动态调配;各地区人工智能计算中心相对独立,各超算中心使用的前端系统不同,规则也不同。另一方面,产业生态不够成熟。当前我国大模型的研发已成为少数机构的竞赛,相互之间的模仿和竞争效应大于协同和合作效应,从而造成资源浪费。
于是,寇纲建议实现全国一体化算力网络统筹调度。建议将各地分布的超算、智算、人工智能计算中心节点通过专线连接,形成全国范围内一体化感知、分配、调度人工智能算力网络,在此基础上实现资源弹性分配。建议统一超算前端系统,打通不同系统和应用之间的壁垒, 实现一键登录及新老系统的数据互通,提升客户体验。
寇纲还在提案中提出,要深入人工智能基础模型创新生态建设,孵化一批真正面向市场需求的创业公司以打破行业垄断,同时在国家机构监管和宏观把控的前提下,将政府数据对白名单企业、机构、高校适当开放,探索面向城市治理等领域的大模型应用和服务。
人工智能通用基石模型依托海量数据库信息存在,可能带来数据泄露、虚假信息、版权侵权等隐患。针对上述问题,寇纲建议修订《网络安全法》《数据安全审计法》等已有互联网法律法规,明确人工智能通用基石模型及生成式AI技术和应用中涉及政治、民族、宗教和互联网等相关的法律底线和红线问题。除此之外,应加快人工智能通用基石模型带来的知识产权保护研究,推进AI内容监控平台建设。
采写:实习生朱梓函 南都记者樊文扬