昇思开源AI框架加速应用落地
➤我们从昇思开源的那一刻开始,就毫无保留开放代码,将每一位开发者的贡献放到社区中,携手产业界、开发者共建AI开源框架繁荣生态
➤之前是一个个螺丝去拧、一个个齿轮去拼,AI框架将这些零件集成组合,变成包含“变速箱”“方向盘”“发动机总成”的标准化、模块化零件库,开发者拼装时,只需要把这几个大件根据自己的需求微调一下,就能组装出一辆车
文 |《瞭望》新闻周刊记者 钱沛杉
2024年,诺贝尔三大科学奖项中,两大奖项颁给人工智能领域的研究者。
从传统的深度学习模型时代,到方兴未艾的大模型时代,AI的发展都离不开AI框架的平台化支撑。
人工智能框架是AI时代的操作系统与软件底座。为开发者提供了高效、便捷的开发平台,加速人工智能技术创新和应用落地。
华为在2020年3月28日开源了昇思MindSpore框架,携手产业界、开发者,共建AI开源框架繁荣生态。4年多来,昇思迅速发展,2024年中国新增市场份额将达30%,成为中国发展最快的开源AI框架,也逐渐成为业界人工智能框架新选择。
“让算法更好地在硬件上跑起来”
“让算法更好地在硬件上跑起来,就是AI框架要做的事。”昇思开源社区理事长丁诚介绍,一个完整的AI软硬件架构中,最下层是CPU、GPU芯片等在内的硬件层,最上层是各类应用,应用背后是算法,AI框架起到连接硬件与算法的作用。
深度神经网络的广泛应用是这一轮AI实现突破的重要原因。“神经网络是模拟人脑中的神经系统,通过大量人工神经元(或称节点)之间的连接和信息传递来实现复杂的信息处理和学习。这些节点背后都有对应的函数和映射,如果每个节点都要开发人员手写计算公式,将意味着巨量的代码和高额的开发成本。”丁诚说。
一方面,AI框架“用机器代替手写”,让代码语言更加简洁、抽象。
丁诚将AI开发类比于汽车组装过程。“之前是一个个螺丝去拧、一个个齿轮去拼,AI框架将这些零件集成组合,变成包含‘变速箱’‘方向盘’‘发动机总成’的标准化、模块化零件库,开发者拼装时,只需要把这几个大件根据自己的需求微调一下,就能组装出一辆车。”
另一方面,AI框架可以在不同的硬件上做充分的加速和调度,解决并行化问题,让大模型开发、训练更稳定、更高效。
昇思在设计之初就构筑了框架原生分布式并行能力,最大化实现算法泛化性,以应对快速迭代的模型技术。“算法的计算是无数个矩阵的乘、加、和,AI框架跑在不同的计算单元上面,可以充分把它并行化起来。”丁诚将这个过程类比于“手推车”——没有它时,工人一次只能搬一块砖,有了AI框架结合硬件系统,可以实现一次搬一摞砖块。
AI框架加速多个行业应用落地
在近日召开的昇思人工智能框架峰会上,18家单位发布了基于昇思的原生开发大模型成果,中国商飞联合昇思打造的业界首个三维超临界机翼流体仿真大模型“东方·翼风”位列其中。
受访人士介绍,在飞行器设计中,机翼的阻力分布约占整体飞行阻力的52%,机翼形状设计对飞机整体的飞行性能至关重要。使用传统的流体仿真技术,存在大量重复迭代计算工作,对计算资源消耗大,设计周期长。
“AI框架提供的算法抽象,以及并行化能力,对于缩短AI设计研发周期有着天然优势。”丁诚说,在昇思MindSpore流体仿真套件的支持下,“东方·翼风”能在超临界翼型的几何形状、来流参数(攻角/马赫数)发生变化时,实现大型客机翼型流场的高效高精度推理,快速精准预测翼型周围的流场及升阻力,为飞机气动设计提供有价值的参考。
中国工程院院士、中国商飞首席科学家吴光辉表示,“东方·翼风”可以实现千万级网格流畅的秒级推理,仿真时间只有传统数值计算的约千分之一,实现了效率、精度、模型、场景四个方面的突破。
昇思还为“人工智能驱动的科学研究”(AI for Science)等行业发展带来新的可能。
蛋白质结构预测是获得蛋白质功能结构和构象的过程。过去,因蛋白质构象数量巨大,计算过程复杂,获取蛋白质空间结构的方法仍然以冷冻电镜、X-ray等实验技术为主,单个蛋白质的观测需耗费数月及数百万元人民币。
基于昇思全场景AI框架,北京昌平实验室、北京大学、深圳湾实验室联合研发团队推出全流程蛋白质结构和功能预测工具MEGA-Protein,该工具的蛋白质结构预测性能相比“阿尔法折叠2”提升40多倍,在全球持续蛋白质结构预测竞赛CAMEO中连续三周获得第一名。
此外,AI在先进制造、气象海洋、新材料等诸多领域,推动了基础研究的重大突破。在会场,一位物理海洋领域研究者告诉记者,机器学习模型在海洋与气候变化研究领域已实现多项应用,其中,运用机器学习可以将厄尔尼诺-南方涛动的预测时间延至两年以上,突破了此前的“春季预报障碍”问题,并为科学家理解其物理机制提供了新思路。
“在类似问题研究上,人类可能因其先验知识和主观判断忽视了真正产生影响的因素,AI能帮助我们认识新的物理。”他说。
产学研联合共建繁荣生态
“我们从开源昇思时就毫无保留开放代码,将每一位开发者的贡献放到社区中,携手产业界、开发者共建AI开源框架繁荣生态。”丁诚说。
技术联合攻关。7月4日,世界人工智能大会最高奖项——2024年度SAIL奖(卓越人工智能引领者奖)揭晓。南方电网公司研发成果“驭电”智能仿真大模型是五个获奖项目之一。
该模型由南方电网公司联合华南理工大学、武汉大学和华为公司,以产学研合作方式共同攻关。南方电网提出需求后,华为公司多部门专家提供工程设计指导,由昇思AI框架与昇腾AI处理器提供基础软硬件能力,高校则在训练数据处理等领域发挥所长。
受访人士认为,这是产学界合作的一次成功实践,也是科学计算与人工智能结合潜力的展示。
人才联合培养。昇思以技术为源赋能开发者,以众智计划、联合创新建立技术与科研连接,孵化科研成果。积极建立上游社区连接,与中国人工智能学会、鹏城实验室联合发布昇思MindSpore学术基金,预计3年内携手50多位全球AI学者,攀登学术新高峰。
“昇思针对不同阶段的开发者,提供不同成长路径的培养方案。”丁诚介绍,在入门阶段,昇思提供系列教材和认证课程,走进高校支持学生入门AI学习;面向实践阶段,昇思提供系列化的实习、众智和竞赛任务,给开发者提供实践机会;面向研究创新阶段,昇思提供学术激励基金和算力支持,激发原创科学研究。
数据显示,目前昇思已与360多所高校科研院所开展教学及科研合作,联合1700多位合作伙伴打造超过2000个解决方案。机器学习资源网站Paper With Code显示,支持基于昇思原创论文发表累计超过1700篇,位列全球第二、中国第一。
丁诚说,未来,昇思将继续坚持技术创新,并将坚持以开源的方式,向业界开放技术创新成果。昇思将继续携手产业界客户、伙伴和广大开发者,共促中国人工智能框架生态健康、高速发展。□