技术分享|异构多元算力的挑战与生产实践

近年来,芯片产业快速发展且芯片类型日趋多样,例如基于Arm架构的创新型芯片不断面世,其多核心及低功耗特性深受市场追捧,数据中心资源层面x86架构和Arm架构设备多芯并存的局面日益普及;同时企业的数字化转型也带来了应用场景的多样性,例如所需算力的多样性不断升级,从云主机到裸金属,到容器,云基础设施建设面临的挑战比以往更大。

技术分享|异构多元算力的挑战与生产实践

“一云多芯”被认为是应对以上挑战的较好方式之一。一云多芯”是指通过一朵云基础设施平台,将不同芯片路线的服务器进行整合,实现部署,使用,运维等全流程统一管控。具有以下三点优势:

异构兼容:通过云基础设施软件,实现多种芯片路线异构并存,屏蔽底层芯片差异化;

降低消耗:使硬件资源更多用于业务支撑而非控制服务消耗,提升资源利用率;

简单易用:通过部署架构、管理界面、账号体系的统一,实现统一管理、统一运维、统一运营。

技术分享|异构多元算力的挑战与生产实践

即拒绝通过云管统一纳管的“假”异构多芯,拒绝针对不同芯片开发“定制版”安装介质,拒绝指定部署角色和不同芯片服务器的对应关系。在安装方面,采用一个安装包、一个部署工具、一种安装方式,能够自动化部署,无需手动安装、命令辅助和安装后配置调整;运维方面,一个管理门户、一套账户体系、一种使用体验,全栈服务自愈,智能监控运维;扩容方面,能够一键扩容计算、存储、计算存储节点,能够一键获取新的产品能力、容器服务、裸金属服务、数据保护服务等;迭代方面,使用同一套代码,云平台和产品能力均可独立升级;能力一致性方面,功能清单一致、性能基线准确、场景覆盖完整。

技术分享|异构多元算力的挑战与生产实践

“一云多芯”典型部署形态有三种:

同构多芯:在同一个云内,并存相同指令集架构的不同厂家芯片的服务器,例如,飞腾(Arm)+鲲鹏(Arm);

异构多芯:在同一个云内,并存不同指令集架构的不同厂家芯片的服务器,例如,飞腾(Arm)+海光(C86);

多云多芯:云环境由多个云(region)组合而来,在同一个云内(region),并存相同/不同指令集架构的相同/不同厂家芯片的服务器,例如,云环境=region1(飞腾)+region2(海光+鲲鹏)。

技术分享|异构多元算力的挑战与生产实践

产品级“一云多芯”奠定了云基础设施持续演进的基础,使云化数据中心具备了“成长性”,以便满足企业数字化建设的持续性需求。即云基础设施可以随着时间的推移,支撑的业务场景能够持续丰富,提供的云产品能力能够持续获取,部署的规模能够持续扩展,产品可以持续更新迭代,从而消除版本问题,实现云的“永续生命周期”。

“一云多芯”之外的另一个趋势是多元算力。在多芯片和多云服务类型的场景下,云计算基础设施如何满足三个层面的需求即:用户层面,管理、运维、使用如何统一;厂商层面,开发、测试、迭代如何统一;产品:功能、场景、品控如何统一。

技术分享|异构多元算力的挑战与生产实践

在实践中,“1对1”可以很好应对多元算力带来的挑战。首先,在底层通过产品级“一云多芯”把底层硬件资源统一成一个计量单位。同时,通过云产品的形式提供平台服务能力,每一个云产品都是一个独立的云服务,没有相互依赖关系,可以根据需求灵活选用。这些云产品形成一个整体,和统一的底层架构形成“1对1”的模式,从而保证聚焦在一个技术路线上持续创新。

还需要的明确的是,当算力多元时,存储和网络也必须做出对应的设计,进行统一管理。新一代的云基础设施需要异构多元算力场景下,实现网络、存储的统一管理和调度。

基于以上应用和实践,易捷行云EasyStack将产品级“一云多芯”集成进云基础设施解决方案。该方案依靠数字原生引擎与众多云产品组成,对数据中心物理资源进行整合,提供计算、存储、网络、安全和PaaS等丰富的云服务,对云基础设施进行全生命周期管理,成为企业数字化转型的强力引擎,助力企业持续业务创新。

易捷行云EasyStack一云多芯服务以云产品形态提供,提供资源异构能力,支持云基础设施内多芯并存,是数字原生基础设施的一项服务。数字原生基础设施包含云基础设施ECF、云原生基础设施ECNF、数字原生全云能力ECS三大通用场景解决方案,具备可进化架构、数字驱动模型、开源生态产品化三大架构能力特性和渐进式路径、全云能力就绪、运营消费模式三大应用能力特性。「链接」


本文整理自2022 OpenInfra Days China线上峰会的分享,分享人:易捷行云EasyStack产品高级总监郭长波和产品经理高广生,分享题目《分享异构多元算力的挑战与生产实践》。更多技术内容分享:

OpenInfra峰会分享|基于OVN的支持裸金属接入Geneve的网关服务

OpenInfra峰会分享|Kata Containers安全容器在Kubernetes集群中GPU支持实践

https://www.xianxiaba.com/kejitongxun/31858714.html

本站所有信息均由爬虫抓取,用于机器学习,如有发现包括但不限于“违法、违规信息、侵权信息”,请联系站长删除处理。