6 月 22 日,由开源中国主办,华为、上海浦东软件园联合主办的【云技术专场】OSC源创会 · 上海站 · 104期线下沙龙成功举办。华为2012实验室openEuler架构师高贵锦发表《openEuler:智能算力时代的数字基础设施底座》主题演讲,介绍了openEuler 24.03 在云原生与AI领域的最新进展,同时分享了关于如何与云原生技术共同打造更好的大模型时代的IT基础设施层平台的实践和思考,以及下一步计划。
以下为高贵锦的演讲回顾,内容由活动现场参会嘉宾@阿维同学贡献。
整理:阿维同学(WeChat:AWTX550W)
OpenEuler@2024项目在2024年成功推出了多个长期支持(LTS)版本,标志着其在智能技术领域的全新篇章,并致力于构建全球性的开源新生态。以下是该项目的主要内容和成就概览:
版本发布与贡献
- 20.03 LTS多样性算力版本:该版本吸引了60位成员和3630名贡献者,展示了 openEuler 在多样性算力领域的强大实力。
- 22.03 LTS全场景版本:这个版本拥有330位成员和8403名贡献者,装机量达到130万,并推出了151个社区创新项目。
- 24.03 LTS AI原生版本:作为 openEuler 在 AI 领域的重大突破,这个版本吸引了1577位成员和18800名贡献者,装机量高达680万,同时与2744个社区和硬件厂商建立了合作关系,并举办了1481场相关赛事。
全球影响力
openEuler 不仅在国内取得了显著成就,更在国际上展现了其强大的影响力。项目携手多个国际开源组织,如 Linux 基金会、Eclipse基金会、RISC-V基金会等,共同推动全球开源生态的发展。目前,openEuler已在全球153个国家和地区建立了37个镜像站点,吸引了超过1093名海外开发者参与,全球下载量更是高达240万+。
这些数据和成就充分证明了openEuler在全球开源社区中的领先地位和深远影响。未来,openEuler将继续致力于推动开源技术的发展和创新,为构建更加智能、开放、协作的全球新生态贡献力量。
openEuler 24.03 LTS作为首个AI原生开源操作系统,其正式发布标志着在多个关键领域实现了显著的升级。以下是该版本的主要更新内容:
- 基础设施的全面升级:软件中心通过联接软件上下游,加速了版本迭代和生态循环。EulerCopilot作为AI全栈使能平台,提供了基于大模型的自然语言智能交互体验,支持pytorch、OpenViNO等主流框架,以及aiAware和iSulad 2.0等智能解决方案。
- 智能解决方案的革新:openEuler 24.03 LTS引入了A-ops智能运维和A-Tune智能调度系统,极大地提升了系统的自动化和智能化水平。同时,osAware智慧流控技术确保了系统在各种场景下的流畅运行。
- 全场景体验的优化:该系统不仅支持嵌入式、边缘计算等多样化场景,还实现了公有云的全球同步分发,覆盖AWS、Azure、腾讯云、华为云等主流云平台。此外,它还支持ARM、x86、RISC-V等多种异构算力,为开发者提供了更广阔的选择空间。
- 核心组件的更新:openEuler 24.03 LTS在核心组件上也进行了全面升级,包括gcc 12.3、LLVM 17.0.6、binutils 2.41、glibc 2.38等,确保了系统的稳定性和性能。
- 内核的全新升级:内核版本升级到6.6,带来了动态复合页、负载动态均衡、多优先级混部等多项创新技术,进一步提升了系统的IO性能、数据吞吐能力和延迟表现。
openEuler 24.03 LTS在基础设施、智能解决方案、全场景体验以及核心组件等方面均实现了显著的升级和改进,为开发者提供了更加高效、智能和灵活的操作系统选择。
全新内核的发布带来了核心子系统特性的显著升级,为用户提供了更优的体验。
场景化关键特性
- 动态复合页:通过自适应选择页面大小,实现了IO写性能2倍的提升。
- 负载算力协同:实现了负载的动态均衡,确保算力高效供给,数据库性能提升达10%。
- 多优先级混部:容器QoS的细粒度隔离确保了CPU占用的稳定性,波动控制在5%以内。
社区深度协同
在多个关键领域实现了深度协同,包括:
- 调度:引入了EEVDF和可编程调度技术,确保调度更加均衡。
- 内存:folio技术的引入,使得内存管理更加高效。
- 网络:BIG TCP技术的支持,提升了网络性能。
- 云原生:Cgroup V2、MPTCP和vCPU热插拔等技术的集成,进一步增强了云原生环境的稳定性和性能。
6.6新内核开源共建
新版本的内核开源共建,为社区贡献了调度、内存等核心子系统的30+特性,这些特性使得调度更加均衡,内存管理更加高效,进一步提升了系统的整体性能。
会议中关于全新内核特性升级的关键点,展示了产品在多个方面的优化和升级。
全场景体验升级
服务器:
- 极致性能,高可靠性
- sysSentry:故障管理框架,已知CPU硬失效98%检出
云原生:
- 高资源复用,极致性价比
- iSula 2.0:异构算力拓扑感知,运行时稳态CPU降低30%
- gala-ops:云化场景全栈可观测,底噪低于5%
嵌入式:
- 拥抱LLVM,实现多OS同硬件混部
- LLVM平行宇宙:采用LLVM技术栈,提供多重编译保障
- 混合关键系统:支持欧拉鸿蒙同硬件混合部署
其他亮点:
- oeAware:微架构优化,redis性能提升70%
- Haoc-kernel:从结构上提升内核抗攻击能力
- 潮汐调度:实现容器规格规模的弹性扩缩容,启动速度提升80%
- 欧拉派:面向爱好者的新型嵌入式开发板,提供丰富的开发体验
内容主要围绕服务器、云原生和嵌入式技术的全场景体验升级展开,强调了这些技术在提高系统性能、稳定性和资源复用率方面的优势。同时,还介绍了其他相关技术和工具,如oeAware、Haoc-kernel、潮汐调度和欧拉派等,为参会者提供了全面的技术解决方案和参考。
sysSentry,作为一个统一的硬件故障管理框架,具备以下核心特点:
- 高效上报:系统支持快速上报机制,无论是主动上报还是被动感知,都能确保故障在秒级时间内得到响应。
- 精准检测:sysSentry的检测准确性极高,例如,对于CPU硬失效故障,其检出率高达98%。
- 易于扩展:通过插件化管理,系统支持硬件的快速接入和统一纳管,目前支持的硬件类型包括CPU、内存、硬盘、GPU、NPU等。
在硬件故障巡检方面,sysSentry提供了全面的检查功能,包括HBM巡检、内存巡检、CPU巡检和IO巡检等,确保硬件设备的稳定运行。
此外,系统巡检也是sysSentry的重要功能之一,它涵盖了CPU使用率、PID数量、内存使用率和文件句柄等方面的监测,为系统性能提供了全面的保障。
openEuler Call for X 计划
面向数字基础设施开源操作系统的 openEuler,希望通过开源开放,汇聚更多力量,不断探索科技创新的边界,驱动物理世界与数字世界的深度融合,构建万物互联的智能世界。“openEuler Call for X 计划”是一个开放的社区项目,鼓励所有社区成员以及开源爱好者积极贡献、乐于分享、热衷实践。多元化的贡献可以丰富社区生态,希望开发者都能感受到个人的价值和重要性。
https://www.openeuler.org/zh/community/program/