| _2025-04-18_19:20:44_ | 2025-04-18 19:20:44 | | RISC-V on the Performance Top _ Performance Blog | | 原文链接失效了?给我留言 | | TAGs:处理器 risc-v 性能 | | Summary: This text consists of several blog posts by Fei Wu discussing various topics related to RISC-V, including its performance, vector extensions on Valgrind, the importance of frame pointers, implicit type conversions causing panics, Git bisect for debugging, RISC-V interrupt handling, challenges and advantages of RISC-V, and RISC-V syscall performance regression. The posts also mention testing results and commands used for analysis.本文由 Fei Wu 的几篇博客文章组成,讨论了与 RISC-V 相关的各种主题,包括其性能、Valgrind 上的向量扩展、帧指针的重要性、导致 panic 的隐式类型转换、用于调试的 Git bisect、RISC-V 中断处理、RISC-V 的挑战和优势以及 RISC-V 系统调用性能回归。这些帖子还提到了用于分析的测试结果和命令。 | |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| _2025-03-07_12:05:21_ | 2025-03-07 12:05:21 | | ARM_virtualization Performance and Architectural Implications - DeepSeek - 探索未至之境 | | 原文链接失效了?给我留言 | | TAGs:虚拟化 性能 | | Summary: This paper explores the performance of ARM virtualization on server hardware, specifically focusing on multi-core ARM systems and comparing two popular hypervisors, KVM and Xen, on both ARM and x86 platforms. The study reveals that ARM enables significantly faster transitions between a virtual machine (VM) and a Type 1 hypervisor like Xen compared to x86, but Type 2 hypervisors like KVM on ARMv8.0 have higher overhead for VM-to-hypervisor transitions. The researchers also discuss the impact of hypervisor software design and implementation on overall performance. They propose improvements to the ARM architecture, such as Virtualization Host Extensions (VHE), to bring Type 2 hypervisors' fast transition costs to real application workloads involving I/O. The research is significant as ARM servers are becoming increasingly common, and understanding their virtualization performance is crucial for hardware and software architects.本文探讨了 ARM 虚拟化在服务器硬件上的性能,特别关注多核 ARM 系统,并比较了 ARM 和 x86 平台上两种流行的虚拟机管理程序 KVM 和 Xen。研究表明,与 x86 相比,ARM 可以在虚拟机 (VM) 和 Xen 等 1 类管理程序之间实现更快的转换,但 ARMv8.0 上的 KVM 等 2 类管理程序具有更高的 VM 到管理程序转换开销。研究人员还讨论了虚拟机管理程序软件设计和实施对整体性能的影响。他们提出了对 ARM 架构的改进,例如虚拟化主机扩展 (VHE),以将 Type 2 虚拟机管理程序的快速转换成本引入涉及 I/O 的实际应用程序工作负载。随着 ARM 服务器变得越来越普遍,了解其虚拟化性能对于硬件和软件架构师来说至关重要,因此这项研究具有重要意义。 | |
|
|
| _2025-03-07_11:08:51_ | 2025-03-07 11:08:51 | | KVM性能分析工具-zhurunguang-ChinaUnix博客 | | 原文链接失效了?给我留言 | | TAGs:虚拟化 性能 | | Summary: This text is about an announcement on a Chinese tech blog, "ChinaUnix," regarding temporary service disruptions for blogging due to server migration from September 30 to October 4, 2025. The blog post also includes statistics on KVM performance events and their analysis. The blog is written by a user named "zhurunguang" and has 123 articles, 0 blog points, and 11 technical points. The blog's categories include virtualization, Linux commands, MySQL, shell scripts, and KVM performance analysis. The text also includes code snippets for enabling and disabling KVM tracing and analyzing KVM performance data.本文是关于中国科技博客“ChinaUnix”上的公告,该公告涉及 2025 年 9 月 30 日至 10 月 4 日期间由于服务器迁移而导致博客服务临时中断。该博客文章还包括有关 KVM 性能事件及其分析的统计数据。该博客由一位名为“zhurunguang”的用户撰写,有 123 篇文章,0 个博客点,11 个技术点。该博客的类别包括虚拟化、Linux 命令、MySQL、shell 脚本和 KVM 性能分析。该文本还包括用于启用和禁用 KVM 跟踪以及分析 KVM 性能数据的代码片段。 | |
|
| _2025-03-07_10:51:08_ | 2025-03-07 10:51:08 | | Perf events - KVM | | 原文链接失效了?给我留言 | | TAGs:虚拟化 性能 | | Summary: This page explains how to use the Linux perf tool for counting and tracing performance events in the KVM kernel module. Previously, tools like kvm\_stat and kvm\_trace were used for this purpose, but now standard Linux tracing tools are used instead. The page covers counting and tracing events, recording events for the host and guest, and reporting events. The perf tool can be used to count events using the `perf stat` command, and detailed traces can be generated using ftrace. Events can be recorded to a file for later analysis, and the order of arguments is important when using the perf command. The page also mentions an alternative method of getting the guest's kallsyms and modules using sshfs and the --guestmount option.本页解释了如何使用 Linux perf 工具对 KVM 内核模块中的性能事件进行计数和跟踪。以前,kvm\_stat 和 kvm\_trace 等工具用于此目的,但现在使用标准的 Linux 跟踪工具。该页面涵盖计数和跟踪事件、记录主机和客户机的事件以及报告事件。perf 工具可用于使用 'perf stat' 命令对事件进行计数,并且可以使用 ftrace 生成详细的跟踪。可以将事件记录到文件中以供以后分析,并且在使用 perf 命令时,参数的顺序很重要。该页面还提到了使用 sshfs 和 --guestmount 选项获取客户机的 kallsym 和模块的替代方法。 | |
|
| _2025-07-03_11:47:53_ | 2025-07-03 11:47:53 | | Speeding up Large Memory VM Boot with QEMU ThreadContext | | 原文链接失效了?给我留言 | | TAGs:虚拟化 性能 | | Summary: This blog post discusses the importance of fast virtual machine (VM) boot times in virtualization environments for efficient resource management and improved user experience. The post explains that VMs are commonly configured with preallocated memory for better performance, but the downside is that it can lead to slow boot times due to the upfront commitment of resources and time required for initialization. The post introduces QEMU's ThreadContext feature, which can be used to optimize memory preallocation and reduce VM boot time. ThreadContext ensures that initialization threads are placed on the same NUMA node as the associated memory region and allows for parallel initialization, leading to significant time savings. The post provides instructions on how to use ThreadContext for memory preallocation in QEMU. The results show a 55% reduction in memory preallocation time compared to the baseline without ThreadContext.这篇博文讨论了在虚拟化环境中快速启动虚拟机 (VM) 对于高效资源管理和改善用户体验的重要性。该博文解释说,VM 通常配置预分配的内存以获得更好的性能,但缺点是,由于初始化所需的资源和时间的前期承诺,这可能会导致启动时间变慢。该博文介绍了 QEMU 的 ThreadContext 功能,该功能可用于优化内存预分配并缩短 VM 启动时间。ThreadContext 确保初始化线程与关联的内存区域位于同一 NUMA 节点上,并允许并行初始化,从而节省大量时间。该博文提供了有关如何在 QEMU 中使用 ThreadContext 进行内存预分配的说明。结果显示,与没有 ThreadContext 的基线相比,内存预分配时间减少了 55%。 | |
| _2025-03-14_16:51:19_ | 2025-03-14 16:51:19 | | Virtualization Tuning and Optimization Guide _ Red Hat Product Documentation | | 原文链接失效了?给我留言 | | TAGs:虚拟化 性能 | | Summary: The Red Hat Enterprise Linux Virtualization Tuning and Optimization Guide focuses on enhancing KVM performance. It offers tips for utilizing KVM features and optimizing host systems and virtualized guests. KVM guests run as Linux processes on the host, with virtual CPUs (vCPUs) handled by the Linux scheduler. Resource allocation and virtual hardware configuration significantly impact guest performance. | |
|
|
|
|
| _2026-03-27_16:06:59_ | 2026-03-27 16:06:59 | | Linux Benchmark Suite Homepage | | 原文链接失效了?给我留言 | | TAGs:测试 性能 | | Summary: Linux Benchmark Suite是一个开源项目,为Linux系统提供广泛的合成和应用基准测试工具,包括性能测量、调优工具和运行信息。项目包含快速测试、合成基准和应用基准三类工具,如lmbench、UnixBench、TPC-C等,用于评估CPU、内存、网络、磁盘和图形性能。该项目还提供相关资源和技术文档,帮助用户进行系统性能分析和优化。 | |
| _2026-03-27_15:43:15_ | 2026-03-27 15:43:15 | | Sysbench Benchmark - OpenBenchmarking.org | | 原文链接失效了?给我留言 | | TAGs:测试 性能 | | Summary: Sysbench是一个基于LuaJIT的多线程基准测试工具,主要用于评估CPU和内存性能。当前页面提供了Sysbench 1.0.20版本CPU子测试的详细性能数据,涵盖了从高端服务器CPU到主流消费级处理器的广泛结果。数据显示,性能与核心数量呈正相关,双路AMD EPYC 9965(192核)以约143.7万事件/秒的成绩位列榜首。该测试支持SSE2、AVX、AVX2和FMA等指令集,平均运行时间约6分钟,标准偏差为0.2%,表明结果具有较高的稳定性和可重复性。 | |
|
| _2026-03-19_11:03:54_ | 2026-03-19 11:03:54 | | IPI中断性能评估 _ Sisyphus | | 原文链接失效了?给我留言 | | TAGs:虚拟化 中断虚拟化 IPI 性能 | | Summary: 本文评估了虚拟机中IPI中断的性能表现,测试显示跨NUMA的IPI中断耗时较高。分析发现主要开销来自HLT指令虚拟化,通过设置idle=poll选项可显著降低延迟,但这会占用物理机CPU资源。文章探讨了halt_poll_ns机制作为性能与资源利用的折中方案。 | |
| _2026-03-19_11:07:05_ | 2026-03-19 11:07:05 | | IPI中断性能评估 _ Sisyphus | | 原文链接失效了?给我留言 | | TAGs:虚拟化 中断虚拟化 IPI 性能 | | Summary: 本文评估了虚拟机中IPI中断的性能表现,测试显示跨NUMA的IPI中断耗时较高。分析发现主要开销来自HLT指令虚拟化,通过设置idle=poll选项可显著降低延迟,但这会占用物理机CPU资源。文章探讨了halt_poll_ns机制作为性能与资源利用的折中方案。 | |
|
| _2026-03-10_14:43:51_ | 2026-03-10 14:43:51 | | Kimi _ Intel、AMD SPECvirt_sc2013 测试对比 | | 原文链接失效了?给我留言 | | TAGs:虚拟化 性能 | | Summary: 该网页对比了Intel与AMD在SPECvirt_sc2013虚拟化性能基准测试中的表现。结果显示,AMD EPYC 7702在2019年以5,451分超越Intel Xeon Platinum 8180的3,376分,领先61%。2023年AMD EPYC 9654达到8,336分,Intel Xeon Platinum 8380为4,821分。2024年Intel第五代至强8592+通过软件优化达到9,801分,重新夺回2P性能领先地位。双方在核心密度、内存带宽和软件生态方面各有优势。 | |
|
| _2026-03-10_10:24:19_ | 2026-03-10 10:24:19 | | SPEC virt_sc 2013 | | 原文链接失效了?给我留言 | | TAGs:虚拟化 性能 | | Summary: SPEC VIRT_SC 2013是用于测量虚拟化平台性能的基准测试套件,针对硬件厂商、虚拟化软件厂商、数据中心管理者和学术研究人员设计。该基准测试评估数据中心服务器在虚拟化服务器整合场景中的性能表现,支持硬件虚拟化、操作系统虚拟化和硬件。它整合了多个SPEC工作负载,包括SPECweb 2005、SPECjAppServer 2004、SPECmail 2008和SPECint 2006的修改版本,通过运行称为'tiles'的虚拟机集合实现扩展,所有虚拟机必须满足服务质量标准。基准测试还包括测量功耗和性能/功耗关系的选项,最新版本为V1.1,包含安全协议更新和错误修复。 | |
| _2026-03-10_14:34:22_ | 2026-03-10 14:34:22 | | 国产“芯+云”性能再破全球记录! | | 原文链接失效了?给我留言 | | TAGs:虚拟化 性能 | | Summary: 海光C86处理器在SPECvirt_sc2013测试中取得3782分优异成绩,登顶国产虚拟化软件性能榜首。该测试是业界公认的云数据中心虚拟化性能权威标准。基于海光C86的InCloud Sphere单核虚拟机密度达2.1VM/核,性能远超同类产品,标志着国产芯片虚拟化与云平台性能达到全球一线水准。 | |