_2025-04-18_19:20:44_2025-04-18 19:20:44
RISC-V on the Performance Top _ Performance Blog
原文链接失效了?给我留言
TAGs:处理器 risc-v 性能
Summary: This text consists of several blog posts by Fei Wu discussing various topics related to RISC-V, including its performance, vector extensions on Valgrind, the importance of frame pointers, implicit type conversions causing panics, Git bisect for debugging, RISC-V interrupt handling, challenges and advantages of RISC-V, and RISC-V syscall performance regression. The posts also mention testing results and commands used for analysis.本文由 Fei Wu 的几篇博客文章组成,讨论了与 RISC-V 相关的各种主题,包括其性能、Valgrind 上的向量扩展、帧指针的重要性、导致 panic 的隐式类型转换、用于调试的 Git bisect、RISC-V 中断处理、RISC-V 的挑战和优势以及 RISC-V 系统调用性能回归。这些帖子还提到了用于分析的测试结果和命令。
_2025-04-18_22:36:02_2025-04-18 22:36:02
RISC-V on the Performance Top _ Performance Blog
原文链接失效了?给我留言
TAGs:处理器 risc-v 性能
Summary:
_2025_2_18_17:23:11_2025_2_18 17:23:11
[v2] Add Counter delegation ISA extension support | Patchew
原文链接失效了?给我留言
TAGs:处理器 risc-v 性能 perf
saved date: Tue Feb 18 2025 17:23:11 GMT+0800 (中国标准时间)
_2025_2_18_17:20:51_2025_2_18 17:20:51
riscv-sbi-doc_src_ext-pmu.adoc at master · riscv-non-isa_riscv-sbi-doc
原文链接失效了?给我留言
TAGs:处理器 risc-v 性能 perf
saved date: Tue Feb 18 2025 17:20:51 GMT+0800 (中国标准时间)
_2025-07-04_10:35:23_2025-07-04 10:35:23
pktgen the linux packet generator.pdf
TAGs:网络 性能
_2024_10_12_18_53_36_2024_10_12 18_53_36
基于阿里云七代Ice Lake的HTTPS加速实践 - OpenAnolis龙蜥操作系统开源社区
原文链接失效了?给我留言
TAGs:网络 性能
saved date: Sat Oct 12 2024 18:53:36 GMT+0800 (中国标准时间)
_2025-02-26_15:11:56_2025-02-26 15:11:56
HPCwire_ Global News on High Performance Computing HPC
原文链接失效了?给我留言
TAGs:博客_论坛 性能
Summary: (by Mozilla Orbit AI)
_2025-02-26_15:27:29_2025-02-26 15:27:29
HPCwire:高性能计算 HPC 全球新闻 --- HPCwire_ Global News on High Performance Computing HPC
原文链接失效了?给我留言
TAGs:博客_论坛 性能
Summary: The article discusses several news items related to technology and science, including:
_2025-10-23_17:42:41_2025-10-23 17:42:41
ARM Virtualization_ Performance and Architectural Implications - isca2016-dall.pdf
TAGs:虚拟化 ARM 性能
_2026-03-19_11:01:41_2026-03-19 11:01:41
02x03-Davit_Matalack-KVM_Message_passing_Performance.pdf
TAGs:虚拟化 中断虚拟化 IPI 性能
_2025-07-03_15:00:09_2025-07-03 15:00:09
How to enable AMD AVIC and speed up your VMs
原文链接失效了?给我留言
TAGs:虚拟化 中断虚拟化 性能
Summary:
_2026-03-02_11:48:20_2026-03-02 11:48:20
VMExit优化技术细技术说明文档 - 基于Aggressive PV IPI和Passthrough Timer的私有云优化方案 - Kimi
原文链接失效了?给我留言
TAGs:虚拟化 中断虚拟化 性能
Summary:
_2026-03-27_15:00:07_2026-03-27 15:00:07
KVM_performance_tuning_on_Alibaba_Cloud.pdf
TAGs:虚拟化 中断虚拟化 性能 vmexit
_2026-02-28_10:58:39_2026-02-28 10:58:39
Minimizing VMExits in Private Cloud by Aggressive PV IPI and Passthrough Timer.pdf
TAGs:虚拟化 中断虚拟化 性能 vmexit
_2025-03-07_11:01:34_2025-03-07 11:01:34
01x10-David_Hildebrand-Guest-operating_system_debugging.pdf
TAGs:虚拟化 性能
_2025-03-07_12:05:21_2025-03-07 12:05:21
ARM_virtualization Performance and Architectural Implications - DeepSeek - 探索未至之境
原文链接失效了?给我留言
TAGs:虚拟化 性能
Summary: This paper explores the performance of ARM virtualization on server hardware, specifically focusing on multi-core ARM systems and comparing two popular hypervisors, KVM and Xen, on both ARM and x86 platforms. The study reveals that ARM enables significantly faster transitions between a virtual machine (VM) and a Type 1 hypervisor like Xen compared to x86, but Type 2 hypervisors like KVM on ARMv8.0 have higher overhead for VM-to-hypervisor transitions. The researchers also discuss the impact of hypervisor software design and implementation on overall performance. They propose improvements to the ARM architecture, such as Virtualization Host Extensions (VHE), to bring Type 2 hypervisors' fast transition costs to real application workloads involving I/O. The research is significant as ARM servers are becoming increasingly common, and understanding their virtualization performance is crucial for hardware and software architects.本文探讨了 ARM 虚拟化在服务器硬件上的性能,特别关注多核 ARM 系统,并比较了 ARM 和 x86 平台上两种流行的虚拟机管理程序 KVM 和 Xen。研究表明,与 x86 相比,ARM 可以在虚拟机 (VM) 和 Xen 等 1 类管理程序之间实现更快的转换,但 ARMv8.0 上的 KVM 等 2 类管理程序具有更高的 VM 到管理程序转换开销。研究人员还讨论了虚拟机管理程序软件设计和实施对整体性能的影响。他们提出了对 ARM 架构的改进,例如虚拟化主机扩展 (VHE),以将 Type 2 虚拟机管理程序的快速转换成本引入涉及 I/O 的实际应用程序工作负载。随着 ARM 服务器变得越来越普遍,了解其虚拟化性能对于硬件和软件架构师来说至关重要,因此这项研究具有重要意义。
_2025-08-24_18:03:04_2025-08-24 18:03:04
Boosting Dedicated Instances by KVM Tax Cut - Exitless Timer - Exitless IPI.pdf
TAGs:虚拟化 性能
_2025-03-07_11:09:41_2025-03-07 11:09:41
KVM Latency and Scalability Performance Tuning.pdf
TAGs:虚拟化 性能
_2025-03-07_11:08:51_2025-03-07 11:08:51
KVM性能分析工具-zhurunguang-ChinaUnix博客
原文链接失效了?给我留言
TAGs:虚拟化 性能
Summary: This text is about an announcement on a Chinese tech blog, "ChinaUnix," regarding temporary service disruptions for blogging due to server migration from September 30 to October 4, 2025. The blog post also includes statistics on KVM performance events and their analysis. The blog is written by a user named "zhurunguang" and has 123 articles, 0 blog points, and 11 technical points. The blog's categories include virtualization, Linux commands, MySQL, shell scripts, and KVM performance analysis. The text also includes code snippets for enabling and disabling KVM tracing and analyzing KVM performance data.本文是关于中国科技博客“ChinaUnix”上的公告,该公告涉及 2025 年 9 月 30 日至 10 月 4 日期间由于服务器迁移而导致博客服务临时中断。该博客文章还包括有关 KVM 性能事件及其分析的统计数据。该博客由一位名为“zhurunguang”的用户撰写,有 123 篇文章,0 个博客点,11 个技术点。该博客的类别包括虚拟化、Linux 命令、MySQL、shell 脚本和 KVM 性能分析。该文本还包括用于启用和禁用 KVM 跟踪以及分析 KVM 性能数据的代码片段。
_2025-07-04_15:56:02_2025-07-04 15:56:02
Overcoming Virtualization Overheads for Large-vCPU Virtual Machines.pdf
TAGs:虚拟化 性能
_2025-03-07_10:51:08_2025-03-07 10:51:08
Perf events - KVM
原文链接失效了?给我留言
TAGs:虚拟化 性能
Summary: This page explains how to use the Linux perf tool for counting and tracing performance events in the KVM kernel module. Previously, tools like kvm\_stat and kvm\_trace were used for this purpose, but now standard Linux tracing tools are used instead. The page covers counting and tracing events, recording events for the host and guest, and reporting events. The perf tool can be used to count events using the `perf stat` command, and detailed traces can be generated using ftrace. Events can be recorded to a file for later analysis, and the order of arguments is important when using the perf command. The page also mentions an alternative method of getting the guest's kallsyms and modules using sshfs and the --guestmount option.本页解释了如何使用 Linux perf 工具对 KVM 内核模块中的性能事件进行计数和跟踪。以前,kvm\_stat 和 kvm\_trace 等工具用于此目的,但现在使用标准的 Linux 跟踪工具。该页面涵盖计数和跟踪事件、记录主机和客户机的事件以及报告事件。perf 工具可用于使用 'perf stat' 命令对事件进行计数,并且可以使用 ftrace 生成详细的跟踪。可以将事件记录到文件中以供以后分析,并且在使用 perf 命令时,参数的顺序很重要。该页面还提到了使用 sshfs 和 --guestmount 选项获取客户机的 kallsym 和模块的替代方法。
_2025_1_23_14:14:28_2025_1_23 14:14:28
QEMU:性能分析的故事
原文链接失效了?给我留言
TAGs:虚拟化 性能
saved date: Thu Jan 23 2025 14:14:28 GMT+0800 (中国标准时间)
_2025-07-03_11:47:53_2025-07-03 11:47:53
Speeding up Large Memory VM Boot with QEMU ThreadContext
原文链接失效了?给我留言
TAGs:虚拟化 性能
Summary: This blog post discusses the importance of fast virtual machine (VM) boot times in virtualization environments for efficient resource management and improved user experience. The post explains that VMs are commonly configured with preallocated memory for better performance, but the downside is that it can lead to slow boot times due to the upfront commitment of resources and time required for initialization. The post introduces QEMU's ThreadContext feature, which can be used to optimize memory preallocation and reduce VM boot time. ThreadContext ensures that initialization threads are placed on the same NUMA node as the associated memory region and allows for parallel initialization, leading to significant time savings. The post provides instructions on how to use ThreadContext for memory preallocation in QEMU. The results show a 55% reduction in memory preallocation time compared to the baseline without ThreadContext.这篇博文讨论了在虚拟化环境中快速启动虚拟机 (VM) 对于高效资源管理和改善用户体验的重要性。该博文解释说,VM 通常配置预分配的内存以获得更好的性能,但缺点是,由于初始化所需的资源和时间的前期承诺,这可能会导致启动时间变慢。该博文介绍了 QEMU 的 ThreadContext 功能,该功能可用于优化内存预分配并缩短 VM 启动时间。ThreadContext 确保初始化线程与关联的内存区域位于同一 NUMA 节点上,并允许并行初始化,从而节省大量时间。该博文提供了有关如何在 QEMU 中使用 ThreadContext 进行内存预分配的说明。结果显示,与没有 ThreadContext 的基线相比,内存预分配时间减少了 55%。
_2025-03-14_16:51:19_2025-03-14 16:51:19
Virtualization Tuning and Optimization Guide _ Red Hat Product Documentation
原文链接失效了?给我留言
TAGs:虚拟化 性能
Summary: The Red Hat Enterprise Linux Virtualization Tuning and Optimization Guide focuses on enhancing KVM performance. It offers tips for utilizing KVM features and optimizing host systems and virtualized guests. KVM guests run as Linux processes on the host, with virtual CPUs (vCPUs) handled by the Linux scheduler. Resource allocation and virtual hardware configuration significantly impact guest performance.
_2025-08-24_16:53:35_2025-08-24 16:53:35
kvm performance optimization technologies, part one - para virtualization - Passthrough IPI - Send IPI - TLB Shootdown - sched
原文链接失效了?给我留言
TAGs:虚拟化 性能
Summary:
_2024_12_25_15:25:10_2024_12_25 15:25:10
虚拟化性能评估方法论 - 耀阳居士 - 博客园
原文链接失效了?给我留言
TAGs:虚拟化 性能
saved date: Wed Dec 25 2024 15:25:10 GMT+0800 (中国标准时间)
_2026-03-24_19:26:53_2026-03-24 19:26:53
Accelerate KVM RISC-V when running as a guest [LWN.net]
原文链接失效了?给我留言
TAGs:处理器 risc-v 虚拟化 嵌套虚拟化 性能
Summary: 这篇邮件讨论的是为KVM RISC-V虚拟机管理程序添加嵌套加速支持,以提升其在其他虚拟机管理程序下作为客户机运行时的性能。具体来说,当KVM RISC-V作为客户机在其他虚拟机管理程序(如Xvisor)下运行时,完整的H-extension功能会被主机虚拟机管理程序通过陷阱和模拟方式处理。这种情况下,如果主机虚拟机管理程序提供了SBI嵌套加速(NACL)扩展,KVM RISC-V的性能可以通过使用该扩展来加速。
_2026-03-27_16:07:03_2026-03-27 16:07:03
ARM和X86架构的CPU算力对比-arm和x86架构的cpu算力对比 - phyger - 博客园
原文链接失效了?给我留言
TAGs:测试 性能
Summary: 本文通过sysbench和Unixbench工具,对同等规格的ARM与X86架构云服务器CPU进行算力对比测试。结果显示,ARM在整型计算能力上显著领先X86约2.5倍,而在浮点数计算上ARM算力约为X86的92%。文章简要分析了ARM领先的原因在于其RISC指令集架构。
_2026-03-27_16:06:59_2026-03-27 16:06:59
Linux Benchmark Suite Homepage
原文链接失效了?给我留言
TAGs:测试 性能
Summary: Linux Benchmark Suite是一个开源项目,为Linux系统提供广泛的合成和应用基准测试工具,包括性能测量、调优工具和运行信息。项目包含快速测试、合成基准和应用基准三类工具,如lmbench、UnixBench、TPC-C等,用于评估CPU、内存、网络、磁盘和图形性能。该项目还提供相关资源和技术文档,帮助用户进行系统性能分析和优化。
_2026-03-27_15:43:15_2026-03-27 15:43:15
Sysbench Benchmark - OpenBenchmarking.org
原文链接失效了?给我留言
TAGs:测试 性能
Summary: Sysbench是一个基于LuaJIT的多线程基准测试工具,主要用于评估CPU和内存性能。当前页面提供了Sysbench 1.0.20版本CPU子测试的详细性能数据,涵盖了从高端服务器CPU到主流消费级处理器的广泛结果。数据显示,性能与核心数量呈正相关,双路AMD EPYC 9965(192核)以约143.7万事件/秒的成绩位列榜首。该测试支持SSE2、AVX、AVX2和FMA等指令集,平均运行时间约6分钟,标准偏差为0.2%,表明结果具有较高的稳定性和可重复性。
_2026-03-13_14:39:36_2026-03-13 14:39:36
GitHub - bytedance_kvm-utils · GitHub
原文链接失效了?给我留言
TAGs:虚拟化 kvm 测试 性能
Summary: 字节跳动开源的kvm-utils项目,包含KVM虚拟化调试工具和微基准测试套件。debug模块基于kprobe监控KVM退出原因和WRMSR详情;microbenchmark模块提供IPI延迟、MSR读写、PIO/MMIO和TLB性能基准测试。
_2026-03-19_11:03:54_2026-03-19 11:03:54
IPI中断性能评估 _ Sisyphus
原文链接失效了?给我留言
TAGs:虚拟化 中断虚拟化 IPI 性能
Summary: 本文评估了虚拟机中IPI中断的性能表现,测试显示跨NUMA的IPI中断耗时较高。分析发现主要开销来自HLT指令虚拟化,通过设置idle=poll选项可显著降低延迟,但这会占用物理机CPU资源。文章探讨了halt_poll_ns机制作为性能与资源利用的折中方案。
_2026-03-19_11:07:05_2026-03-19 11:07:05
IPI中断性能评估 _ Sisyphus
原文链接失效了?给我留言
TAGs:虚拟化 中断虚拟化 IPI 性能
Summary: 本文评估了虚拟机中IPI中断的性能表现,测试显示跨NUMA的IPI中断耗时较高。分析发现主要开销来自HLT指令虚拟化,通过设置idle=poll选项可显著降低延迟,但这会占用物理机CPU资源。文章探讨了halt_poll_ns机制作为性能与资源利用的折中方案。
_2026-03-19_11:05:45_2026-03-19 11:05:45
kvm-utils_microbenchmark_ipi-bench at master · bytedance_kvm-utils · GitHub
原文链接失效了?给我留言
TAGs:虚拟化 中断虚拟化 IPI 性能
Summary: 字节跳动kvm-utils项目的IPI性能基准测试模块,用于评估处理器间中断延迟。支持自中断、单CPU间中断、网状中断和全中断四种测试模式,可通过内核模块参数配置源CPU、目标CPU、等待选项和锁机制等测试选项。
_2026-03-10_14:43:51_2026-03-10 14:43:51
Kimi _ Intel、AMD SPECvirt_sc2013 测试对比
原文链接失效了?给我留言
TAGs:虚拟化 性能
Summary: 该网页对比了Intel与AMD在SPECvirt_sc2013虚拟化性能基准测试中的表现。结果显示,AMD EPYC 7702在2019年以5,451分超越Intel Xeon Platinum 8180的3,376分,领先61%。2023年AMD EPYC 9654达到8,336分,Intel Xeon Platinum 8380为4,821分。2024年Intel第五代至强8592+通过软件优化达到9,801分,重新夺回2P性能领先地位。双方在核心密度、内存带宽和软件生态方面各有优势。
_2026-03-27_14:40:26_2026-03-27 14:40:26
LKML_ Yang Zhang_ [RFC PATCH v2 0_7] x86_idle_ add halt poll support
原文链接失效了?给我留言
TAGs:虚拟化 性能
Summary: 这是2017年Linux内核邮件列表(LKML)的一个讨论串,主题是Yang Zhang提交的“x86/idle: add halt poll support”补丁系列(RFC PATCH v2 0/7)。该补丁旨在优化虚拟机内运行延迟敏感型工作负载时的性能,其核心机制是在进入空闲状态前进行轮询,以绕过开销较大的完整空闲路径。邮件中包含详细的基准测试数据,对比了不同轮询阈值下的性能提升,并讨论了与现有空闲方案(如idle=poll、KVM动态轮询)的差异。补丁涉及对x86半虚拟化、调度器空闲路径和内核系统调用的修改。
_2026-03-10_10:24:19_2026-03-10 10:24:19
SPEC virt_sc 2013
原文链接失效了?给我留言
TAGs:虚拟化 性能
Summary: SPEC VIRT_SC 2013是用于测量虚拟化平台性能的基准测试套件,针对硬件厂商、虚拟化软件厂商、数据中心管理者和学术研究人员设计。该基准测试评估数据中心服务器在虚拟化服务器整合场景中的性能表现,支持硬件虚拟化、操作系统虚拟化和硬件。它整合了多个SPEC工作负载,包括SPECweb 2005、SPECjAppServer 2004、SPECmail 2008和SPECint 2006的修改版本,通过运行称为'tiles'的虚拟机集合实现扩展,所有虚拟机必须满足服务质量标准。基准测试还包括测量功耗和性能/功耗关系的选项,最新版本为V1.1,包含安全协议更新和错误修复。
_2026-03-10_14:34:22_2026-03-10 14:34:22
国产“芯+云”性能再破全球记录!
原文链接失效了?给我留言
TAGs:虚拟化 性能
Summary: 海光C86处理器在SPECvirt_sc2013测试中取得3782分优异成绩,登顶国产虚拟化软件性能榜首。该测试是业界公认的云数据中心虚拟化性能权威标准。基于海光C86的InCloud Sphere单核虚拟机密度达2.1VM/核,性能远超同类产品,标志着国产芯片虚拟化与云平台性能达到全球一线水准。