如何優化AMD EPYC處理器以應對高負載工作

要獲得AMD EPYC伺服器的最佳速度,您必須在每個步驟都調整AMD EPYC設定。首先,調整BIOS選項,如NUMA節點設定、SMT和電源模式。使用作業系統工具來控制CPU速度和記憶體混合。確保每個更改都適合您的工作負載。例如,V-Ray 6在AMD EPYC CPU上的運行速度可以提高2.3倍。像Ansys LS-DYNA這樣的模擬工作可以快1.63倍。AMD EPYC 9005系列可以將CPU提升至5.0 GHz,記憶體速度達到576 GB/s,以獲得最佳結果。查看下表,了解調校AMD EPYC如何幫助不同工作加速。
基準測試/應用程式 | 效能指標/結果 | 工作負載/產業重點 |
---|---|---|
V-Ray 6渲染 | 比競爭對手快至2.3倍 | 媒體和娛樂(渲染) |
Ansys LS-DYNA®有限元分析 | 上市時間加速1.63倍 | 製造業、產品設計(模擬) |
AMD EPYC 9005系列特性 | CPU提升至5.0 GHz、576 GB/s記憶體頻寬、全寬AVX-512 | 運算密集型和記憶體密集型工作負載 |
您應該為每個處理器、系統和工作調整AMD EPYC設定。注意CPU、記憶體、NUMA和虛擬化設定。良好的調校確保您的工作以最快的速度運行。
要點總結
將BIOS設定更改為最大效能模式。開啟所有CPU核心。對需要大量記憶體的工作使用NPS2或NPS4。這有助於AMD EPYC運行更快。
將作業系統設定為使用效能模式來控制CPU頻率。填滿所有記憶體通道。這讓資料傳輸更快。
使用NUMA調校和CPU-記憶體綁定。這保持資料靠近處理器。它減少等待時間並使工作運行更快。
啟用AMD安全記憶體加密等安全功能。您無需擔心系統速度變慢。
使用AMD uProf和Omnitrace等工具經常檢查效能。記錄您所做的所有更改。這有助於保持系統的高速運行。
識別工作負載和目標
工作負載類型
在調校系統之前,您應該了解您的工作負載。每種工作負載都以其特有的方式使用AMD EPYC處理器。有些工作負載會讓CPU非常繁忙。這些CPU密集型工作負載包括3D渲染、科學運算和AI訓練。其他工作需要大量記憶體。大型資料庫和分析工作需要快速記憶體和低延遲。有些工作主要使用I/O,如儲存伺服器或網路裝置。這些工作需要快速的PCIe通道和良好的NUMA支援。
AMD EPYC 9004系列和AMD EPYC 7003系列擁有眾多核心和執行緒。您可以利用這些來優化多種工作負載。正確的調校可以幫助您的系統適應工作負載。您還應該檢查處理器如何使用NUMA。良好的NUMA調校讓每個CPU核心都能快速存取記憶體。這對AMD EPYC 9004系列和AMD EPYC 7003系列都很重要。
效能指標
您需要監控正確的指標來檢查效能。每種工作負載類型需要不同的指標。對於CPU密集型工作負載,檢查多執行緒的工作效果。AMD EPYC 9004系列可以有84個核心和168個執行緒。這讓您可以同時運行多個作業。對於記憶體密集型工作負載,關注記憶體通道和頻寬。AMD EPYC 9004系列有12個DDR5-4800通道。這為資料傳輸提供了快速記憶體。
對於I/O工作負載,PCIe通道和版本很重要。AMD EPYC 9004系列有128個PCIe 5.0通道。這有助於快速儲存和網路卡。您還應該關注快取大小。像AMD EPYC 9004系列中的384 MB L3快取這樣的大快取可以使記憶體更快。功率效率也很重要。您希望系統每瓦特完成更多工作。
這裡有一個表格幫助您將指標與工作負載匹配:
效能指標 | 描述/與工作負載類型的相關性 | 範例值/註釋 |
---|---|---|
多執行緒效能 | 對運算密集型工作負載至關重要;透過核心/執行緒數和多執行緒基準排名衡量 | 84核心/168執行緒;多執行緒效能排名第17 |
記憶體通道和頻寬 | 對記憶體密集型工作負載至關重要;記憶體通道數量和速度影響處理量 | 12個DDR5-4800記憶體通道 |
快取大小 | 對降低運算和記憶體任務的延遲很重要 | 384 MB L3快取 |
PCIe通道和版本 | 對I/O密集型工作負載至關重要;影響儲存和網路的連接性和處理量 | 128條PCIe 5.0通道 |
功率效率 | 每瓦效能表示所有工作負載的能源效率 | 每瓦效能標準化為1.00 |
工作負載特定處理量 | AI/ML推論和訓練每秒樣本數展示實際運算和記憶體效能 | ResNet-50: 1283.7樣本/秒; BERT-Base: 358.9樣本/秒 |
提示:始終將您的調校和效能檢查與工作負載相匹配。這有助於您從AMD EPYC處理器和系統中獲得最佳結果。
調整AMD EPYC設定
要使AMD EPYC發揮最佳效能,您需要檢查BIOS/UEFI和作業系統設定。每個更改都可以幫助您的系統運行得更快並減少能耗。無論您使用AMD EPYC 9004系列還是AMD EPYC 7003系列,為您的工作選擇正確的設定都很重要。始終根據您的處理器、系統和目標來匹配您的設定。
BIOS/UEFI調校
您首先要進入BIOS或UEFI選單。在這裡,您可以更改控制AMD EPYC工作方式的設定。AMD EPYC 9004系列和AMD EPYC 7003系列都有很多選項。下表顯示了獲得最高速度的最佳設定:
設定類別 | 最大效能建議設定 |
---|---|
運行模式 | 最大效能 |
確定性滑桿 | 功率 |
核心效能提升 | 啟用 |
cTDP(可配置TDP) | CPU支援的最大值 |
封裝功率限制 | CPU支援的最大值 |
效率模式 | 停用 |
每個插槽的NUMA節點(NPS) | 對NUMA優化的工作負載使用NPS2或NPS4 |
SMT模式 | 啟用(僅對某些HPC工作負載停用) |
硬體預取器 | 可選擇停用以獲得最大效率 |
ACPI SRAT L3快取作為NUMA | 啟用 |
PCIe Gen速度 | 支援的最大速度 |
啟用的CPU核心數 | 所有核心啟用 |
CPPC | 啟用 |
BoostFmax | 自動 |
作業系統調校
作業系統設定也會影響AMD EPYC的效能。無論您使用Linux還是Windows,都要確保這些設定正確。以下是一些重要的調校建議:
作業系統 | 設定 | 建議值 |
---|---|---|
Linux | CPU頻率調控器 | 效能模式 |
Linux | NUMA平衡 | 根據工作負載啟用或停用 |
Linux | 透明大頁面 | 始終 |
Windows | 電源計畫 | 高效能 |
Windows | 處理器效能核心停放 | 停用 |
Windows | NUMA群組大小優化 | 大型記憶體頁面 |
記憶體和NUMA調校
AMD EPYC處理器的記憶體和NUMA設定非常重要。良好的設定可以減少延遲並提高速度。以下是一些關鍵建議:
填滿所有記憶體通道以獲得最大頻寬
使用同樣大小和速度的記憶體模組
對需要大量記憶體的工作使用NPS2或NPS4
確保工作負載在正確的NUMA節點上運行
考慮使用記憶體交錯以提高效能
效能監控和優化
調校後,您需要監控系統效能。這可以幫助您確保更改產生了預期的結果。它還可以幫助您發現需要改進的地方。以下是一些有用的工具和指標:
監控工具
工具名稱 | 用途 | 主要功能 |
---|---|---|
AMD uProf | CPU和系統分析 | 效能計數器、能源監控、熱監控 |
Omnitrace | 應用程式追蹤 | 程式碼分析、效能瓶頸識別 |
perf (Linux) | 系統效能分析 | 硬體計數器、事件追蹤 |
Windows效能監視器 | 系統監控 | CPU、記憶體、磁碟使用率追蹤 |
關鍵效能指標(KPI)
監控這些指標以確保您的系統運行良好:
CPU使用率和頻率
記憶體頻寬和延遲
NUMA本地訪問率
快取命中率
能源效率
工作負載特定指標(如每秒處理的事務數)
持續優化
持續優化是保持高效能的關鍵。以下是一些最佳實踐:
定期檢查系統效能
記錄所有設定更改
測試新的BIOS和作業系統更新
根據工作負載變化調整設定
保持與AMD和系統供應商的最新建議同步
常見問題解答
如何知道我的AMD EPYC設定是否正確?
使用AMD uProf或其他監控工具檢查CPU使用率、頻率和溫度。比較您的效能指標與預期值。確保所有核心都在運行,並且記憶體頻寬接近理論最大值。
我應該停用SMT嗎?
這取決於您的工作負載。大多數應用程式在啟用SMT時效能更好。但某些HPC工作負載可能在停用SMT時效能更好。測試兩種設定以確定哪個更適合您的情況。
為什麼NUMA設定很重要?
NUMA設定影響CPU如何訪問記憶體。正確的設定可以減少延遲並提高效能。錯誤的設定會導致遠端記憶體訪問,降低效能。
如何優化功耗效率?
使用正確的功率限制設定,啟用效能提升,並確保適當的冷卻。監控溫度和功耗。在不影響必要效能的情況下,考慮使用節能特性。
結論
優化AMD EPYC處理器需要仔細的規劃和持續的關注。透過正確的BIOS設定、作業系統調校和監控,您可以獲得出色的效能。記住:
了解您的工作負載需求
選擇適當的設定
定期監控和調整
保持系統更新
遵循這些建議,您可以確保您的AMD EPYC系統發揮最大潛能。