微軟開搶年收入上億美元的 Redis 飯碗？開源效能遙遙領先的 Garnet：無需修改，Redis 用戶端可直接接入

Redis 和 Dragonfly 該有危機感了！

微軟開源全新快取儲存系統 Garnet

近日，微軟正式開源快取儲存系統 Garnet。據微軟研究院資料庫小組高級首席研究員 Badrish Chandramouli 介紹，Garnet 專案是從零開始構建而成，且以效能為核心考量（特別是在吞吐量中的執行緒可擴展性與更高比例的低延遲水準）。

具體來說，Garnet 具有以下幾大優勢：

Garnet 採用流行的 RESP 線路協定作為起點，因此大多數用戶可以不作任何修改、就直接透過大多數程式語言撰寫的 Redis 用戶端直接接入 Garnet。
Garnet 透過多條用戶端連接與小批量形式提供更好的可擴展性與吞吐量，幫助大型應用程式與服務節約運行成本。
Garnet 在第 99 及第 99.9 百分位上表現出更好的用戶端延遲水準，更高比例的穩定性表現對於現實場景而言至關重要。
Garnet 基於最新 .NET 技術，具有跨平台、可擴展和現代化等特點。它在設計上易於開發與調整，且不致犧牲常見場景下的效能水準。透過利用 .NET 豐富的函式庫生態來擴展其 API，並提供開放的優化機會。憑藉對 .NET 的充分發掘，Garnet 在 Linux 和 Windows 平台上均表現出頂尖效能。

據了解，微軟研究院自 2016 年以來一直在研究現代鍵-值資料庫架構。2018 年，微軟將一套嵌入式鍵-值庫 FASTER 開源之後，其效能超出原有系統幾個數量級，同時專注於簡單的單節點行程內鍵-值模型。

從 2021 年開始，根據實際用例的需求，微軟開始構建一套新的遠端快取儲存方案。其中包含一切必要功能，以作為現有快取儲存的可行替代選項。當時微軟面臨的挑戰包括保持/增強其在早期工作中已經取得的效能優勢，同時考慮如何更好地適應更加現實的普遍網路環境。這項工作的成果就是 Garnet。

在被問及 Garnet 適合部署在哪些場景下時，Chandramouli 表示任何「使用 Redis、KeyDB 或者 Dragonfly 作為快取儲存方案的現有應用程式都適合，Garnet 能提供更高的吞吐量、更低延遲、透過減少需要託管的快取儲存分片來降低成本，還可將資料溢出至本地磁碟或 SSD 以快取超過記憶體大小的資料。此外，Garnet 也適合各種希望藉極高效能快取層提高效能、降低後端儲存伺服器或資料庫成本的新型應用程式。」

API 功能方面，Garnet 支援廣泛的 API，包括原始字串、分析與物件操作。它還提供分片、複製及動態金鑰遷移等功能的叢集模式。Garnet 支援用戶端 RESP 交易及用 C# 撰寫的伺服器端儲存程序，還允許用戶在原始字串及新型別之上設定自訂操作。所有這些均可簡單使用 C# 撰寫，因此自訂擴展的開發門檻更低。

網路、儲存、叢集功能方面，Garnet 使用快速且可插拔的網路層，且支援後續擴展，例如配合核心旁路堆疊。它支援傳輸層安全（TLS）通訊協定和各種基本存取控制。Garnet 的儲存層被稱為 Tsavorite，是從 OSS FASTER 中分叉而成，可提供一系列強大的資料庫功能，例如執行緒可擴展性、分層儲存支援（記憶體、SSD 和雲端儲存等）、快速非阻塞檢查點、復原、持久操作日誌記錄、多鍵交易支援，以及更好的內在管理與重用功能等。此外，Garnet 還支援叢集操作模式。

除了單節點執行之外，Garnet 還支援叢集模式，允許用戶建立並管理分片和複製部署。Garnet 還支援高效、動態的金鑰遷移方案，藉此重新均衡各個分片。用戶可以使用標準的 Redis 叢集命令來建立並管理 Garnet 叢集，各節點則執行 gossip 以共享並演進叢集狀態。總的來說，Garnet 的叢集模式是一項龐大且仍在發展的功能，微軟表示，更多細節將在後續文章中與大家分享。

Chandramouli 在回覆 The Stack 的郵件中補充道，「我們也期待大家能將 Garnet 在各類其他現實應用中的表現回饋回來。此外，我們還擁有一套基於 C# 的強大儲存程序模型，用戶可以藉此對關注的交易進行自訂。最後，我們將 Garnet 視為面向未來的重要創新工具，包括最佳化磁碟 IO、核心旁路網路以及向量資料庫等應用場景。」

Garnet 有什麼亮點？

雲端和邊緣運算的快速增長讓相關應用程式和服務在資料和覆蓋範圍上均有顯著提升。但與此同時，它們也在資料存取、更新與轉換層面提出了效率更高、延遲更低、成本更廉的實際要求。這些應用程式與服務往往需要在儲存互動方面投入大量營運支出，這也使其成為當今最昂貴、最具挑戰性的平台領域之一。以單獨可擴展的遠端行程形式存在的快取儲存軟體層，能夠有效降低這些成本並提高應用程式效能。這也推動了快取儲存行業的發展，包括許多大家耳熟能詳的開源系統，例如 Redis、Memcached、KeyDB 以及 Dragonfly。

與僅支援簡單取得/設定介面的傳統遠端快取儲存不同，現代快取需要提供豐富的 API 與功能集。它們支援原始字串、Hyperloglog 等分析資料結構，以及排序集和雜湊等複雜資料型態。它們還須允許用戶為快取設定檢查點和復原功能、建立資料分片、維護複製副本並支援交易與自訂擴展。

然而，現有系統在保持系統設計簡單性的同時，往往難以滿足如此豐富的功能需求，包括導致其無法充分利用最新硬體功能（例如多核心、分層儲存、快速網路）。此外，其中許多系統在設計之初，也沒有考慮到可由應用程式開發者輕鬆擴展、或者在不同平台/作業系統上良好運行等現實需求。

根據介紹，Garnet 在設計上重新考量了整個快取儲存堆疊——從網路處取得資料封包、到解析和處理資料庫操作、再到執行儲存互動。

下圖為 Garnet 的整體架構，可以看到，Garnet 的網路層繼承了微軟受 ShadowFax 研究啟發所建立的共享記憶體設計。TLS 處理與儲存互動在 IO 完成執行緒上執行，這就避免了常見的執行緒切換開銷。這種方法能夠藉 CPU 快取一致性將資料傳輸至網路，而非基於需要在伺服器上移動資料的傳統 shuffle 設計。

Garnet專案整體架構

Garnet 的儲存設計由兩套 Tsavorite 鍵-值儲存組成，二者與統一的操作日誌進行綁定。前一套儲存被稱為「主儲存」，針對原始字串操作進行了最佳化，負責管理記憶體以避免垃圾收集。第二套則為可選的「物件儲存」，主要針對複雜物件及自訂資料型態進行最佳化，具體涵蓋排序集、集、雜湊、列表和地理空間等流行資料型態。它們被儲存在記憶體堆上（以保證更新更加高效），並以序列化形式存放在磁碟內。未來，微軟還將研究如何透過統一的索引與日誌簡化 Garnet 的系統維護。

Garnet 設計中的一大顯著特點，就是採用了 Tsavorite 儲存 API。該 API 用於提供更大、更豐富且可擴展的 RESP API 表面，能夠執行讀取、更新插入、刪除以及原子讀取-修改-寫入等操作，且全部透過 Garnet 的非同步回呼實現以便在每項操作期間的多個點上插入邏輯。儲存 API 模型還確保 Garnet 能夠將對問題的解析與查詢處理，同並發、儲存分層和檢查點等其他儲存功能徹底分開。

此外，Garnet 還進一步增加了對基於雙階段鎖定的多鍵交易的支持。用戶可以使用 RESP 用戶端交易（MULTI-EXEC）或使用 C# 中的伺服器端交易儲存程序。

效能表現

微軟研究團隊透過展示比較了 Garnet 與其他領先開源快取儲存方案間的關鍵效能指標。

首先，團隊預先配置了兩套運行 Linux 系統（Ubuntu 20.04）的 Azure 標準 F72s v2 虛擬機器（每虛擬機器 72 個 vCPU 加 144 GiB 記憶體），且啟用了加速 TCP。其中一套虛擬機器運行各種快取儲存伺服器，另一套則專門發布工作負載。這裡微軟使用自己的基準測試工具 Resp.benchmark，統一由它給出效能測試結果。

微軟將 Garnet 與最新開源版本的 Redis（v7.2）、KeyDB（v6.3.4）以及 Dragonfly（v6.2.11）進行了比較。在實驗中，微軟使用了均勻隨機分布的金鑰（Garnet 的共享記憶體設計對於非隨機分布的金鑰具有更好的效能最佳化效果）。在這些實驗中，資料會被預先載入至每台伺服器上，再嵌入記憶體中。

實驗一：不同數量用戶端會話的吞吐量比較

從大量 GET 操作（每批 4096 條請求）加低負載（8 位元組鍵與值）起步，嘗試最大限度減少網路開銷，並逐步增加用戶端會話數量以比較系統效能。從下圖中可以看到，Garnet 表現出的可擴展性超越了 Redis 與 KeyDB，同時實現了比所有三大基線系統更高的吞吐量（y 軸取對數座標）。請注意，雖然 Dragonfly 的擴展效能與 Garnet 類似，但前者屬於純記憶體內系統。此外，當資料庫大小（即預載入的金鑰數量）明顯超過處理器的快取大小時（2.56 億個金鑰），Garnet 相較於其他系統仍擁有強勁的吞吐量表現。

資料庫大小為（a）1024 個金鑰及（b）2.56 億個金鑰時，不同數量用戶端會話對應的吞吐量（對數座標）。

實驗二：不同批量大小的吞吐量比較

接下來，使用 GET 操作加固定數量（64）的用戶端會話來改變批量大小。跟之前的實驗一樣，繼續嘗試兩種不同的資料庫大小。如下圖所示，即使不採用分批處理，Garnet 的效能同樣表現更好；而在採用分批處理後，即使批量規模很小，Garnet 的效能優勢也在增強。負載大小與實驗一相同，且 y 軸同樣取對數座標。

資料庫大小為（a）1024 個金鑰及（b）2.56 億個金鑰時，不同批量大小下的吞吐量比較（取對數座標）。

實驗三：不同數量用戶端會話的延遲比較

接下來測試的是各種系統的用戶端延遲。如下圖所示，隨著用戶端會話數量增加，與其他系統相比，Garnet 在各個百分位上的延遲（以微秒為單位）均更低也更加穩定。實驗中，以 GET 操作占 80%、SET 操作占 20% 的混合比例發送操作，且不做分批處理。

不同用戶端會話數量時，（a）中位數、（b）第 99 百分位與（c）第 99.9 百分位處的延遲水準。

實驗四：不同批量大小的延遲比較

Garnet 的延遲水準針對適應用戶端的批量與查詢系統進行了最佳化。微軟將批量大小從 1 增加到 64，並在下圖中整理出具有 128 個活動用戶端連接時不同百分位上的延遲水準。從下圖中可以看到，Garnet 的延遲整體較低。與之前的實驗一樣，同樣採用 GET 操作占 80%、SET 操作占 20% 的混合比例。

不同批量大小下，（a）中位數、（b）第 99 百分位以及（c）第 99.9 百分位上的延遲水準。

開發者：Redis 需要進行重大效能最佳化了！

從基準效能圖表來看，GET 命令的吞吐量超過了 Dragonfly 十倍以上。雖然第 50 百分位的延遲水準略高於 Dragonfly，但第 99 百分位上的延遲卻比 Dragonfly 更低。Garnet 和 Dragonfly 在吞吐量和延遲上的表現均遠遠優於 Redis，不少開發者認為，這表明 Redis 可能需要進行重大效能最佳化。

開發者 hipadev23 表示，「Garnet 確實是首個在低並發與高並發水平上均優於 Redis 的替代方案，這是一項很了不起的成就。」「Redis 可能需要進行重大效能最佳化。」

開發者 mtmk 認為，對於需要直接在微軟 Windows Server 上運行 Redis（或者相容），但又不想依賴於 WSL2 的朋友們來說，Garnet 的出現肯定是個好消息。以往由 Redis 連接埠（現處於歸檔狀態）造成的記憶體使用問題（主要是由於記憶體映射檔案 AFAIK）將不復存在。

也有不少開發者仍舊堅定地選擇 Redis。Redis 在某些方面對開發者更友好，而且運行時間更長更穩定。對於 Garnet，大家在授權協議、產品定價、更新維護等方面普遍較為擔心。throwaway38375 表示，「Redis 在授權協議或者產品定價方面應該會更穩定，而且它畢竟經歷了數十億小時的生產運行考驗。Redis 也更容易安裝和理解。」Someone 認為，「對於這樣一個微軟研究院推出的專案，我最擔心的不是授權協議和產品定價，而是缺乏更新（功能、維護甚至是安全更新）」。

By the way：Garnet 是用 C# 開發的

在社群討論中，不少開發者驚訝於 Garnet 專案居然是用 C# 開發的。

開發者 west0n 表示：「最讓我驚訝的是，Garnet 專案居然是用 C# 開發的，而 Dragonfly 是用 C++ 開發的，Redis 則是用 C 開發的。」開發者 whimsicalism 更是直言「太意外了，垃圾收集語言 C# 撰寫的 Garnet 居然擊敗了 Redis 和 Dragonfly。」

也有開發者對此給出的評價較為中肯，pjmlp 認為「垃圾收集語言跟垃圾收集語言可不一樣，像 C# 和 .NET 這些語言其實提供了跟 C++ 相當的所有效能調校選項。」他表示，大家該做的是認真學習，而不是把所有垃圾收集語言都歸為一類，再一棒子打死。【站長註：.NET 是一個平台，C# 是 .NET 的一個實現，C# 與 .NET 類比 Java 與 JDK】

此外，更具體地講，MSIL 和 .NET 在設計上也能支援 C++，而 C# 和 F# 等語言也有辦法存取這些功能。即使某些功能未在語言語法層面公開，開發者也可以直接使用 C++/CLI 產生的 MSIL。

對此，你怎麼看呢？歡迎在評論區留下你的觀點。

參考連結：

https://www.microsoft.com/en-us/research/blog/introducing-garnet-an-open-source-next-generation-faster-cache-store-for-accelerating-applications-and-services/

https://www.thestack.technology/microsoft-takes-on-redis-with-new-open-source-garnet-cache-store/

https://news.ycombinator.com/item?id=39752504

微軟開搶年收入上億美元的 Redis 飯碗？開源效能遙遙領先的 Garnet：無需修改，Redis 用戶端可直接接入

微軟開源全新快取儲存系統 Garnet

Garnet 有什麼亮點？

效能表現

實驗一：不同數量用戶端會話的吞吐量比較

實驗二：不同批量大小的吞吐量比較

實驗三：不同數量用戶端會話的延遲比較

實驗四：不同批量大小的延遲比較

開發者：Redis 需要進行重大效能最佳化了！

By the way：Garnet 是用 C# 開發的

延伸閱讀

.NET Core 簡單且高級的庫 csredis

各版本作業系統對.NET支援情況（250707更新）

.NET跨平台本地庫引入實戰

AI重構Razor Pages網站完成