區塊鏈的“生物鐘”長啥樣?
“時間”是歲月更迭中的永恆話題。圍繞時間的探討一直在區塊鏈以及其他分佈式系統中進行。時間連接起進程與節點,我們也用時間的“粒度”來衡量連塊成鏈的去中心化網絡。
分佈式系統中關於時間的難題在於,不同參與者的“物理時鐘”很難達成完全一致。分佈式系統大師Lamport提供了去中心化的方法,將問題轉化為時間與順序的聯繫,提出了邏輯時鐘的概念,就像為包括區塊鏈在內的分佈式系統引入了“生物鐘”。
stakefish編譯Vac分析師、ENS開發者Dean Eigenmann的一篇文章,介紹Lamport關於時間、時鐘和順序的論述,為大家提示理解區塊鍊和分佈式系統時間另一個角度。
關於分佈式系統的系列文章,用哪個話題開篇比較合適呢?以太坊的隱私交易協議AZTEC?以難以掌握著稱的Paxos算法?這些話題還是留在以後寫。今天,我選了一個基礎話題作為開篇:分佈式系統的時間話題。
本文解讀的是圖靈獎得主、計算機大師Leslie Lamport的知名論文《分佈式系統內的時間、時鐘和事件順序(Time, clocks, and the ordering of events in a distributed system)》。很久之後重讀這篇文章並提煉關鍵概念,另有一番趣味。
不熟悉Leslie Lamport的朋友可以大概了解一下,他以創造LaTeX、TLA+、Paxos而聞名,還論述了拜占庭將軍問題。當然還有Lamport時鐘(第一個邏輯時鐘),在本文中我們也將對其基本概念進行介紹。
先來看看分佈式系統的定義。 Lamport給出的定義是這樣的:
“如果一個系統內信息傳遞的延遲,與單一進程裡的事件間隔的時間相比是不能忽略不計的,則稱之為分佈式系統。”
我喜歡這個定義,因為其專注在發出和收取消息之間的延遲上。
二級標題
二級標題
為事件排序在本地再簡單不過了。你只需在發生的時候為每一個事件賦予一個時間戳就好了。我們能夠獲得所有事件的總體順序,也就意味著,所有事件都能夠按照特定順序排列。
但這個問題在分佈式系統的情境下就困難多了。為什麼呢?
一切皆因分佈式系統的一個非常簡單的性質:在節點之間傳遞的消息在發出之後,在未來的任何時間點都可能到達0次、1次或多次。這樣的話,分佈式系統的各個節點之間就不能就時間達成一致。舉例來說:
一個節點可以向另一個節點發送一條消息標註當前時間是12:00:00,但是接收者不知道消息用了多長時間傳遞,也就沒辦法確認到達時是否仍為12:00:00。如果這樣,節點之間來來回回傳一整天消息也無法確定信息是否同步。如果不能在時間上達成一致,我們也就不能在事件順序上達成共識。
那怎麼解決這個問題?
在分佈式系統內,多個節點通過互相發送信息進行交流。節點收到信息首先確認這個信息,然後執行他的下一個事件。這樣的順序,本來就顯示了一種“因果關係”:信息必須先被發出,才能被收到。
譯註:這種因果關係是一種時序關係,不是邏輯上的原因和結果的關係。
那麼根據因果關係就能得出順序:發消息肯定在被他被接收之前。單看A、B兩個事件,我們就能給出“發生在……之前(happens before)”的關係來描述順序了。
現在,無需系統物理時間概念就可以識別這種關係:如果A對B造成了因果影響,事件A肯定發生在事件B之前。因果關係讓我們確定係統中相關事件的順序,是一種偏序(partial order)。
二級標題
二級標題
不過既然我們已經有了偏序,接下來把時鐘添加到系統中,就能獲取系統中的所有事件的總序(total order)。
正文
正文
∀a,b a → b ⟹ C(a) < C(b)
以上表達式代表什麼意思呢?
箭頭“→”表示“發生在……之前(happened before)”,而C代表時鐘函數,可簡單的理解為時間。所以要表達意思就是:對於每一個事件a,b,如果a發生在b之前,那麼a的時間要小於b的時間。
但反推不成立,僅因為一個事件的時間比另一個事件的時間小,並不能說這個事件發生在前,他們可以是並發的。
在上面的圖片中,我們可以看到節點α上,時間1和時間2各發生了1個事件;節點β在自己的時間1發生了1個事件。在節點α的時間1和時間2發生的事件,與在節點β的時間1發生的事件是並發的,沒有因果聯繫。
如果a和b是單個節點上的兩個事件,且a發生在b之前,則a的時間應該小於b的時間。
如果a是一個發送消息的節點,b是另一收到消息的節點,那麼a的時間仍然應該小於b的時間。
用例
用例
用例
最後我們設置一個狀態機來看看邏輯時鐘的用法。比如我們有一個分佈式系統,多個節點都想訪問其中的共享資源,每次只能訪問一個節點。狀態機需要滿足以下條件:
條件1:可以訪問資源的節點必須先釋放資源,然後其他節點才能訪問他。
條件2:對資源的請求必須按照發出請求的順序被授予訪問權。
條件3:如果每個被授予訪問權的節點最終都釋放了資源,那麼每個請求最終都會被授權。
為什麼不引入一個中間協調者呢?因為這樣的話,如果發生較早的請求卻較晚到達,就不能滿足條件2了;另一個原因是,我們希望採取去中心化的解決方案。
所以我們還是要構建條件,滿足這個邏輯時鐘。如何滿足條件呢?
Lamport為我們提供了一個去中心化解決方案。首先,我們要讓所有節點儲存一個請求隊列。其次,要滿足一些簡單的假設:
假設1:所有消息都按發送的順序接收。
假設2:所有消息最終都被接收。
假設3:每個節點都可以直接向系統中的所有其他節點發送消息。
如果有更複雜的算法和協議,可以忽略以上假設。
現在我們可以定義滿足這3個條件的算法,並在實踐中展示時鐘的功能:
1、如果一個節點想要請求一個資源,他會用當前時間創建一個請求,將他添加到他的隊列中,並將他發送給其他每個節點。
2、所有其他節點將這個請求放入他們的隊列中並發迴響應消息。
3、釋放資源的節點發送帶有當前時間的釋放消息,並從其隊列中刪除原來的請求。
4、當節點收到釋放的消息時,他將從自己的隊列中清除相關請求。
5、當一個節點在他的隊列中有自己的排在任何其他請求之前請求時(按照時間總序),他可以自由地訪問該資源,並且他在該時間之後從所有其他節點接收到消息。
上述算法是完全由各個節點獨立執行的去中心化算法,他利用時鐘來對請求按總序進行排序,從而實現對資源的訪問和節點間的協調。
好啦,我們通過文章大概了解到如何使用這些邏輯時鐘對分佈式系統中的事件進行排序,並分析了分佈式系統訪問資源時確定順序的實際應用問題。歡迎大家的意見反饋,我將繼續更新更多關於分佈式系統的文章。
原文標題:Time, clocks, and order
正文
正文


