高速檔案傳輸簡史(1971 — 2025)
FTP 今年滿 54 歲了。從 RFC 114 一路演進到跑在 Cloudflare 邊緣節點上、基於 UDP 的壅塞控制——這段故事比多數人想像的更短、更詭異,也更可重現。
多數「高速檔案傳輸」的行銷文案,把這項技術講得彷彿昨天才誕生。其實不是。最根本的洞察——TCP 在 long-fat 網路上是錯誤工具、自訂可靠性的 UDP 才是對的——過去四分之一個世紀以來,差不多每隔五年就被獨立地重新發現一次。以下是我們一路走來的精簡版。
1971 — FTP(RFC 114)
Abhay Bhushan 在 1971 年 4 月 16 日 發表 RFC 114。當時 ARPANET 只有 23 台主機。TCP 還不存在——它要再過六年才會被定義出來。FTP 是基於「機器都在同一個房間,至少同一棟樓,延遲可預測」的假設而設計。
這個協定在它所存在的那個世界裡運作良好。但它也烙印下兩個日後會老化得不漂亮的架構決策:每傳一個檔案都新開一條控制 + 資料連線,以及底層採同步請求—回應的模型。
1995–2001 — TCP 開始面對長距離問題
到 1990 年代中期,公共網際網路已經全球化,頻寬與延遲之間的不對稱開始在各處浮現。RFC 1323(1992)導入 TCP 視窗縮放(window scaling),把接收視窗推過 64 KB。SACK 在 RFC 2018(1996)正式上線。HTTP/1.1 在 1999 年導入持久連線。
這些都是實打實的勝利。但它們也都是在「繞過」TCP 的停等本質,而不是取代它。吞吐量公式 window_size / RTT 依舊成立——你可以把分子放大,但你沒辦法讓那段等待消失。
2001–2003 — UDP 的轉向
決定性的轉變發生在短短三年的時間窗內,三組獨立作業的團隊不約而同抵達了同一個架構性答案。
2001:UDT。 顧雲鴻啟動 UDP-based Data Transfer 專案。在 2003 年 10 月,NCDM 用它把資料從芝加哥推到阿姆斯特丹,達到 6.8 Gbps——這個數字過去被認為只有專用硬體做得到。UDT 後來成了高能物理界大量檔案搬移的基礎。
約 2003:FASP。 Michelle Munson 與 Serban Simu 發明了 Fast and Secure Protocol,把它產品化為 Aspera,並在廣播與後製工作流程中證明這個模型。IBM 於 2014 年收購 Aspera;FASP 在接下來十年成了企業級媒體傳輸的黃金標準。
同一時期:GridFTP。 Globus 把 FTP 本身擴充成支援並行 TCP 串流與部分檔案續傳。它仍是基於 TCP,但它是那個過渡性協定,在大家全面遷移到 UDP 之前先證明了「並行就是大部分的勝因」。
三個名字,一個架構:跳過「先 ack 再送」的舞步、把壅塞控制搬到 userspace 自己跑、接受一些封包遺失作為飽和的代價。
約 2013 年 — Facebook 把 WDT 開源
差不多在 QUIC 開始出貨的同一個時間窗,Facebook 悄悄把 Warp Speed Data Transfer(WDT)放上 GitHub。它不是產品——只是他們基礎架構團隊用來在公司內部主機之間搬資料集的 C++ 函式庫,外面隨手釘了個 CLI 給測試用。文件裡那個拿來宣傳的數字:單一 WDT 工作階段就能把 40 Gbit/s 的網卡塞滿。
WDT 的勝利仍然是來自並行性——很多條 TCP 串流,而不是一條 UDP 串流——但結論跟 UDT、FASP 十年前得出的一模一樣:在 long-fat 連線上,單一序列連線是錯誤的抽象,解法就是把它拆開。到了 2013 年,這個教訓已經被檔案傳輸新創、IETF,以及各大超大規模業者各自獨立重新發現過了。至於我們欠 Facebook 的命名債——我們承認,這還滿明顯的。
2013 — QUIC
Google 在 2013 年開始把 QUIC 推上 Chrome。最初目標是 web 延遲——TLS 1.3 + 傳輸在一個來回內搞定——但這套設計最終驗證了「UDP 加 userspace 可靠性」這個模型對於通用網際網路流量同樣有效。
IETF 在 2016 年接手。QUIC 於 2021 年以 RFC 9000 的身分發表。等到 HTTP/3 廣泛部署的時候,「重要流量不應該跑在 TCP 上」這個想法,已經從學術界邊緣立場變成 Google、Cloudflare、Meta 以及多數 CDN 的預設值。
純就檔案傳輸而言,QUIC 並沒有取代 FASP 那一類產品——它的連線模型與流量控制是針對 HTTP 型工作負載調校的,不是針對多 GB 的持續串流。但它確實摧毀了「UDP 是給遊戲跟 VOIP 用的」這個文化論述。一旦 HTTP/3 跑在它上面,沒人能再說 UDP 傳輸還在實驗階段了。
2018–2024 — 頻寬控制的解凍期
這段期間還有另外兩件事,對於這個品類今天的樣貌很關鍵:
- BBR(Google,2016)證明 TCP 在壅塞控制上可以更聰明。它在長距離連線上追不上 UDP-based 系統,但它把地板抬高了——2024 年的現代核心上、調校得當的 TCP 吞吐量,比起 2014 年確實有實質改善。
- Cloudflare 的 R2 / 邊緣網路 改變了提供檔案服務的成本模型。過去讓 S3 對重度傳輸工作負載貴得要命的頻寬流量費(egress 費),不再是唯一選項。現在你可以把傳輸服務架構在 Cloudflare 上作為中繼路徑,幾乎不用付任何 egress 費。
第二件事,正是讓 2025 年代的服務能夠以那個價位推出的關鍵。
2025 — WarpSend
我們沒發明這個架構。UDP 傳輸、自訂壅塞控制、封包封裝、並行串流——這些到 2003 年就已經塵埃落定。
我們做的是:把這個架構拿來,重新打包給早期贏家沒服務到的那類買家——四人工作室、區域型代理商、以 NAS 為核心的中小企業。同一個協定家族。Cloudflare R2 作為中繼骨幹。一年 $75,000 變成 $5/TB。
這個領域裡多數工程上的勝利,早在我們半數客戶出生前就完成了。一直缺的,是包裝。
免費註冊 — 每月 1 TB 額度,免信用卡。