什麼是 Tree-sitter

Tree-sitter 是一款專為構建高效能語法樹而設計的增量解析函式庫與工具鏈。與傳統基於正規表達式或上下文無關文法的解析器不同，Tree-sitter 能生成即使在原始碼包含語法錯誤時依然有效的具體語法樹（Concrete Syntax Tree）。其核心價值在於增量更新能力；當檔案被修改時，它僅會重新解析受影響的節點，而非整個文件。這使其成為 IDE、程式碼分析工具及語法高亮引擎的業界標準，能為即時回饋提供亞毫秒級的延遲表現。

Tree-sitter 的核心功能

增量解析引擎

Tree-sitter 維護一個持續存在的語法樹並進行增量更新。透過追蹤編輯範圍，它僅重新解析修改過的子樹而非整個檔案。這將解析大型檔案的計算複雜度從 O(N) 降低至 O(log N)，確保即使在擁有數十萬行程式碼的檔案中，語法高亮與程式碼智慧功能依然保持靈敏。

錯誤恢復能力

與標準 LR 解析器在遇到第一個語法錯誤即失敗不同，Tree-sitter 具備韌性。它採用先進的錯誤恢復機制，即使使用者在輸入不完整的程式碼時也能持續解析。這確保了自動補全與診斷等 IDE 功能在開發過程中依然能正常運作。

語言無關的核心

核心函式庫以高度優化的 C 語言編寫，在不同宿主語言間提供一致且高效能的執行環境。透過將解析器邏輯與宿主環境解耦，開發者只需編寫一次文法，即可在 Rust、Python、Go 或 Node.js 應用程式中使用，無需犧牲效能或重寫解析邏輯。

具體語法樹生成

Tree-sitter 生成包含所有標記（Token）的完整具體語法樹（CST），包括空白字元、註解與分隔符。這種細節程度對於執行程式碼重構、格式化或自動化 Linting 的工具至關重要，因為它允許在保留文件原始格式的同時，精確操作原始碼結構。

宣告式文法 DSL

文法使用基於 JavaScript 的宣告式 DSL 定義，簡化了建立複雜語言解析器的過程。此方法抽象化了底層狀態機的複雜性，讓開發者能專注於定義語言規則。CLI 會處理優化後 C 解析器的生成，顯著降低了建立自訂語言支援的門檻。

如何使用 Tree-sitter

使用 'npm install -g tree-sitter-cli' 安裝 Tree-sitter CLI。,2. 在專案目錄中執行 'tree-sitter init' 初始化新的語言儲存庫。,3. 使用提供的 JavaScript DSL 在 'grammar.js' 檔案中定義文法。,4. 執行 'tree-sitter generate' 生成解析器原始碼，產出高效能的 C 程式碼。,5. 將生成的 C 程式碼編譯為共享函式庫，或直接連結至您的應用程式。,6. 使用特定語言的綁定（如 Node.js、Rust、Python）來解析原始碼並遍歷生成的語法樹。

Tree-sitter 的使用情境