XecGuard：專為 AI Chatbot / LLM 所打造的資安護欄

XecGuard 是由 CyCraft 所開發的 AI 安全防護 Guardrail APIs，專為防禦各類針對大型語言模型（LLM）的 Prompt Attacks 而設計。它能即時檢測與分析惡意對話內容，並提供完整的 LLM Safety 防護能力。XecGuard 特別適用於 AI Agent 與各類 AI 應用場景，可有效防止來自外部的惡意輸入，例如 Prompt Injection、Prompt Extraction、Harmful Content 或攻擊型留言，避免模型被誘導產生錯誤、偏離任務，甚至做出有害行為，進一步提升整體系統的安全性與可信度。

核心防護機制與特色

XecGuard 是專為安全場景設計的輕量化語意模型，與傳統依賴關鍵字過濾的防護機制不同，能夠理解「攻擊意圖」與「語意變形」，其核心優勢包括：

多模型微調技術：XecGuard 是由多個小型模型互相協作而成，不是採用過濾關鍵字的作法。這些小模型經過微調，能夠更適合特定安全任務。
- 高效能與低延遲：採用小模型架構而非單一大型模型，能使運算成本更低、速度更快。
- 高精準度：每個模型皆針對特定安全任務進行微調，進行語意辨識與投票，確保判斷精準度。
多層次威脅防禦：有效阻擋提示詞注入 (Prompt Injection)、提示詞竊取 (Prompt Extraction) 及惡意有害內容 (Harmful Content)。
- 惡意語意識別能力：能理解深層的「攻擊意圖」與「語意變形」，具備使用者提示詞 (User Prompt) 的惡意語意識別能力。即使攻擊者使用混淆編碼、角色扮演或情感說服，系統仍能精準識破其背後的惡意邏輯。
- 情境指令遵循：確保 AI 嚴格遵守系統提示 (System Prompt) 設定的任務範圍，防止被使用者引導至未授權的任務情境。
多語系與在地化優勢：支援中文、英文與日文等多語言分析，除能精準辨識中、日文語意攻擊外，更強化台灣在地個資格式（如身分證、地址與金融帳號）偵測，滿足跨國與在地合規需求。

核心防護價值

八大功能模組

XecGuard 提供全方位的 AI 防護能力，涵蓋以下關鍵模組：

通用提示攻擊防護 (General Prompt Attack Protection)：偵測並防止大部分的提示詞注入 (Prompt Injection)、提示詞竊取 (Prompt Extraction) 與繞過防護 (Evasion) 等攻擊行為。有效阻斷攻擊者試圖覆寫模型、暴露系統指令或透過混淆與編碼手法繞過安全機制。
任務情境遵循 (System Prompt Enforcement)：確保 AI 系統嚴格遵循企業所指派的 AI Agent 任務範圍 (System Prompt Following)，實現真正的語境感知安全，防止 AI 被引導至未授權的情境。
內容偏見防護 (Content Bias Protection)：偵測並緩解帶有偏見、騷擾或有害刻板印象的輸出，確保 AI 符合企業倫理。
有害內容防護 (Harmful Content Protection)：透過語意分析，偵測並防止有違善良風俗、暴力、仇恨或危險的 AI 輸出。
個資與敏感資料防護 (PII & Sensitive Data Protection)：企業級 AI 的隱私與資料外洩防護，支援台灣個資、地址、車號，確保 AI 不會暴露個人或敏感資訊。
惡意 Agent Skills 防護 (Malicious Skills Protection)：檢測 AI Agent 的 Skills 與相關檔案內容是否包含對系統的惡意或有害內容，以保護 Agent AI 免於惡意 Skills 的影響。
自訂 AI 安全政策 (Custom Policy Enforcement)：企業可以定義專屬於自己的 Gudrail Rule，或是根據任務彈性挑選 Default 的安全模組。也可以根據部門的層級設計專屬 Safety Policy，自主落實 AI 安全治理。
情境幻覺檢驗 (Context Grounding Validation)：用於偵測 AI 幻覺，檢測回應內容是否嚴格依據使用者提供的文件與核准的 RAG 語境。

API 串接與系統部署

標準化且簡易的 API 串接：採用標準的 RESTful API 架構。開發者的呼叫習慣與市面上主流 LLM 服務（如 OpenAI）相容，只需在 HTTP Header 帶入專屬的 Management Token/Service Token(API Key) 即可快速完成驗證與串接，詳情請參閱使用指南。
多樣化授權方案：提供 Lite、Standard 與 Advanced 三種層級的彈性方案，覆蓋從 POC 驗證到企業級大規模部署的需求，讓企業能根據應用規模靈活配置最合適的安全防護。Standard 以上方案採用專屬 GPU 伺服器，能夠隔離運算資源且維持高效能。
資料隱私保障：所有正常請求內容均不會被記錄或保留。僅在偵測到惡意攻擊（如 Prompt Attacks）時，相關內容才會經過去識別化暫存，用於安全研究、模型優化與 AI 安全倡議。我們也將持續將研究成果回饋至開源社群，促進整體生態系的安全能力提升。透過這樣的正向循環，我們期望與開源社群共同建立一個更安全、更可信任的 AI 發展環境。

XecGuard 作為企業 AI 應用的「安全防火牆」，能確保 AI 系統在安全、合規且可控的環境下運作，是企業導入生成式 AI 流程中不可或缺的安全基石。

核心防護機制與特色​

八大功能模組​

API 串接與系統部署​

核心防護機制與特色

八大功能模組

API 串接與系統部署