跳至主要内容

XecGuard:專為 AI Chatbot / LLM 所打造的資安護欄

XecGuard 是由 CyCraft 所開發的 AI 安全防護 Guardrail APIs,專為防禦各類針對大型語言模型(LLM)的 Prompt Attacks 而設計。它能即時檢測與分析惡意對話內容,並提供完整的 LLM Safety 防護能力。XecGuard 特別適用於 AI Agent 與各類 AI 應用場景,可有效防止來自外部的惡意輸入,例如 Prompt Injection、Prompt Extraction、Harmful Content 或攻擊型留言,避免模型被誘導產生錯誤、偏離任務,甚至做出有害行為,進一步提升整體系統的安全性與可信度。


核心防護機制與特色

XecGuard 是專為安全場景設計的輕量化語意模型,與傳統依賴關鍵字過濾的防護機制不同,能夠理解「攻擊意圖」與「語意變形」,其核心優勢包括:

  • 多模型微調技術:XecGuard 是由多個小型模型互相協作而成,不是採用過濾關鍵字的作法。這些小模型經過微調,能夠更適合特定安全任務。
    • 高效能與低延遲:採用小模型架構而非單一大型模型,能使運算成本更低、速度更快。
    • 高精準度: 每個模型皆針對特定安全任務進行微調,進行語意辨識與投票,確保判斷精準度。
  • 多層次威脅防禦: 有效阻擋提示詞注入 (Prompt Injection)、提示詞竊取 (Prompt Extraction) 及惡意有害內容 (Harmful Content)。
    • 惡意語意識別能力:能理解深層的「攻擊意圖」與「語意變形」,具備使用者提示詞 (User Prompt) 的惡意語意識別能力。即使攻擊者使用混淆編碼、角色扮演或情感說服,系統仍能精準識破其背後的惡意邏輯。
    • 情境指令遵循: 確保 AI 嚴格遵守系統提示 (System Prompt) 設定的任務範圍,防止被使用者引導至未授權的任務情境。
  • 多語系與在地化優勢: 支援中文、英文與日文等多語言分析,除能精準辨識中、日文語意攻擊外,更強化台灣在地個資格式(如身分證、地址與金融帳號)偵測,滿足跨國與在地合規需求。

核心防護價值


八大功能模組

XecGuard 提供全方位的 AI 防護能力,涵蓋以下關鍵模組:

  • 通用提示攻擊防護 (General Prompt Attack Protection): 偵測並防止大部分的提示詞注入 (Prompt Injection)、提示詞竊取 (Prompt Extraction) 與 繞過防護 (Evasion) 等攻擊行為。有效阻斷攻擊者試圖覆寫模型、暴露系統指令或透過混淆與編碼手法繞過安全機制。
  • 任務情境遵循 (System Prompt Enforcement): 確保 AI 系統嚴格遵循企業所指派的 AI Agent 任務範圍 (System Prompt Following),實現真正的語境感知安全,防止 AI 被引導至未授權的情境。
  • 內容偏見防護 (Content Bias Protection): 偵測並緩解帶有偏見、騷擾或有害刻板印象的輸出,確保 AI 符合企業倫理。
  • 有害內容防護 (Harmful Content Protection): 透過語意分析,偵測並防止有違善良風俗、暴力、仇恨或危險的 AI 輸出。
  • 個資與敏感資料防護 (PII & Sensitive Data Protection): 企業級 AI 的隱私與資料外洩防護,支援台灣個資、地址、車號,確保 AI 不會暴露個人或敏感資訊。
  • 惡意 Agent Skills 防護 (Malicious Skills Protection):檢測 AI Agent 的 Skills 與相關檔案內容是否包含對系統的惡意或有害內容,以保護 Agent AI 免於惡意 Skills 的影響。
  • 自訂 AI 安全政策 (Custom Policy Enforcement):企業可以定義專屬於自己的 Gudrail Rule,或是根據任務彈性挑選 Default 的安全模組。也可以根據部門的層級設計專屬 Safety Policy,自主落實 AI 安全治理。
  • 情境幻覺檢驗 (Context Grounding Validation):用於偵測 AI 幻覺,檢測回應內容是否嚴格依據使用者提供的文件與核准的 RAG 語境。

API 串接與系統部署

  • 標準化且簡易的 API 串接:採用標準的 RESTful API 架構。開發者的呼叫習慣與市面上主流 LLM 服務(如 OpenAI)相容,只需在 HTTP Header 帶入專屬的 Management Token/Service Token(API Key) 即可快速完成驗證與串接,詳情請參閱使用指南
  • 多樣化授權方案: 提供 Lite、Standard 與 Advanced 三種層級的彈性方案,覆蓋從 POC 驗證到企業級大規模部署的需求,讓企業能根據應用規模靈活配置最合適的安全防護。Standard 以上方案採用專屬 GPU 伺服器,能夠隔離運算資源且維持高效能。
  • 資料隱私保障: 所有正常請求內容均不會被記錄或保留。僅在偵測到惡意攻擊(如 Prompt Attacks)時,相關內容才會經過去識別化暫存,用於安全研究、模型優化與 AI 安全倡議。我們也將持續將研究成果回饋至開源社群,促進整體生態系的安全能力提升。透過這樣的正向循環,我們期望與開源社群共同建立一個更安全、更可信任的 AI 發展環境。

XecGuard 作為企業 AI 應用的「安全防火牆」,能確保 AI 系統在安全、合規且可控的環境下運作,是企業導入生成式 AI 流程中不可或缺的安全基石。