日本企業のLLM活用を安全に

情報漏洩防止から有害コンテンツ検出まで、包括的AIセキュリティ・プラットフォーム

LLM-Audit™とは

LLM-Audit™は、大規模言語モデル(LLM)やAIエージェントの利用における包括的な監査ソリューションです。

本ソリューションはLLMへの送信データ(アウトバウンド)とLLMからの出力データ(インバウンド)の双方向監査機能を提供し、
企業のAI活用におけるセキュリティとコンプライアンスを強化します。

双方向監査フロー

こんな課題はありませんか?

LLM活用において、多くの企業が直面している深刻なリスクと課題

機密情報漏洩のリスク

従業員が気づかずに機密情報や個人情報をLLMに入力してしまい、意図せず外部に流出する危険性があります。一度学習されたデータは削除が困難で、長期的な情報漏洩リスクとなります。

コンプライアンス違反のリスク

LLMサービスに送信された情報が意図せず第三者のサービス環境に保存・学習される可能性があり、企業の機密保持、個人情報保護法などの規制要件に適切に対応する必要があります。

LLM誤出力による損害賠償リスク

LLMが生成した誤情報や不適切な回答により、顧客や取引先に損害を与え、訴訟リスクや賠償責任が発生する可能性があります。特に医療・金融・法務分野では致命的な結果を招く恐れがあります。

ブランド毀損のリスク

不適切な発言、差別的な内容、倫理的に問題のある回答などにより、企業ブランドイメージが大きく損なわれ、社会的信用を失う可能性があります。SNS時代では一瞬で拡散し、回復困難な損害を被ります。

これらのリスクを放置すると...

双方向監査フロー

【画像: 知らなかったでは済まされない。AIサービスへの機密情報流出のツケは大きい】

巨額の損害賠償、規制当局からの処分、顧客離れ、株価下落など
企業存続に関わる重大な結果を招く可能性があります

LLM-Audit™ ソリューション体系

LLM-Auditは保護対象に応じた2つのソリューションをご提供しております

LLM-Audit Enterprise 🏢

自社データと従業員を保護

「LLM-Audit Enterprise」はChatGPTやGeminiなど外部のLLMサービス等を活用されている企業向けのAIセキュリティソリューションです。

自社の従業員が個人情報や機密データを、そうした外部LLMサービスに「うっかり」送信してしまうような自社データの漏洩防止と従業員のコンプライアンス管理を実現します。

  • 機密情報・個人情報の漏洩防止
  • 従業員の適切なLLM利用管理
  • 外部LLMサービスの安全な活用

LLM-Audit Cloud ☁️

自社サービスとエンドユーザーを保護

「LLM-Audit Cloud」は自社LLMサービス提供企業向けのセキュリティソリューションです。

プロンプトインジェクションやジェイルブレイクといった攻撃から自社サービスを防衛し、エンドユーザーに安全なサービスを提供します。

  • プロンプトインジェクション対策
  • ジェイルブレイク攻撃の防御
  • 有害コンテンツの生成防止

ソリューション比較表

項目 LLM-Audit Enterprise 🏢 LLM-Audit Cloud ☁️
サービス概要 他社LLM(ChatGPT等)を利用する企業が自社データと従業員を保護するソリューション 自社でLLMサービスを提供する企業がエンドユーザーを保護するソリューション
目的 他社LLMサービスへの入力と出力を監査する 自社LLMサービスへの入力と出力を監査する
主な保護対象 ・貴社機密データ、個人情報(PII)
・他社LLMサービスを使用する貴社の従業員
・自社のLLMサービス
・自社LLMサービスのエンドユーザー
インターフェース ProxyServer方式(MITM)、他 OpenAI API互換

セキュリティ機能詳細

アウトバウンド・インバウンドの双方向で包括的なセキュリティを実現

アウトバウンドセキュリティ(送信データ監査)

LLMへのデータ送信を監査・制御する仕組みです。Enterprise環境では従業員による外部LLMサービス利用時の機密情報漏洩を防止し、 Cloud環境では自社LLMサービスへのプロンプトインジェクションや脱獄攻撃等の悪意ある入力を検出・遮断します。

機能・技術 概要 実施例
防御機能 データ漏洩防止機能(Enterprise向け)
・個人情報(氏名、住所、電話番号、メールアドレス等)の検出
・企業機密(財務情報、営業秘密、知的財産等)の識別
・認証情報(パスワード、APIキー等)の自動検出
・カスタムルールによる貴社定義の機密情報や業界特有情報の保護

攻撃防御機能(Cloud向け)
・プロンプトインジェクション攻撃の検出
・システムプロンプト改変の試みをブロック
・脱獄(Jailbreak)手法のパターン認識
・有害・違法コンテンツ生成の誘導を阻止
・毒性プロンプトを検出したユーザーを記録し、一定スコアを超えたユーザーをマーク。執拗なユーザーに対してはブラックリスト化し、警告・サービス利用停止

・PII検出をし、個人情報は完全マスキング。事前に登録していたカテゴリに関してはマスキングではなくフェイクデータによる置き換えを行いLLMからのレスポンス時に逆変換することによりLLMを正常に動かしつつ、機密データは保護
制御機能 柔軟な制御オプション
特定されたリスクレベルに応じて、以下の制御が可能です
・完全ブロック:送信を遮断し、理由を明示
・マスキング:機密部分のみを隠蔽して送信
・警告表示:リスクを通知した上で送信を許可
・ログ記録:監査証跡として全ての活動を記録
・カスタムロジックにより全ログを記録、企業・部署においてカテゴリごとのリスクレベルを設定し、リスクレベルに応じて、通知・警告・ブロックを実施。特定カテゴリについては管理者へのリアルタイム通知
検出技術 高度な検出技術
単純なキーワードマッチングではなく、以下の技術により段階的かつ高精度な検出を実現
・コンテキスト分析:文脈を理解した上での判定
・機械学習:新たな攻撃パターンへの適応
・ルールエンジン:業界・企業固有のポリシー適用
・リアルタイム処理:遅延を最小限に抑えた高速スキャン
・要求される検出スピードと精度はトレードオフの関係があるため、段階的な検出器を準備。シンプルなものは正規表現ベース、高度なものはAIベースの高精度検出器を採用し使い勝手とセキュリティのバランスを実装
アウトバウンドセキュリティ画面

【画像: アウトバウンドセキュリティの検出画面 (機能や画面は予告なく変更する場合があります)】

インバウンドセキュリティ(受信データ監査)

LLMの生成物は有害コンテンツ、誤情報、機密情報露出、品質劣化、コンプライアンス違反等の多面的リスクを内包します。 LLM-Auditのインバウンドセキュリティ機能は、監査パイプラインと呼ばれる段階的処理アーキテクチャを採用し、 各リスクを多層的に検証します。

検出器 概要 実施例
コンテンツフィルタ LLMの出力に含まれる有害・不適切なコンテンツを検出・除去
• 暴力的表現、性的内容、違法行為の助長など14カテゴリーの脅威を識別
• 文脈を考慮した高精度な判定
• LLMサービスによっては、ある文脈において不適切なコンテンツを出力するケースがあり、LLMが生成した回答を顧客Q&Aにそのまま用いる例において、企業の信用低下リスクを低減するため不適切コンテンツはブロックする
ハルシネーション検出 LLMが生成した情報の事実性を検証し、誤情報や架空の内容を識別します
• エンティティ検証、論理的整合性チェックを通じて、もっともらしいが事実と異なる「幻覚」を検出
- 知識ベースを利用した検証(エンベディングベース検証)
- セルフチェックによる検証(LLMによるセルフチェック)
• ビジネス文書生成などの際、一般的内容を生成するときでさえハルシネーションを発生させることがある
• 3重のセルフチェックにより幻覚防止を行い幻覚発生率を大幅に低下
• 企業独自の文書管理システム(知識ベース)に接続し、コサイン類似度から幻覚判定を行い、LLMが幻覚を発生しやすい分野(法務、金融、医療)の幻覚発生を低減
機密情報フィルタ 意図せず出力に含まれる可能性のある機密情報を検出・除去します
• 個人情報(PII)、企業秘密、内部データ、認証情報などを高精度で識別
• 学習データに含まれていた機密情報の意図しない漏出リスクを最小化
• 領域特化LLMを作成するために、自社データでファインチューニングした際、企業データベースに誤って混入していたPIIを学習してしまったため、LLMがPIIを出力しようとした際にAudit PII Detectorにより未然防止しユーザーにPIIが漏洩することを防止
品質チェック 回答の一貫性を評価し、ビジネス品質基準を満たす出力を保証します
• 質問と回答のズレを検出し、自然な業務文書に修正
• いかにもLLMが出したとわかる出力の検出と制御
• 「売上目標を教えて」という質問に対して一般的なビジネス論を展開するような回答を検出し、端的で実務的な回答に変換
• 「いかがでしょうか」「3つの観点から」といったLLM特有の定型表現を自動的に修正し、自然な日本語による回答を生成
コンプライアンス確認 業界固有の規制要件や法的制約への準拠確認
• 業界別の規制違反を自動検出・修正
• 免責事項の自動付与も含め、法的リスクを最小化
• 医薬分野では診断や処方に関する断定的表現を検出し、受診推奨と免責事項を追加
• 金融分野では利益保証や断定的な投資助言を識別し、リスク説明と法定表示を自動付与
• 法務分野では無資格での法律相談に該当する内容を検出し、弁護士への相談を促す文言に修正

柔軟なアーキテクチャ:階層型ガードレール防御

各セキュリティ機能を独立した「ガードレール」として実装し、お客様の要件に最適化された多層防御を実現

LLM-Auditは、各セキュリティ機能を独立した「ガードレール」として実装し、これらをパイプライン上で柔軟に組み合わせた 「階層型ガードレール防御機構」により、お客様の要件(パフォーマンスとセキュリティ)に最適化された多層防御を実現します。

処理フロー

以下のような処理フローにより、AIサービスへの情報漏洩・リスクの検出と対処(マスキングや遮断)、AIサービスからの有害コンテンツの検出と対処を行うことが可能です:

ユーザー入力LLM-Audit アウトバウンドガードレール群によるアウトバウンドリスク検出LLMLLM-Audit インバウンドガードレール群によるインバウンドリスク検出最終出力
階層型ガードレール防御アーキテクチャ

【画像: 階層型ガードレール防御機構のアーキテクチャ図】

主要なガードレール一覧

ガードレール種別 ガードレール 概要
アウトバウンドガードレール 機密情報保護ガードレール データ漏洩防止機能(Enterprise向け)
• 個人情報(氏名、住所、電話番号、メールアドレス等)の検出
• 企業機密(財務情報、営業秘密、知的財産等)の識別
• 認証情報(パスワード、APIキー等)の自動検出
• カスタムルールによる貴社定義の機密情報や業界特有情報の保護
攻撃防御ガードレール 攻撃防御機能(Cloud向け)
• プロンプトインジェクション攻撃の検出
• システムプロンプト改変の試みをブロック
• 脱獄(Jailbreak)手法のパターン認識
• 有害・違法コンテンツ生成の誘導を阻止
コンテクスト検証ガードレール • 会話の文脈や状況を理解し、不適切な文脈での情報開示や、文脈を悪用した攻撃を防御
ポリシー適用ガードレール • 企業固有のルール、業界規制、利用規約などのポリシーを強制適用
インバウンドガードレール 有害コンテンツフィルタ LLMの出力に含まれる有害・不適切なコンテンツを検出・除去
• 暴力的表現、差別的内容、違法行為の助長など14カテゴリーの脅威を識別
• 文脈を考慮した高精度な判定
ハルシネーション検出器 LLMが生成した情報の事実性を検証し、誤情報や架空の内容を識別
• エンティティ検証、論理的整合性チェック
• 知識ベースを利用した検証(エンベディングベース検証)
• セルフチェックによる検証(LLMによるセルフチェック)
機密情報フィルタ 意図せず出力に含まれる可能性のある機密情報を検出・除去
• 個人情報(PII)、企業秘密、内部データ、認証情報などを高精度で識別
• 学習データに含まれていた機密情報の漏出リスクを最小化
品質保証エンジン 回答の一貫性を評価し、ビジネス品質基準を満たす出力を保証
• 質問と回答のズレを検出し、自然な業務文書に修正
• いかにもLLMが出したとわかる出力の検出と制御
コンプライアンスチェッカー 業界固有の規制要件や法的制約への準拠確認
• 業界別の規制違反を自動検出・修正
• 免責事項の自動付与も含め、法的リスクを最小化

階層型ガードレール防御機構:パフォーマンス最適化

各ガードレールは内部で階層的な処理エンジンを持ち、精度とパフォーマンスの最適なバランスを実現します。 例えばPII検出では、

高速パターンマッチ(L1)→構造解析(L2)→文脈含意検出モデル(L3)→専用LLM(L4)

と段階的に処理を深化。 95%のリクエストは高速な浅い層で処理完了し、真にリスクの高いケースのみ深層分析を適用することで、 ミリ秒単位の応答速度と高精度を両立します。

階層的処理エンジン

【画像: 階層的処理エンジンの概念図(L1〜L4の処理フロー)】

パフォーマンスと精度の最適化

95%のリクエストをミリ秒オーダーで処理しながら、99.9%以上の脅威検出率を目指します。 独立したガードレールの並列処理により、総処理時間を最小化。

運用の柔軟性

稼働中のシステムを停止することなく、新しいガードレールの追加や既存ルールの更新が可能。 A/Bテストによる段階的展開で本番環境への影響を最小限に。

ビジネス価値

高度なセキュリティ要件を満たしながら、快適な応答速度を維持。 部署や用途に応じた最適なセキュリティレベルを適用可能。

柔軟な展開オプション

データ主権とセキュリティを最優先した展開方式
お客様のセキュリティ要件とコンプライアンス要求に応じて、最適な展開環境を選択いただけます

すべての選択肢において、データの国内保持を完全に保証し、機密情報が国境を越えることはありません。

項目 貴社データセンター内への
オンプレミス展開
当社データセンター環境 クラウドプラットフォーマー(※)の
日本リージョン限定
特徴 最高レベルのセキュリティとデータコントロールを実現
• 完全なエアギャップ環境での運用が可能
• 既存のセキュリティインフラとの完全統合
• 社内ポリシーに100%準拠した運用
• 外部ネットワーク接続不要での動作保証
エンタープライズグレードの信頼性とセキュリティを提供
• Tier3/4データセンターでの24時間365日運用
• 専用ハードウェアによる物理的隔離
• 金融機関レベルの物理セキュリティ
• 災害対策と事業継続性の確保
スケーラビリティとコスト効率を両立
•クラウドプラットフォーマー(AWS他)の日本リージョン
•政府認定ガバメントクラウド(さくらインターネット他)
メリット オンプレミスが適している場合
• 金融、防衛、重要インフラなど最高レベルのセキュリティが必要
• 完全な物理的管理が規制で要求される
• 既存システムとの密接な統合が必須
• 自社外に一切監査前データを出したくない
(Qualitec社からも不可視にしたい)
当社データセンターが適している場合
• 海外企業にデータを置くのは避けたい • 自社DC構築は困難
• 専門的な運用サポートを活用したい
クラウドが適している場合
• 需要変動に応じた柔軟なスケーリングが必要
• 初期投資を抑えて迅速に導入したい
• 自社ルールがある(特定のクラウドプラットフォーマーが自社基準に適合)
※クラウドプラットフォーマーご利用の場合、一部利用できない機能、限定される機能があります

日本企業がLLMを「安心して」「実用的に」「長期的に」活用するための
最も信頼できるパートナーを目指しています

LLM-Auditが選ばれる理由

日本語の深い理解、実運用で鍛えられた防御力、LLMコア技術への造詣、入口から出口までの完全防御、そして未来のAIリスクへの対応力
これらすべてを兼ね備えた、日本企業のためのLLMセキュリティソリューションとして真の安心と実用性を提供します

日本企業がLLMを「安心して」「実用的に」「長期的に」活用するための最も信頼できるパートナーを目指しています

優位性 LLM-Auditの強み 他社製品の課題
1. 日本語の圧倒的理解 日本語ネイティブエンジニアが、10年以上の日本語NLP研究と実際の日本語攻撃データセットを基に開発

• 形態素解析からLLMまで幅広い技術スタックを駆使
• 日本語の助詞ニュアンスや含意まで深く理解
• 日本語特有の攻撃パターンを精密に検出
• 文脈や語感を重視したリスク検出エンジンを実現
多くが英語基準で設計されており、日本語の巧妙な攻撃を見逃しがちです

• 海外製品特有のアライメント問題
• 日本語の文脈や含意の理解不足
• 助詞や敬語の微妙なニュアンスを捉えきれない
• 日本語特有の攻撃手法への対応の遅れ
2. 実運用で鍛えられた防御力 自社LLMサービス「ChatStream🄬」「Bestllam™」の運用で蓄積した実際の日本語攻撃パターンをナレッジベースとして活用

• 現実世界での攻撃事例を基にした防御設計
• AIレッドチームがハッカソン形式で新攻撃手法を研究
• 最新の攻撃手法を即座に防御システムに反映
• 継続的な脅威インテリジェンス更新
実運用経験のない理論ベースの製品が現実の脅威に対応できるのか十分な注意が必要です

• 机上の理論に基づく設計
• 自社にAIレッドチーム(LLM攻撃と防御の専門家)が存在しない
• 新しい攻撃手法への対応が遅い
• 実際の攻撃データの蓄積不足
3. LLMコア技術への深い造詣 PagedAttention、TensorRT-LLM、vLLMなど最新の推論エンジン技術に精通

• GPU推論基盤の開発・運用経験
• LLMのアーキテクチャレベルからの包括的防御設計
• 高性能で効率的なセキュリティ実装
• 表面的でない根本的なセキュリティ対策
LLMインフラ技術を持たない企業の製品は表面的な対策に留まります

• 推論エンジンへの理解不足
• 非効率でメモリ効率の悪いセキュリティ実装
• 手戻りや追加開発の発生
• パフォーマンスとセキュリティの両立困難
4. 入口から出口までの完全防御 入力時の機密情報漏洩防止(アウトバウンド)と出力時の危険性監査(インバウンド)を統合

• LLMの全ライフサイクルで完全カバー
• 攻撃検知と品質管理を統合
• エンドツーエンドのセキュリティ実現
• 包括的なリスク管理体制
入力または出力の一方向のみの対策や一部のリスクに特化した対策では不十分

• LLMセキュリティの一部分しかカバーできない
• 総合的な視点の欠如
• 部分的な対策の隙間から新たなリスクが発生
• 断片的なセキュリティ対策
5. 未来のAIリスクにも対応 モジュラー設計により、将来の法規制やAIエージェント時代の新たな脅威にも柔軟に対応

• 継続的なアップデートとセキュリティ提供
• お客様のLLM投資を長期的に保護
• 進化するAI技術全般への包括的なセキュリティ基盤
• ガーディアンエージェント対応など将来性を見据えた即応性と拡張性を備えた設計
固定的なアーキテクチャは新しい脅威への対応が遅く、技術進化についていけません

• 将来の法規制やAI技術の変化に適応困難
• 導入後すぐにレガシー化するリスク
• 新しい脅威への対応の遅れ
• 短期的な視点での設計

実証された信頼性

自社サービス「ChatStream🄬」「Bestllam™」での実運用を通じて検証済みの防御システムです。理論ではなく、実際の攻撃データに基づいた堅牢なセキュリティを提供します。

日本企業特化設計

日本の規制要件、文化的背景、言語特性を深く理解した専門チームが、日本企業のニーズに最適化されたソリューションを提供します。

継続的進化

AIレッドチームによる最新攻撃手法の研究と、モジュラー設計による柔軟なアップデートにより、未来の脅威にも対応し続けます。

お問合せ・ご相談

LLM-Audit™の導入相談・技術検証から運用支援まで、
貴社のニーズに合わせたコンサルティングを承っております。

初回のご相談は無料です。お気軽にお問合せください。

お問い合わせはこちら

リソースセンター

技術資料、ホワイトペーパー、最新情報をご提供

LLMセキュリティ・ブログ記事一覧


2025年7月10日
AI時代のデータ漏洩防止の要諦とテクノロジー:第1回 AI DLPとPROXY

生成AIの急速な普及により、企業のデータガバナンスは新たな局面を迎えています。ChatGPTやClaudeといったLLMが業務効率を向上させる一方で、意図しない機密情報の漏洩リスクをもたらしています。

続きを読む →
2025年6月18日
AIエージェント時代の新たな番人「ガーディアンエージェント」とは?

ガートナーが発表したガーディアンエージェントについて解説。AIエージェントが自律的に行動する時代に必要な「AIを守るAI」として、レビュアー、モニター、プロテクターの3つのカテゴリーと実装方法を紹介します。

続きを読む →
2025年3月7日
LLM活用における段階的PIIマスキング

PowerPoint、Excel、PDF、画像など様々なファイル形式に潜む「見えないPII」の検出方法を解説。スピーカーノートや非表示シートなど、見落としがちな箇所のリスクと、段階的なマスキング戦略を紹介します。

続きを読む →
2024年12月23日
PIIの高精度検出を支える技術~日本語という言語の奥深さに寄り添う~

日本語特有の文字体系、文脈依存性、敬語システムに対応したPII検出技術を解説。正規表現から大規模言語モデル統合まで、5段階の技術アプローチと処理速度・精度のトレードオフを詳説します。

続きを読む →
2024年10月22日
LLM時代の企業情報防衛:PIIセキュリティの新たな挑戦

LLMが業務に浸透した時代における個人識別情報(PII)の保護について解説。従来のセキュリティ対策では想定していなかった「AIへの情報漏洩」という新たなリスクへの対応策を提案します。

続きを読む →
2024年8月17日
LLM-Audit ~LLMへの攻撃と防衛の最前線~

当社が開発したLLMセキュリティソリューション「LLM-Audit」の紹介。プロンプトインジェクション検出、個人情報保護、入出力監査など、LLMの安全な利用を実現する包括的なセキュリティ機能を解説します。

続きを読む →
2024年8月5日
【LLMセキュリティ】ハルシネーションの検出方法

RAGにおけるハルシネーション検出に関する論文"Lynx: An Open Source Hallucination Evaluation Model"を解説。LLMが生成する回答の忠実性を判定し、ハルシネーションを検出する手法について考察します。

続きを読む →
2024年1月31日
【LLMセキュリティ】Llama Guard:AI安全性の第一歩

Meta社が開発したLlama Guardについて解説。LLMの入力プロンプトと出力レスポンスの両方に対してセーフガードを導入し、不適切なコンテンツを防ぐための安全リスク分類法を紹介します。

続きを読む →
2023年12月13日
【LLMセキュリティ】ゼロリソースブラックボックスでの幻覚(ハルシネーション)検出

「ゼロリソース」状態での幻覚検出について解説いたします

続きを読む →

技術資料


API仕様書、インテグレーションガイド、管理者マニュアルなどの技術文書は、 ご契約後に専用ポータルサイトからアクセスいただけます。

LLM-Audit 技術仕様書・アーキテクチャガイド

システムアーキテクチャと実装の詳細な技術文書です。

LLM-Audit インテグレーションガイド

お客様のインフラにLLM-Auditを導入する際の構成ガイド、アーキテクチャパターン、インテグレーション方法を詳しく解説した技術資料です

LLM-Audit 管理者マニュアル

システムアーキテクチャと実装の詳細な技術文書です。

初回のご相談は無料です。お気軽にお問合せください。

お問い合わせはこちら