AI検出ツール

あなたのテキストがChatGPT、Claude、Gemini、GPT-4によって書かれたかどうかを確認します。

無料。即時。登録不要。アップロード不要。すべてブラウザ内で動作します。

✓ ChatGPT検出✓ Claude検出✓ GPT-4 / GPT-4o✓ 100%プライベート
0 · 0

すべての分析はブラウザ内で実行されます。テキストがデバイスから出ることはありません。

AIの可能性スコア
0/ 100
判断不能

シグナルが混在しています。どちらとも判断できません。

6つのシグナルに基づく

この検出ツールの仕組み

このツールは6つの統計シグナルを0から100のAI可能性スコアに統合します。各シグナルは確立されたテキスト分析手法を用いてブラウザ内でローカルに計算されます。シグナルは、研究文献においてAI生成テキストと人間の文章をどれだけ確実に区別できるかに応じて重み付けされます。

文長のばらつき(30%)は文の長さの変動係数を測定します。人間の文章は短い文と長い文の間で揺れますが、AIの出力はより均一です。 語彙の多様性(20%)は100語のウィンドウでタイプトークン比を用います。 決まり文句の検出(20%)は「掘り下げる」「今日のデジタル時代において」「結論として」などの定型AIフレーズを走査します。 句読点のプロファイル(15%)はダッシュ、セミコロン、オックスフォードカンマの密度を追跡します。 文の構造(10%)は文頭のばらつきと受動態の割合を見ます。 繰り返し(5%)は繰り返される3語・4語のフレーズを数えます。

この検出ツールはスコアの低い側で偽陰性より偽陽性を優先するよう調整されています。30点でも「確実に人間」ではなく「人間寄り」を意味します。判定は最終結論ではなく出発点として扱ってください。

判定ではなく目安です

これは統計的な推定であり、証拠ではありません。AI検出は本質的に不確実です。このようなツールは、学術的な文章、英語非母語話者、技術文書、形式的な文体に対して偽陽性を出すことがあります。盗用や学術的不正の告発の唯一の根拠として使用しないでください。

クイック回答

少なくとも50単語を貼り付けてください。このツールは6つの統計的シグナル(バースト性、語彙の多様性、決まり文句、句読点、文構造、繰り返し)を計算し、0から100のAI可能性スコアに統合します。ヒューリスティックの精度はおよそ65〜75%です。結果は証拠ではなく出発点として扱ってください。

AI検出の仕組み

ヒューリスティックなAI検出ツールはテキストを「読む」わけではありません。人間とAIの文章で異なる傾向のある表面的な特徴を数えます。単独で決定的な特徴は1つもないため、堅牢な検出ツールは複数のシグナルを組み合わせます。以下はこのツールが使用する6つです。

1. バースト性

バースト性は、文章全体にわたる文長の変動を測定します。人間は自然に非常に短い文(3〜6単語)と長い文(25〜40単語)の間で揺れ動きます。流暢さと明快さを最適化するように訓練された大規模言語モデルは、平均15〜22単語の周辺に低い分散で集まる文を生成します。このツールは変動係数を計算します。0.6超の値は人間寄り、0.3未満はAI寄りです。バースト性はほとんどの研究ベンチマークで単独で最も強いシグナルであるため、30%の重みを付けています。

2. 語彙の多様性

語彙の多様性はタイプトークン比で測定します。ユニークな単語を総単語数で割ったものです。テキストの長さにわたって指標を安定させるため、100単語の移動ウィンドウを使用し、ウィンドウごとのTTRを平均します。人間の文章は通常この尺度で0.65〜0.80に位置します。AI出力はしばしば0.55〜0.65に集まり、文章内で語彙を再利用するモデルの傾向を反映します。重み:20%。

3. N-gram決まり文句検出

AIモデルが多用するフレーズの厳選リストをスキャンします。「in today's digital age」「it is important to note」「delve into」「navigate the complexities」「in conclusion」「furthermore」「moreover」「additionally」などです。これらのフレーズ自体は間違っていませんが、文章内での密度は強いシグナルです。50単語に1つあると、スコアはAIに傾きます。重み:20%。

4. 句読点プロファイル

AIモデル、特にGPT-4ファミリーは、長いダッシュ文字を多用します。ほとんどの人間の書き手はダッシュを控えめに使います。このツールは100単語あたりのダッシュ、セミコロンの密度、オックスフォードカンマの使用率を数えます。200単語に3つのダッシュがある文章は、それだけで強いAIマーカーです。重み:15%。

5. 文構造

2つの構造的特徴です。文が同じ単語で始まる頻度(変化が少ないとAI寄り)と受動態が現れる頻度(割合が高いとAI寄り)。検出ツールは「be」動詞(was、were、is、are、been、being)の後3単語以内に過去分詞らしき語が続くものを探すことで、受動態を近似します。重み:10%。

6. フレーズの繰り返し

テキストからすべての3単語および4単語のフレーズを抽出し、繰り返しを数えます。3回以上現れるフレーズはスコアをAIに傾けます。人間は通常言い換えますが、AIはパターンを繰り返します。これは6つのシグナルの中で最も弱いもの(5%)です。正当な文章でもしばしば専門用語が繰り返されるためですが、限界では有用な情報を加えます。

精度と限界

ヒューリスティックなAI検出ツール(GPTZero、ZeroGPT、Copyleaks、およびDetectGPTやGLTRのような学術的検出ツール)の独立評価は、混合ドメインのテキストで一貫して65〜80%の精度範囲に収まります。同じ研究は、軽く編集されたAI出力が検出率を50%未満に下げる可能性があることを示しています。有料・無料を問わず、敵対的なテキストで90%を超える検出ツールは存在しません。

当社のツールは次のものに対して誤検出を生じます。

  • 学術的な文章 - 均一な文長、形式的な語彙、ヘッジング表現。
  • 非ネイティブの英語 - 小さな作業語彙、より繰り返される構造。
  • 技術文書 - 受動態、繰り返される専門用語、形式的なスタイル。
  • 企業や法律のテキスト - 決まり文句、オックスフォードカンマ、セミコロンの使用。
  • 高度に編集された、またはテンプレート化された文章 - 機械的に見えるパターン。実際にそうだからです。

スコアは判決ではなく、議論のきっかけとして使ってください。重大な決定(学術的処分、採用)の場合は、検出ツールを他の証拠と組み合わせてください。下書き履歴、執筆サンプル、内容についての対面での会話などです。

AI検出を使うべき場面

限界を理解している限り、ヒューリスティック検出ツールには実際の用途があります。

  • 生徒のエッセイを確認する教師 がより詳細なレビューの前に素早くスクリーニングする場合。高いスコアは「不合格」ではなく「よく見る」を意味します。
  • フリーランスの仕事を検証する編集者 が、書き手が雇われた人間の声を提供していることを確認する場合。
  • カバーレターを審査する採用担当者 が、多くの入力の1つとして使う場合。カバーレターで95のスコアは、フォローアップする価値のある黄信号です。
  • 公開前のセルフチェック で、ChatGPTのように読める箇所を見つけ、自分の声で書き直す場合。
  • コンテンツの真正性監査 で、投稿、ブログ記事、製品コピーのバックログをレビューする場合。

他の検出ツールとの比較

よく知られたAI検出ツールがいくつか存在し、それぞれ異なるトレードオフがあります。

  • GPTZero は独自モデルでパープレキシティとバースト性を使用します。制限付きの無料プラン、大量利用向けの有料プランがあります。
  • Originality.ai は有料のみで、SEOパブリッシャー向けです。カスタム訓練の分類器を使用します。
  • ZeroGPT は無料で有料プランもあります。GPTZeroと同様にパープレキシティとバースト性を使用します。
  • Copyleaks は企業向けで、盗用検出とAI検出を1つの製品にまとめています。

当社のツールは無料で、完全にブラウザ内で動作し、登録不要で、あなたのテキストを見ることはありません。有料オプションを上回ると主張するものではありません。利点はプライバシーとゼロの手間です。単一の重大な決定でより高い信頼性が必要な場合は、有料の検出ツールが妥当です。日常的なスクリーニングには、透明なヒューリスティックツールで通常は十分です。

よくある質問

このツールは6つの統計的シグナルを0から100のAI可能性スコアに統合します。バースト性(文長の変動)、語彙の多様性、AIによくある決まり文句、句読点のプロファイル(ダッシュ、セミコロン、オックスフォードカンマの密度)、文構造(冒頭の変化と受動態の割合)、3単語および4単語のフレーズの繰り返しです。各シグナルは、研究文献においてAIと人間の文章をどれだけ確実に区別できるかに応じて重み付けされます。すべての計算はブラウザ内で行われます。

いいえ。GPTZero、Originality.ai、ZeroGPTなどの有料サービスを含め、100%正確なAI検出ツールはありません。独立した研究によると、ヒューリスティック検出ツールの混合テキストにおける精度はおよそ65〜75%です。当社のスコアは出発点であり、判決ではありません。30未満を「人間寄り」、30〜70を「不確実」、70超を「AI寄り」として扱ってください。検出スコアを盗用や学術的不正の告発の唯一の根拠として使用しないでください。

当社が追跡するシグナル(「delve into」のような決まり文句、ダッシュの多用、均一な文長)は、GPT-3.5とGPT-4の出力で最も顕著です。Claudeはより変化に富んだ文長と決まり文句の少ない文章を生成する傾向があるため、そのテキストはしばしば低いスコアになります。Geminiはその中間です。このツールは特定のモデルに調整されていません。LLM生成テキストの一般的な統計的特徴を探すため、編集された、または高度にプロンプトされたAI出力はしきい値を下回ることがあります。

ヒューリスティック検出ツールは著者性ではなく統計的パターンを探します。いくつかの種類の文章はAIとパターンを共有します。学術論文(均一な文長、形式的な語彙)、非ネイティブの英語(限られた語彙、繰り返される構造)、技術文書(受動態、繰り返される専門用語)、企業や法律のテキスト(決まり文句、形式的な句読点)です。安定した一貫したスタイルで書くと、予想より高いスコアになる場合があります。検出ツールは、数える表面的な特徴以上のことは「知りません」。

いいえ。すべての分析はJavaScriptを使用してブラウザ内でローカルに実行されます。あなたのテキストはデバイスから出ることはなく、アップロードされず、記録されず、いかなるモデルの訓練にも使用されません。分析の実行中にブラウザの開発者ツールを開いてネットワークタブを監視することで、これを確認できます。ネットワークトラフィックはありません。そもそもアクセスできないため、当社のサーバーにあなたのテキストを保存することもありません。

6つのシグナルです。(1)バースト性、文長の変動係数。(2)語彙の多様性、100単語の移動ウィンドウによるタイプトークン比で測定。(3)N-gram決まり文句検出、「in today's digital age」「it is important to note」のような定型AIフレーズをスキャン。(4)句読点プロファイル、ダッシュ、セミコロン、オックスフォードカンマの密度を追跡。(5)文構造、冒頭の変化と受動態の割合を測定。(6)フレーズの繰り返し、3回以上現れる3単語および4単語のフレーズを数えます。

はい、簡単にできます。AI出力の軽い編集(決まり文句の入れ替え、長く均一な文の分割、個人的な声と短縮形の追加)は、スコアを大幅に下げます。これはすべてのヒューリスティック検出ツールの根本的な限界です。当社のツールをだます同じ編集は、GPTZeroやZeroGPTもだまします。重大な決定のために著者性を確認する必要がある場合は、検出ツールを他の証拠と組み合わせてください。執筆履歴、対面確認、Google DocsやWordの下書き履歴、内容についての直接の会話などです。

出典

  • Mitchell, E., Lee, Y., Khazatsky, A., Manning, C. D., Finn, C. (2023). 「DetectGPT: Zero-Shot Machine-Generated Text Detection using Probability Curvature」第40回機械学習国際会議論文集。
  • Solaiman, I., Brundage, M., Clark, J., et al. (2019). 「Release Strategies and the Social Impacts of Language Models」OpenAIレポート。
  • Gehrmann, S., Strobelt, H., Rush, A. M. (2019). 「GLTR: Statistical Detection and Visualization of Generated Text」ACLシステムデモンストレーション。
  • Bhattacharjee, A., Liu, H. (2023). 「Fighting Fire with Fire: Can ChatGPT Detect AI-generated Text?」SIGKDD Explorations Newsletter。
  • GPTZero (2023). 「How AI Text Detectors Work」公開方法論ドキュメント。