AI 탐지기

텍스트가 ChatGPT, Claude, Gemini, GPT-4로 작성되었는지 확인하세요.

무료. 즉시. 가입 불필요. 업로드 없음. 전적으로 브라우저에서 실행됩니다.

✓ ChatGPT 탐지✓ Claude 탐지✓ GPT-4 / GPT-4o✓ 100% 비공개

0 단어 · 0 문장

모든 분석은 브라우저에서 실행돼요. 텍스트는 기기를 절대 벗어나지 않아요.

AI 가능성 점수

0/ 100

불확실

신호가 섞여 있어요. 어느 쪽이라 단정하기 어려워요.

6개 신호 기반

이 감지기의 작동 방식

이 도구는 여섯 가지 통계 신호를 0에서 100까지의 단일 AI 가능성 점수로 합쳐요. 각 신호는 확립된 텍스트 분석 기법을 사용해 브라우저에서 로컬로 계산돼요. 신호는 연구 문헌에서 AI 생성 텍스트와 사람의 글을 얼마나 신뢰성 있게 구분하는지에 따라 가중치를 둬요.

문장 길이 변화(30%)는 문장 길이의 변동 계수를 측정해요. 사람의 글은 짧은 문장과 긴 문장 사이를 오가지만 AI 출력은 더 균일해요. 어휘 다양성(20%)은 100단어 윈도로 타입-토큰 비율을 사용해요. 상투어 감지(20%)는 "깊이 파고들다", "오늘날의 디지털 시대에", "결론적으로" 같은 전형적인 AI 표현을 훑어요. 문장부호 프로필(15%)은 긴 대시, 세미콜론, 옥스퍼드 콤마의 밀도를 추적해요. 문장 구조(10%)는 첫머리 변화와 수동태 비율을 살펴봐요. 반복(5%)은 반복되는 3단어, 4단어 구절을 세요.

이 감지기는 점수의 낮은 쪽에서 거짓 음성보다 거짓 양성을 선호하도록 보정돼 있어요. 30점도 여전히 "확실히 사람"이 아니라 "사람 쪽"을 의미해요. 결과는 최종 판단이 아니라 출발점으로 여기세요.

판단이 아니라 추정이에요

이것은 증거가 아니라 통계적 추정이에요. AI 감지는 본질적으로 불확실해요. 이런 도구는 학술 글쓰기, 비원어민 영어, 기술 문서, 격식체에 대해 거짓 양성을 낼 수 있어요. 표절이나 학문적 부정행위 고발의 유일한 근거로 사용하지 마세요.

빠른 답변

최소 50단어를 붙여넣으세요. 이 도구는 여섯 가지 통계 신호(버스티니스, 어휘 다양성, 상투 표현, 구두점, 문장 구조, 반복)를 계산해 0부터 100까지의 AI 가능성 점수로 결합합니다. 휴리스틱 정확도는 약 65~75%입니다. 결과는 증거가 아니라 출발점으로 다루세요.

AI 탐지는 어떻게 작동하나요

휴리스틱 AI 탐지기는 텍스트를 '읽지' 않습니다. 인간과 AI 글쓰기에서 다르게 나타나는 경향이 있는 표면적 특징을 셉니다. 어떤 단일 특징도 그 자체로 결정적이지 않으며, 그래서 견고한 탐지기는 여러 신호를 결합합니다. 아래는 이 도구가 사용하는 여섯 가지입니다.

1. 버스티니스(Burstiness)

버스티니스는 한 단락에 걸친 문장 길이의 변화를 측정합니다. 인간은 매우 짧은 문장(3~6단어)과 긴 문장(25~40단어) 사이를 자연스럽게 오갑니다. 대규모 언어 모델은 유창성과 명료성을 최적화하도록 훈련되어 평균 15~22단어 주변에 낮은 분산으로 몰리는 문장을 만듭니다. 이 도구는 변동 계수를 계산합니다. 0.6 초과는 인간에 가깝고, 0.3 미만은 AI에 가깝습니다. 버스티니스는 대부분의 연구 벤치마크에서 단일 신호 중 가장 강력하며, 그래서 30% 가중치를 둡니다.

2. 어휘 다양성

어휘 다양성은 타입-토큰 비율(고유 단어를 전체 단어로 나눈 값)로 측정합니다. 텍스트 길이에 따른 지표를 안정화하기 위해 100단어 이동 창을 사용하고 창별 TTR을 평균합니다. 인간 글쓰기는 보통 이 측정값에서 0.65~0.80에 위치합니다. AI 출력은 한 단락 내에서 어휘를 재사용하는 경향을 반영해 0.55~0.65에 몰리는 경우가 많습니다. 가중치: 20%.

3. N-그램 상투 표현 탐지

AI 모델이 과도하게 쓰는 구문 목록을 검색합니다. "in today's digital age", "it is important to note", "delve into", "navigate the complexities", "in conclusion", "furthermore", "moreover", "additionally" 등입니다. 이 구문들 자체가 틀린 것은 아니지만, 한 단락 내 밀도는 강한 신호입니다. 50단어당 하나꼴이면 점수가 AI 쪽으로 기웁니다. 가중치: 20%.

4. 구두점 프로필

AI 모델, 특히 GPT-4 계열은 em-dash(긴 대시 문자)를 과도하게 사용합니다. 대부분의 인간 작가는 em-dash를 드물게 씁니다. 이 도구는 100단어당 em-dash 수, 세미콜론 밀도, 옥스퍼드 콤마 사용률을 셉니다. 200단어에 em-dash가 세 개라면 그 자체로 강한 AI 표지입니다. 가중치: 15%.

5. 문장 구조

두 가지 구조적 특징입니다. 문장이 같은 단어로 시작하는 빈도(낮은 변화는 AI에 가까움)와 수동태가 나타나는 빈도(높은 비율은 AI에 가까움)입니다. 탐지기는 'be' 동사(was, were, is, are, been, being) 뒤 세 단어 이내에 과거분사로 보이는 단어가 오는지를 보고 수동태를 근사합니다. 가중치: 10%.

6. 구문 반복

텍스트에서 모든 3단어 및 4단어 구문을 추출하고 반복을 셉니다. 세 번 이상 등장하는 구문은 점수를 AI 쪽으로 밉니다. 인간은 보통 다르게 표현하지만 AI는 패턴을 반복합니다. 정당한 글도 용어를 자주 반복하기 때문에 이것은 여섯 신호 중 가장 약한 신호(5%)이지만, 가장자리에서 유용한 정보를 더합니다.

정확도와 한계

휴리스틱 AI 탐지기(GPTZero, ZeroGPT, Copyleaks, 그리고 DetectGPT, GLTR 같은 학술 탐지기)의 독립 평가는 혼합 도메인 텍스트에서 일관되게 65~80% 정확도 범위에 머뭅니다. 같은 연구들은 가볍게 편집된 AI 출력이 탐지율을 50% 아래로 떨어뜨릴 수 있음을 보여줍니다. 유료든 무료든 적대적 텍스트에서 90%를 넘는 탐지기는 없습니다.

저희 도구는 다음에서 오탐을 낼 수 있습니다.

학술 글쓰기 - 균일한 문장 길이, 격식 있는 어휘, 완곡한 표현.
비원어민 영어 - 작은 활용 어휘, 더 많은 반복 구조.
기술 문서 - 수동태, 반복되는 용어, 격식 있는 문체.
기업 또는 법률 텍스트 - 상투 표현, 옥스퍼드 콤마, 세미콜론 사용.
매우 편집되었거나 템플릿화된 글 - 기계적으로 보이는 패턴인데 실제로도 그렇기 때문입니다.

점수는 판결이 아니라 논의의 시작점으로 사용하세요. 고위험 결정(학문적 징계, 채용)에는 탐지기를 다른 증거와 함께 사용하세요. 초안 기록, 글쓰기 샘플, 내용에 관한 대면 대화 등입니다.

AI 탐지를 사용해야 할 때

한계를 이해하는 한, 휴리스틱 탐지기에는 실제 사용 사례가 있습니다.

학생 에세이를 확인하는 교사 - 더 깊은 검토 전 빠른 선별용. 높은 점수는 '낙제'가 아니라 '더 자세히 보라'는 신호입니다.
프리랜서 작업을 검증하는 편집자 - 작가가 고용된 목적인 인간적 목소리를 전달하는지 확인.
자기소개서를 검토하는 채용 담당자 - 여러 입력 중 하나로. 자기소개서의 95점은 후속 확인이 필요한 경고 신호입니다.
게시 전 자가 점검 - ChatGPT처럼 읽히는 단락을 잡아내고 자기 목소리로 다시 쓰기.
콘텐츠 진위 감사 - 제출물, 블로그 게시물, 제품 카피의 백로그 검토 시.

다른 탐지기와의 비교

잘 알려진 AI 탐지기가 여럿 있으며, 각각 다른 장단점이 있습니다.

GPTZero는 자체 모델로 퍼플렉시티와 버스티니스를 사용합니다. 제한이 있는 무료 등급과 고용량 유료 플랜이 있습니다.
Originality.ai는 유료 전용이며 SEO 퍼블리셔를 겨냥합니다. 맞춤 훈련된 분류기를 사용합니다.
ZeroGPT는 유료 등급이 있는 무료 도구입니다. GPTZero와 유사하게 퍼플렉시티와 버스티니스를 사용합니다.
Copyleaks는 표절 검사와 AI 탐지를 한 제품에 담은 기업 중심 도구입니다.

저희 도구는 무료이고, 완전히 브라우저 내에서 작동하며, 가입이 필요 없고, 텍스트를 절대 보지 않습니다. 유료 옵션을 능가한다고 주장하지 않습니다. 장점은 프라이버시와 무마찰입니다. 단 하나의 중대한 결정에 더 높은 신뢰가 필요하다면 유료 탐지기가 합리적입니다. 일상적인 선별에는 투명한 휴리스틱 도구로 보통 충분합니다.

자주 묻는 질문

이 도구는 여섯 가지 통계 신호를 0부터 100까지의 AI 가능성 점수로 결합합니다. 버스티니스(문장 길이 변화), 어휘 다양성, 흔한 AI 상투 표현, 구두점 프로필(em-dash, 세미콜론, 옥스퍼드 콤마 밀도), 문장 구조(시작 단어 변화와 수동태 비율), 그리고 3단어 및 4단어 구문의 반복입니다. 각 신호는 연구 문헌에서 AI와 인간 글쓰기를 얼마나 신뢰성 있게 구별하는지에 따라 가중치가 부여됩니다. 모든 계산은 브라우저에서 이루어집니다.

아니요. GPTZero, Originality.ai, ZeroGPT 같은 유료 서비스를 포함해 100% 정확한 AI 탐지기는 없습니다. 독립 연구에 따르면 휴리스틱 탐지기는 혼합 텍스트에서 약 65~75% 정확도를 보입니다. 저희 점수는 판결이 아니라 출발점입니다. 30 미만은 '인간에 가까움', 30~70은 '불확실', 70 초과는 'AI에 가까움'으로 다루세요. 탐지기 점수를 표절이나 학문적 부정행위 고발의 유일한 근거로 사용하지 마세요.

저희가 추적하는 신호(예: 'delve into' 같은 상투 표현, 과도한 em-dash 사용, 균일한 문장 길이)는 GPT-3.5와 GPT-4 출력에서 가장 두드러집니다. Claude는 더 다양한 문장 길이와 적은 상투 표현을 만드는 경향이 있어 점수가 더 낮게 나오는 경우가 많습니다. Gemini는 그 중간에 위치합니다. 이 도구는 특정 모델에 맞춰 조정되지 않았습니다. LLM이 생성한 텍스트의 일반적인 통계적 특징을 찾으며, 그래서 편집되거나 강하게 프롬프트된 AI 출력은 임계값 아래로 빠져나갈 수 있습니다.

휴리스틱 탐지기는 저자가 아니라 통계 패턴을 찾습니다. 여러 유형의 글이 AI와 패턴을 공유합니다. 학술 논문(균일한 문장 길이, 격식 있는 어휘), 비원어민 영어(제한된 어휘, 반복되는 구조), 기술 문서(수동태, 반복되는 용어), 기업이나 법률 텍스트(상투 표현, 격식 있는 구두점) 등입니다. 절제되고 일관된 문체로 글을 쓴다면 예상보다 높은 점수가 나올 수 있습니다. 탐지기는 자신이 세는 표면적 특징 이상은 '알지' 못합니다.

아니요. 모든 분석은 JavaScript를 사용해 브라우저에서 로컬로 실행됩니다. 입력하신 텍스트는 기기를 절대 벗어나지 않고, 업로드되지 않으며, 기록되지 않고, 어떤 모델 학습에도 사용되지 않습니다. 분석이 실행되는 동안 브라우저 개발자 도구를 열고 네트워크 탭을 확인하면 네트워크 트래픽이 없음을 직접 확인할 수 있습니다. 애초에 저희가 텍스트에 접근할 수 없으므로 서버에 저장하지도 않습니다.

여섯 가지 신호입니다. (1) 버스티니스, 문장 길이의 변동 계수. (2) 어휘 다양성, 100단어 이동 창으로 측정한 타입-토큰 비율. (3) N-그램 상투 표현 탐지, 'in today's digital age', 'it is important to note' 같은 정형 AI 구문 검색. (4) 구두점 프로필, em-dash, 세미콜론, 옥스퍼드 콤마 밀도 추적. (5) 문장 구조, 시작 단어 변화와 수동태 비율 측정. (6) 구문 반복, 세 번 이상 등장하는 3단어 및 4단어 구문 집계.

네, 쉽게 가능합니다. AI 출력을 가볍게 편집하는 것(상투 표현 교체, 길고 균일한 문장 분할, 개인적 목소리와 축약형 추가)만으로 점수가 크게 떨어집니다. 이것은 모든 휴리스틱 탐지기의 근본적 한계입니다. 저희 도구를 속이는 편집은 GPTZero와 ZeroGPT도 똑같이 속입니다. 고위험 결정을 위해 저자를 검증해야 한다면 탐지기를 다른 증거와 결합하세요. 글쓰기 이력, 대면 확인, Google Docs나 Word의 초안 기록, 내용에 관한 직접 대화 등입니다.

출처

Mitchell, E., Lee, Y., Khazatsky, A., Manning, C. D., Finn, C. (2023). "DetectGPT: Zero-Shot Machine-Generated Text Detection using Probability Curvature." Proceedings of the 40th International Conference on Machine Learning.
Solaiman, I., Brundage, M., Clark, J., et al. (2019). "Release Strategies and the Social Impacts of Language Models." OpenAI Report.
Gehrmann, S., Strobelt, H., Rush, A. M. (2019). "GLTR: Statistical Detection and Visualization of Generated Text." ACL System Demonstrations.
Bhattacharjee, A., Liu, H. (2023). "Fighting Fire with Fire: Can ChatGPT Detect AI-generated Text?" SIGKDD Explorations Newsletter.
GPTZero (2023). "How AI Text Detectors Work." 공개 방법론 문서.