Phát Hiện AI

Kiểm tra xem văn bản của bạn có phải do ChatGPT, Claude, Gemini hay GPT-4 viết không.

Miễn phí. Tức thì. Không cần đăng ký. Không tải lên. Chạy hoàn toàn trong trình duyệt của bạn.

✓ Phát hiện ChatGPT✓ Phát hiện Claude✓ GPT-4 / GPT-4o✓ 100% riêng tư

0 từ · 0 câu

Mọi phân tích chạy trong trình duyệt của bạn. Văn bản không bao giờ rời khỏi thiết bị của bạn.

Điểm khả năng là AI

0trên 100

Không chắc chắn

Các tín hiệu lẫn lộn. Không thể kết luận.

Dựa trên 6 tín hiệu

Công cụ phát hiện này hoạt động ra sao

Công cụ này kết hợp sáu tín hiệu thống kê thành một điểm khả năng là AI duy nhất từ 0 đến 100. Mỗi tín hiệu được tính cục bộ trong trình duyệt của bạn bằng các phương pháp phân tích văn bản đã được khẳng định. Các tín hiệu được gán trọng số theo mức độ đáng tin cậy khi phân biệt văn bản do AI tạo với văn bản của con người trong tài liệu nghiên cứu.

Độ biến thiên độ dài câu (30%) đo hệ số biến thiên của độ dài câu. Văn bản của con người dao động giữa câu ngắn và dài; đầu ra của AI đồng đều hơn. Đa dạng từ vựng (20%) dùng tỷ lệ type-token với cửa sổ 100 từ. Phát hiện sáo ngữ (20%) quét các cụm AI quen thuộc như "đào sâu vào", "trong thời đại số ngày nay" và "tóm lại". Hồ sơ dấu câu (15%) theo dõi mật độ gạch ngang dài, chấm phẩy và dấu phẩy Oxford. Cấu trúc câu (10%) xem xét sự đa dạng phần mở đầu và tỷ lệ thể bị động. Lặp lại (5%) đếm các cụm 3 từ và 4 từ bị lặp.

Công cụ được hiệu chỉnh để ưu tiên dương tính giả hơn âm tính giả ở đầu thấp của thang điểm: điểm 30 vẫn nghĩa là "nghiêng về người" chứ không phải "chắc chắn là người". Hãy coi kết luận là điểm khởi đầu, không phải phán quyết cuối cùng.

Một ước lượng, không phải phán quyết

Đây là ước tính thống kê, không phải bằng chứng. Phát hiện AI vốn không chắc chắn. Các công cụ như thế này có thể cho dương tính giả với văn bản học thuật, tiếng Anh không phải bản ngữ, tài liệu kỹ thuật và văn phong trang trọng. Đừng dùng nó làm cơ sở duy nhất để cáo buộc đạo văn hay gian lận học thuật.

Trả lời nhanh

Dán ít nhất 50 từ. Công cụ tính sáu tín hiệu thống kê (độ bùng nổ, độ đa dạng từ vựng, cụm sáo rỗng, dấu câu, cấu trúc câu, lặp lại) và kết hợp chúng thành điểm khả năng AI từ 0 đến 100. Độ chính xác của phương pháp suy luận khoảng 65 đến 75 phần trăm. Hãy coi kết quả là điểm khởi đầu, không phải bằng chứng.

Cách Phát Hiện AI Hoạt Động

Các công cụ phát hiện AI theo phương pháp suy luận không "đọc" văn bản của bạn. Chúng đếm các đặc điểm bề mặt thường khác nhau giữa văn bản của con người và của AI. Không đặc điểm đơn lẻ nào tự nó là dấu hiệu, đó là lý do các công cụ phát hiện đáng tin cậy kết hợp nhiều tín hiệu. Dưới đây là sáu tín hiệu mà công cụ này dùng.

1. Độ Bùng Nổ

Độ bùng nổ đo sự biến thiên độ dài câu trong một đoạn văn. Con người tự nhiên dao động giữa câu rất ngắn (3 đến 6 từ) và câu dài (25 đến 40 từ). Các mô hình ngôn ngữ lớn, được huấn luyện để tối ưu sự trôi chảy và rõ ràng, tạo ra các câu tập trung quanh mức trung bình 15 đến 22 từ với độ biến thiên thấp. Công cụ tính hệ số biến thiên: giá trị trên 0,6 nghiêng về con người, dưới 0,3 nghiêng về AI. Độ bùng nổ là tín hiệu mạnh nhất trong hầu hết các chuẩn nghiên cứu, đó là lý do chúng tôi tính trọng số 30 phần trăm.

2. Độ Đa Dạng Từ Vựng

Độ đa dạng từ vựng được đo bằng tỷ lệ loại-token: số từ duy nhất chia cho tổng số từ. Để ổn định chỉ số theo độ dài văn bản, chúng tôi dùng cửa sổ trượt 100 từ và tính trung bình tỷ lệ loại-token của mỗi cửa sổ. Văn bản của con người thường nằm ở mức 0,65 đến 0,80. Đầu ra AI thường tập trung ở 0,55 đến 0,65, phản ánh xu hướng dùng lại từ vựng trong một đoạn văn của mô hình. Trọng số: 20 phần trăm.

3. Phát Hiện Cụm Sáo Rỗng N-gram

Chúng tôi quét một danh sách được tuyển chọn gồm các cụm mà mô hình AI lạm dụng: "in today's digital age", "it is important to note", "delve into", "navigate the complexities", "in conclusion", "furthermore", "moreover", "additionally", và các cụm khác. Những cụm này tự nó không sai, nhưng mật độ của chúng trong một đoạn văn là tín hiệu mạnh. Một cụm trên mỗi 50 từ đẩy điểm về phía AI. Trọng số: 20 phần trăm.

4. Hồ Sơ Dấu Câu

Các mô hình AI, đặc biệt là dòng GPT-4, lạm dụng gạch ngang dài (ký tự dấu gạch dài). Hầu hết người viết là con người dùng gạch ngang dài rất tiết kiệm. Công cụ đếm số gạch ngang dài trên mỗi 100 từ, mật độ dấu chấm phẩy và tỷ lệ dùng dấu phẩy Oxford. Một đoạn văn có ba gạch ngang dài trong 200 từ tự nó là dấu hiệu AI mạnh. Trọng số: 15 phần trăm.

5. Cấu Trúc Câu

Hai đặc điểm cấu trúc: tần suất các câu bắt đầu bằng cùng một từ (biến thiên thấp nghiêng về AI) và tần suất xuất hiện câu bị động (tỷ lệ cao nghiêng về AI). Công cụ phát hiện ước lượng câu bị động bằng cách tìm động từ "be" (was, were, is, are, been, being) theo sau trong vòng ba từ bởi một phân từ quá khứ có khả năng. Trọng số: 10 phần trăm.

6. Sự Lặp Cụm Từ

Chúng tôi trích xuất mọi cụm 3 từ và 4 từ trong văn bản và đếm số lần lặp. Các cụm xuất hiện từ ba lần trở lên đẩy điểm về phía AI. Con người thường diễn đạt lại; AI lặp lại theo mẫu. Đây là tín hiệu yếu nhất trong sáu tín hiệu (5 phần trăm) vì văn bản hợp lệ thường lặp lại thuật ngữ, nhưng nó bổ sung thông tin hữu ích ở các trường hợp ranh giới.

Độ Chính Xác và Hạn Chế

Các đánh giá độc lập về công cụ phát hiện AI theo phương pháp suy luận (GPTZero, ZeroGPT, Copyleaks, và các công cụ phát hiện học thuật như DetectGPT và GLTR) liên tục cho kết quả trong khoảng độ chính xác 65 đến 80 phần trăm trên văn bản đa lĩnh vực. Cùng các nghiên cứu cho thấy đầu ra AI đã chỉnh sửa nhẹ có thể làm tỷ lệ phát hiện tụt xuống dưới 50 phần trăm. Không có công cụ phát hiện nào, trả phí hay miễn phí, vượt qua 90 phần trăm trên văn bản đối nghịch.

Công cụ của chúng tôi sẽ cho kết quả dương tính giả với:

Văn bản học thuật - độ dài câu đồng đều, từ vựng trang trọng, ngôn ngữ dè dặt.
Tiếng Anh không phải bản ngữ - vốn từ làm việc nhỏ hơn, cấu trúc lặp lại nhiều hơn.
Tài liệu kỹ thuật - câu bị động, thuật ngữ lặp lại, phong cách trang trọng.
Văn bản doanh nghiệp hoặc pháp lý - cụm từ sáo rỗng, dấu phẩy Oxford, dùng dấu chấm phẩy.
Văn bản được chỉnh sửa kỹ hoặc theo mẫu - các mẫu trông máy móc vì chúng vốn vậy.

Hãy dùng điểm số như điểm khởi đầu cho thảo luận, không bao giờ như một kết luận. Với các quyết định quan trọng (kỷ luật học thuật, tuyển dụng), hãy kết hợp công cụ phát hiện với bằng chứng khác: lịch sử bản nháp, mẫu viết, trao đổi trực tiếp về nội dung.

Khi Nào Nên Dùng Phát Hiện AI

Có những trường hợp dùng thực tế cho một công cụ phát hiện theo phương pháp suy luận, miễn là bạn hiểu giới hạn:

Giáo viên kiểm tra bài luận của học sinh để sàng lọc nhanh trước khi xem xét sâu hơn. Điểm cao báo hiệu "xem kỹ hơn", không phải "trượt".
Biên tập viên xác minh công việc của cộng tác viên để xác nhận người viết đang mang lại giọng văn con người mà họ được thuê.
Nhà tuyển dụng xem xét thư xin việc như một đầu vào trong nhiều đầu vào. Điểm 95 trên thư xin việc là dấu hiệu vàng đáng theo dõi.
Tự kiểm tra trước khi xuất bản để bắt các đoạn đọc như ChatGPT và viết lại theo giọng của bạn.
Kiểm toán tính xác thực nội dung khi xem lại một loạt bài nộp, bài blog hoặc nội dung sản phẩm.

So Sánh Với Các Công Cụ Phát Hiện Khác

Có một số công cụ phát hiện AI nổi tiếng, mỗi công cụ có những đánh đổi khác nhau:

GPTZero dùng độ rối và độ bùng nổ với các mô hình độc quyền. Có gói miễn phí với giới hạn, gói trả phí cho khối lượng cao hơn.
Originality.ai chỉ có trả phí và hướng đến nhà xuất bản SEO. Nó dùng một bộ phân loại được huấn luyện riêng.
ZeroGPT miễn phí với một tầng trả phí. Dùng độ rối và độ bùng nổ tương tự GPTZero.
Copyleaks tập trung vào doanh nghiệp với phát hiện đạo văn cùng phát hiện AI trong một sản phẩm.

Công cụ của chúng tôi miễn phí, chạy hoàn toàn trong trình duyệt, không cần đăng ký và không bao giờ nhìn thấy văn bản của bạn. Nó không tuyên bố vượt trội hơn các lựa chọn trả phí. Lợi ích là quyền riêng tư và không có rào cản. Nếu bạn cần độ tin cậy cao hơn cho một quyết định quan trọng đơn lẻ, một công cụ phát hiện trả phí là hợp lý. Cho việc sàng lọc hằng ngày, một công cụ suy luận minh bạch thường là đủ.

Câu Hỏi Thường Gặp

Công cụ kết hợp sáu tín hiệu thống kê thành điểm khả năng AI từ 0 đến 100: độ bùng nổ (sự biến thiên độ dài câu), độ đa dạng từ vựng, các cụm từ sáo rỗng phổ biến của AI, hồ sơ dấu câu (mật độ gạch ngang dài, dấu chấm phẩy, dấu phẩy Oxford), cấu trúc câu (sự biến thiên ở phần mở đầu và tỷ lệ câu bị động), và sự lặp lại cụm 3 từ và 4 từ. Mỗi tín hiệu được tính trọng số dựa trên mức độ đáng tin cậy của nó trong việc phân biệt văn bản AI với văn bản của con người trong các tài liệu nghiên cứu. Toàn bộ tính toán diễn ra trong trình duyệt của bạn.

Không. Không có công cụ phát hiện AI nào chính xác 100%, kể cả các dịch vụ trả phí như GPTZero, Originality.ai và ZeroGPT. Các nghiên cứu độc lập cho thấy các công cụ phát hiện theo phương pháp suy luận đạt độ chính xác khoảng 65 đến 75 phần trăm trên văn bản hỗn hợp. Điểm số của chúng tôi là điểm khởi đầu, không phải kết luận. Hãy coi điểm dưới 30 là 'nghiêng về con người', 30 đến 70 là 'không chắc chắn', và trên 70 là 'nghiêng về AI'. Đừng bao giờ dùng điểm phát hiện làm cơ sở duy nhất để cáo buộc đạo văn hay gian lận học thuật.

Các tín hiệu mà chúng tôi theo dõi (các cụm sáo rỗng như 'delve into', dùng nhiều gạch ngang dài, độ dài câu đồng đều) rõ rệt nhất trong đầu ra của GPT-3.5 và GPT-4. Claude có xu hướng tạo ra độ dài câu đa dạng hơn và ít cụm từ mẫu hơn, nên văn bản của nó thường có điểm thấp hơn. Gemini nằm ở giữa. Công cụ không được điều chỉnh riêng cho bất kỳ mô hình cụ thể nào. Nó tìm các dấu hiệu thống kê chung của văn bản do LLM tạo ra, đó là lý do đầu ra AI đã được chỉnh sửa hoặc dùng lời nhắc kỹ lưỡng có thể tụt xuống dưới ngưỡng.

Các công cụ phát hiện theo phương pháp suy luận tìm các mẫu thống kê, không phải tác giả. Một số loại văn bản có chung mẫu với AI: bài báo học thuật (độ dài câu đồng đều, từ vựng trang trọng), tiếng Anh không phải bản ngữ (vốn từ hạn chế, cấu trúc lặp lại), tài liệu kỹ thuật (câu bị động, thuật ngữ lặp lại), và văn bản doanh nghiệp hoặc pháp lý (cụm từ sáo rỗng, dấu câu trang trọng). Nếu bạn viết theo phong cách điềm tĩnh, nhất quán, bạn có thể nhận điểm cao hơn mong đợi. Công cụ phát hiện không 'biết' gì ngoài các đặc điểm bề mặt mà nó đếm.

Không. Toàn bộ phân tích chạy cục bộ trong trình duyệt của bạn bằng JavaScript. Văn bản của bạn không bao giờ rời khỏi thiết bị, không được tải lên, không được ghi lại và không được dùng để huấn luyện bất kỳ mô hình nào. Bạn có thể kiểm chứng bằng cách mở công cụ phát triển của trình duyệt và quan sát tab mạng trong khi phân tích chạy, sẽ không có lưu lượng mạng nào. Chúng tôi cũng không lưu văn bản của bạn trên máy chủ vì chúng tôi không có quyền truy cập vào nó ngay từ đầu.

Sáu tín hiệu: (1) Độ bùng nổ, hệ số biến thiên của độ dài câu. (2) Độ đa dạng từ vựng, đo bằng tỷ lệ loại-token với cửa sổ trượt 100 từ. (3) Phát hiện cụm sáo rỗng N-gram, quét các cụm AI mẫu như 'in today's digital age' và 'it is important to note'. (4) Hồ sơ dấu câu, theo dõi mật độ gạch ngang dài, dấu chấm phẩy và dấu phẩy Oxford. (5) Cấu trúc câu, đo sự biến thiên phần mở đầu và tỷ lệ câu bị động. (6) Sự lặp cụm từ, đếm các cụm 3 từ và 4 từ xuất hiện từ ba lần trở lên.

Có, và rất dễ. Chỉnh sửa nhẹ đầu ra AI (thay các cụm sáo rỗng, ngắt các câu dài đồng đều, thêm giọng văn cá nhân và dạng viết tắt) sẽ làm giảm đáng kể điểm số. Đây là hạn chế cơ bản của mọi công cụ phát hiện theo phương pháp suy luận. Cùng những chỉnh sửa lừa được công cụ của chúng tôi cũng sẽ lừa được GPTZero và ZeroGPT. Nếu bạn cần xác minh tác giả cho một quyết định quan trọng, hãy kết hợp công cụ phát hiện với bằng chứng khác: lịch sử viết, xác minh trực tiếp, lịch sử bản nháp trong Google Docs hoặc Word, và trao đổi trực tiếp về nội dung.

Nguồn

Mitchell, E., Lee, Y., Khazatsky, A., Manning, C. D., Finn, C. (2023). "DetectGPT: Zero-Shot Machine-Generated Text Detection using Probability Curvature." Proceedings of the 40th International Conference on Machine Learning.
Solaiman, I., Brundage, M., Clark, J., et al. (2019). "Release Strategies and the Social Impacts of Language Models." OpenAI Report.
Gehrmann, S., Strobelt, H., Rush, A. M. (2019). "GLTR: Statistical Detection and Visualization of Generated Text." ACL System Demonstrations.
Bhattacharjee, A., Liu, H. (2023). "Fighting Fire with Fire: Can ChatGPT Detect AI-generated Text?" SIGKDD Explorations Newsletter.
GPTZero (2023). "How AI Text Detectors Work." Tài liệu phương pháp công khai.

Công cụ liên quan