كاشف الذكاء الاصطناعي
تحقق إن كان نصك مكتوبا بواسطة ChatGPT أو Claude أو Gemini أو GPT-4.
مجاني. فوري. بدون تسجيل. بدون رفع. يعمل بالكامل في متصفحك.
يتم كل التحليل في متصفحك. لا يغادر نصك جهازك أبدا.
الإشارات متباينة. لا يمكن الحسم.
استنادا إلى 6 إشارات
كيف يعمل هذا الكاشف
تجمع هذه الأداة بين ست إشارات إحصائية في درجة واحدة لاحتمالية الذكاء الاصطناعي من 0 إلى 100. تُحسب كل إشارة محليا في متصفحك باستخدام أساليب راسخة لتحليل النصوص. تُرجّح الإشارات بحسب مدى موثوقيتها في تمييز النص المولّد بالذكاء الاصطناعي عن الكتابة البشرية في الأدبيات البحثية.
تباين طول الجمل (30%) يقيس معامل التباين في أطوال الجمل. تتأرجح الكتابة البشرية بين الجمل القصيرة والطويلة؛ بينما مخرجات الذكاء الاصطناعي أكثر تماثلا. تنوع المفردات (20%) يستخدم نسبة النوع إلى الرمز بنافذة من 100 كلمة. كشف العبارات المبتذلة (20%) يبحث عن عبارات الذكاء الاصطناعي النمطية مثل "الغوص في" و"في عصرنا الرقمي الحالي" و"في الختام". ملف علامات الترقيم (15%) يتتبع كثافة الشرطة الطويلة والفاصلة المنقوطة وفاصلة أكسفورد. بنية الجملة (10%) ينظر في تنوع البدايات ونسبة المبني للمجهول. التكرار (5%) يحصي العبارات المكررة من 3 و4 كلمات.
تمت معايرة الكاشف لتفضيل الإيجابيات الكاذبة على السلبيات الكاذبة في الطرف المنخفض من الدرجة: درجة 30 لا تزال تعني "يميل إلى البشري" وليس "بشري قطعا". تعامل مع النتيجة كنقطة بداية، لا كحكم نهائي.
هذا تقدير إحصائي وليس دليلا. كشف الذكاء الاصطناعي غير مؤكد بطبيعته. قد تنتج أدوات كهذه إيجابيات كاذبة للكتابة الأكاديمية وغير الناطقين بالإنجليزية والوثائق التقنية والأساليب الرسمية. لا تستخدم هذا كأساس وحيد لاتهامات الانتحال أو عدم النزاهة الأكاديمية.
إجابة سريعة
الصق 50 كلمة على الأقل. تحسب الأداة ست إشارات إحصائية (التباين، وتنوع المفردات، والعبارات المبتذلة، وعلامات الترقيم، وبنية الجملة، والتكرار) وتجمعها في درجة احتمالية ذكاء اصطناعي من 0 إلى 100. الدقة الإرشادية نحو 65 إلى 75 بالمئة. عامل النتائج كنقطة بداية لا كدليل.
كيف يعمل كشف الذكاء الاصطناعي
الكواشف الإرشادية للذكاء الاصطناعي لا تقرأ نصك. إنها تحصي السمات السطحية التي تميل إلى الاختلاف بين الكتابة البشرية وكتابة الذكاء الاصطناعي. لا تشكل أي سمة منفردة دليلا قاطعا بذاتها، ولذلك تجمع الكواشف القوية بين عدة إشارات. فيما يلي الإشارات الست التي تستخدمها هذه الأداة.
1. التباين
يقيس التباين تغير طول الجمل عبر النص. يتأرجح البشر بطبيعتهم بين جمل قصيرة جدا (3 إلى 6 كلمات) وأخرى طويلة (25 إلى 40 كلمة). تنتج نماذج اللغة الكبيرة، المُحسنة للطلاقة والوضوح، جملا تتجمع حول متوسط 15 إلى 22 كلمة باختلاف منخفض. تحسب الأداة معامل الاختلاف: قيمة فوق 0.6 تميل إلى بشرية، وتحت 0.3 تميل إلى ذكاء اصطناعي. التباين أقوى إشارة منفردة في معظم معايير الأبحاث، ولذلك نوزنه بنسبة 30 بالمئة.
2. تنوع المفردات
يقاس تنوع المفردات بنسبة النوع إلى الرمز: الكلمات الفريدة مقسومة على إجمالي الكلمات. لتثبيت المقياس عبر أطوال النصوص، نستخدم نافذة متحركة من 100 كلمة ونحسب متوسط النسبة لكل نافذة. تستقر الكتابة البشرية عادة بين 0.65 و 0.80 على هذا المقياس. تتجمع مخرجات الذكاء الاصطناعي غالبا بين 0.55 و 0.65، مما يعكس ميل النموذج إلى إعادة استخدام المفردات داخل النص. الوزن: 20 بالمئة.
3. كشف العبارات المبتذلة (n-gram)
نمسح قائمة منتقاة من العبارات التي تفرط نماذج الذكاء الاصطناعي في استخدامها: in today's digital age و it is important to note و delve into و navigate the complexities و in conclusion و furthermore و moreover و additionally وغيرها. هذه العبارات ليست خاطئة بذاتها، لكن كثافتها في النص إشارة قوية. واحدة لكل 50 كلمة تدفع الدرجة نحو الذكاء الاصطناعي. الوزن: 20 بالمئة.
4. ملف علامات الترقيم
تفرط نماذج الذكاء الاصطناعي، خاصة عائلة GPT-4، في استخدام الشرطة الطويلة (em-dash). يستخدمها معظم الكتاب البشر بحذر. تحصي الأداة عدد الشرطات الطويلة لكل 100 كلمة، وكثافة الفاصلة المنقوطة، ومعدل استخدام فاصلة أكسفورد. نص يحوي ثلاث شرطات طويلة في 200 كلمة علامة ذكاء اصطناعي قوية بذاتها. الوزن: 15 بالمئة.
5. بنية الجملة
سمتان بنيويتان: كم مرة تبدأ الجمل بالكلمة نفسها (التنوع المنخفض يميل إلى ذكاء اصطناعي) وكم مرة يظهر المبني للمجهول (المعدل المرتفع يميل إلى ذكاء اصطناعي). يقرب الكاشف المبني للمجهول بالبحث عن أفعال الكينونة (was, were, is, are, been, being) متبوعة خلال ثلاث كلمات باسم مفعول محتمل. الوزن: 10 بالمئة.
6. تكرار العبارات
نستخرج كل عبارة من 3 و 4 كلمات من النص ونعدّ التكرارات. العبارات التي تظهر ثلاث مرات أو أكثر تدفع الدرجة نحو الذكاء الاصطناعي. يعيد البشر الصياغة عادة، بينما يدور الذكاء الاصطناعي على الأنماط. هذه أضعف الإشارات الست (5 بالمئة) لأن الكتابة المشروعة تكرر المصطلحات كثيرا، لكنها تضيف معلومات مفيدة على الهوامش.
الدقة والقيود
تستقر التقييمات المستقلة للكواشف الإرشادية للذكاء الاصطناعي (GPTZero و ZeroGPT و Copyleaks، والكواشف الأكاديمية مثل DetectGPT و GLTR) باستمرار في نطاق دقة 65 إلى 80 بالمئة على النصوص متعددة المجالات. تُظهر الدراسات نفسها أن مخرجات الذكاء الاصطناعي المحررة قليلا يمكن أن تخفض معدل الكشف تحت 50 بالمئة. لا يوجد كاشف، مدفوع أو مجاني، يتجاوز 90 بالمئة على النصوص العدائية.
ستنتج أداتنا نتائج إيجابية كاذبة في حالات:
- الكتابة الأكاديمية - طول جمل متجانس، مفردات رسمية، لغة تحوطية.
- الإنجليزية لغير الناطقين بها - مفردات عاملة أصغر، بنى متكررة أكثر.
- الوثائق التقنية - المبني للمجهول، تكرار المصطلحات، أسلوب رسمي.
- النصوص المؤسسية أو القانونية - عبارات مبتذلة، فواصل أكسفورد، استخدام الفاصلة المنقوطة.
- الكتابة شديدة التحرير أو القائمة على القوالب - أنماط تبدو آلية لأنها كذلك.
استخدم الدرجة كبداية للنقاش، لا كحكم نهائي أبدا. للقرارات عالية المخاطر (الانضباط الأكاديمي، التوظيف)، اقرن الكاشف بأدلة أخرى: تاريخ المسودات، وعينات الكتابة، والحديث وجها لوجه حول المحتوى.
متى تستخدم كشف الذكاء الاصطناعي
توجد حالات استخدام حقيقية لكاشف إرشادي، ما دمت تفهم الحدود:
- المعلمون يفحصون مقالات الطلاب لفرز سريع قبل مراجعة أعمق. الدرجة العالية تعني انظر عن قرب، لا ارسب.
- المحررون يتحققون من العمل الحر لتأكيد أن الكاتب يقدم الصوت البشري الذي وُظف لأجله.
- مسؤولو التوظيف يراجعون خطابات التغطية كأحد المدخلات بين عدة. درجة 95 على خطاب تغطية علامة صفراء تستحق المتابعة.
- الفحص الذاتي قبل النشر لالتقاط الفقرات التي تقرأ كأنها ChatGPT وإعادة كتابتها بصوتك.
- مراجعات أصالة المحتوى عند مراجعة قائمة بالطلبات أو مقالات المدونة أو نسخ المنتجات.
المقارنة مع الكواشف الأخرى
توجد عدة كواشف ذكاء اصطناعي معروفة، لكل منها مفاضلاته:
- GPTZero يستخدم الحيرة (perplexity) والتباين مع نماذج خاصة. طبقة مجانية محدودة وخطط مدفوعة للحجم الأكبر.
- Originality.ai مدفوع فقط وموجه لناشري تحسين محركات البحث. يستخدم مصنفا مدربا خصيصا.
- ZeroGPT مجاني مع طبقة مدفوعة. يستخدم الحيرة والتباين بشكل مشابه لـ GPTZero.
- Copyleaks موجه للمؤسسات مع كشف الانتحال والذكاء الاصطناعي في منتج واحد.
أداتنا مجانية، تعمل بالكامل في المتصفح، لا تتطلب تسجيلا، ولا ترى نصك أبدا. لا تدعي أنها تتفوق على الخيارات المدفوعة. الفائدة هي الخصوصية وانعدام العوائق. إن احتجت ثقة أعلى لقرار حرج واحد، فالكاشف المدفوع معقول. للفحص اليومي، الأداة الإرشادية الشفافة تكفي عادة.
تجمع الأداة ست إشارات إحصائية في درجة احتمالية ذكاء اصطناعي من 0 إلى 100: التباين (تغير طول الجمل)، وتنوع المفردات، وعبارات الذكاء الاصطناعي المبتذلة الشائعة، وملف علامات الترقيم (كثافة الشرطة والفاصلة المنقوطة وفاصلة أكسفورد)، وبنية الجملة (تنوع البدايات ونسبة المبني للمجهول)، وتكرار العبارات من 3 و 4 كلمات. تُوزن كل إشارة بحسب مدى موثوقيتها في التمييز بين كتابة الذكاء الاصطناعي والكتابة البشرية في الأبحاث. تتم كل العمليات الحسابية في متصفحك.
لا. لا يوجد كاشف ذكاء اصطناعي دقيق 100%، بما في ذلك الخدمات المدفوعة مثل GPTZero و Originality.ai و ZeroGPT. تُظهر الدراسات المستقلة أن الكواشف الإرشادية تعمل بدقة 65 إلى 75 بالمئة تقريبا على النصوص المختلطة. درجتنا نقطة بداية وليست حكما نهائيا. عامل الدرجات تحت 30 على أنها أقرب إلى بشرية، و 30 إلى 70 غير مؤكدة، وفوق 70 أقرب إلى ذكاء اصطناعي. لا تستخدم درجة كاشف أبدا كأساس وحيد لاتهامات بالانتحال أو عدم النزاهة الأكاديمية.
الإشارات التي نتتبعها (عبارات مبتذلة مثل delve into، والإفراط في استخدام الشرطة الطويلة، وأطوال الجمل المتجانسة) تكون أوضح ما تكون في مخرجات GPT-3.5 و GPT-4. يميل Claude (كلود) إلى إنتاج أطوال جمل أكثر تنوعا وعبارات جاهزة أقل، فيحصل نصه غالبا على درجات أقل. يقع Gemini (جيميني) في المنتصف. الأداة غير مضبوطة على نموذج محدد. تبحث عن البصمات الإحصائية العامة للنص المولد بنماذج اللغة، ولهذا قد ينزل النص المحرر أو المُولد بأوامر دقيقة تحت العتبة.
تبحث الكواشف الإرشادية عن أنماط إحصائية لا عن المؤلف. عدة أنواع من الكتابة تشترك في أنماط مع الذكاء الاصطناعي: الأوراق الأكاديمية (طول جمل متجانس، مفردات رسمية)، والإنجليزية لغير الناطقين بها (مفردات محدودة، بنى متكررة)، والوثائق التقنية (المبني للمجهول، تكرار المصطلحات)، والنصوص المؤسسية أو القانونية (عبارات مبتذلة، علامات ترقيم رسمية). إن كنت تكتب بأسلوب متزن ومتسق فقد تحصل على درجة أعلى مما تتوقع. الكاشف لا يعرف شيئا يتجاوز السمات السطحية التي يحصيها.
لا. يجري كل التحليل محليا في متصفحك باستخدام JavaScript. لا يغادر نصك جهازك أبدا، ولا يُرفع، ولا يُسجل، ولا يُستخدم لتدريب أي نموذج. يمكنك التحقق من ذلك بفتح أدوات مطوري المتصفح ومراقبة علامة تبويب الشبكة أثناء التحليل، فلا توجد حركة شبكة. كما أننا لا نخزن نصك على خوادمنا لأننا لا نملك الوصول إليه من الأساس.
ست إشارات: (1) التباين، أي معامل اختلاف أطوال الجمل. (2) تنوع المفردات، مقاسا بنسبة النوع إلى الرمز مع نافذة متحركة من 100 كلمة. (3) كشف العبارات المبتذلة بالـ n-gram، بمسح العبارات الجاهزة مثل in today's digital age و it is important to note. (4) ملف علامات الترقيم، بتتبع كثافة الشرطة الطويلة والفاصلة المنقوطة وفاصلة أكسفورد. (5) بنية الجملة، بقياس تنوع البدايات ونسبة المبني للمجهول. (6) تكرار العبارات، بعدّ عبارات الـ 3 و 4 كلمات التي تظهر ثلاث مرات أو أكثر.
نعم، وبسهولة. التحرير الخفيف لمخرجات الذكاء الاصطناعي (استبدال العبارات المبتذلة، وتقطيع الجمل الطويلة المتجانسة، وإضافة صوت شخصي واختصارات) يخفض الدرجة بشكل كبير. هذا قيد جوهري في كل كاشف إرشادي. التعديلات نفسها التي تخدع أداتنا تخدع GPTZero و ZeroGPT أيضا. إن احتجت إلى التحقق من المؤلف لقرار عالي المخاطر، فاجمع بين كاشف وأدلة أخرى: تاريخ الكتابة، والتحقق وجها لوجه، وسجل المسودات في Google Docs أو Word، والحديث المباشر حول المحتوى.
المصادر
- Mitchell, E., Lee, Y., Khazatsky, A., Manning, C. D., Finn, C. (2023). "DetectGPT: Zero-Shot Machine-Generated Text Detection using Probability Curvature." Proceedings of the 40th International Conference on Machine Learning.
- Solaiman, I., Brundage, M., Clark, J., et al. (2019). "Release Strategies and the Social Impacts of Language Models." OpenAI Report.
- Gehrmann, S., Strobelt, H., Rush, A. M. (2019). "GLTR: Statistical Detection and Visualization of Generated Text." ACL System Demonstrations.
- Bhattacharjee, A., Liu, H. (2023). "Fighting Fire with Fire: Can ChatGPT Detect AI-generated Text?" SIGKDD Explorations Newsletter.
- GPTZero (2023). "How AI Text Detectors Work." Public methodology documentation.