Jawaban Singkat
Sebagian besar pembaca dapat belajar mengenali ChatGPT dalam satu paragraf setelah melihat pola dinamai sekali. Panduan ini menjabarkan 12 tanda tangan spesifik, mengapa muncul, bagaimana Claude dan Gemini dibandingkan, dan di mana tanda-tanda menyesatkan. Untuk menguji paragraf terhadap sinyal yang sama yang digunakan guru, tempelkan ke alat Detektor AI kami.
Mengapa ChatGPT Memiliki Tanda Tangan Gaya
ChatGPT menulis seperti itu karena suatu alasan. OpenAI melatih model pada irisan teks internet dan buku yang luas, lalu menyetelnya dengan Reinforcement Learning from Human Feedback (RLHF). Penilai manusia secara konsisten lebih menyukai respons yang sopan, seimbang, terstruktur, dan dilindungi. Model mempelajari menulis seperti itu secara default.
Preferensi RLHF yang sama untuk output membantu dan tidak berbahaya melatih model untuk menggunakan kosakata aman, simetri hati-hati, dan register sopan. Hasilnya adalah teks yang terbaca kompeten tetapi dapat diprediksi. Sidik jari muncul di GPT-3.5, GPT-4, dan GPT-4o, dengan setiap versi yang lebih baru sedikit kurang jelas tetapi tidak pernah tak terlihat.
12 Tanda ChatGPT
1. Kecanduan Em-Dash
ChatGPT menyukai karakter em-dash. Sampel independen output GPT-4 rata-rata dua hingga empat em-dash per 500 kata. Tulisan sarjana tipikal memiliki kurang dari satu. Cari frasa parenthetical yang dipisahkan dengan em-dash di mana koma atau titik akan menyelesaikan pekerjaan. Contoh: Proyek tertunda, dipisahkan dengan em-dash di sekitar meskipun usaha terbaik tim, hingga akhir Agustus.
2. Membuka Dengan Tentu! atau Saya Di Sini untuk Membantu
ChatGPT tidak bisa berhenti sopan. Ketika diberi tugas, sering membuka dengan Tentu!, Tentu saja!, Pasti!, atau Saya di sini untuk membantu. Bahkan ketika prompt meminta draf dan bukan balasan obrolan, sisa register asisten menyelinap masuk. Esai formal yang dibuka dengan afirmasi satu baris hampir selalu merupakan paste-dari-ChatGPT.
3. Menyelami
Kata kerja menyelami jarang dalam bahasa Inggris kasual. Pada 2024 begitu sering muncul dalam output ChatGPT sehingga peneliti menggunakan frekuensinya saja sebagai sinyal AI lemah. Jika tulisan 500 kata menggunakan menyelami sekali, itu bisa kebetulan. Dua kali mencurigakan. Tiga kali adalah sidik jari.
4. Permadani
Saudara dekat menyelami. ChatGPT menjangkau permadani untuk menggambarkan apa pun yang kompleks atau saling terhubung: permadani pengalaman, permadani budaya, permadani suara yang kaya. Metafora ini fungsional tetapi model bersandar padanya jauh lebih keras daripada penulis manusia.
5. Menavigasi Kompleksitas
Frasa menavigasi kompleksitas (atau menavigasi tantangan, menavigasi nuansa) muncul kira-kira di satu dari dua puluh esai ChatGPT tentang topik sosial. Itu adalah hedge yang menandakan kedalaman tanpa berkomitmen pada klaim spesifik. Penulis manusia asli biasanya memilih kata kerja konkret sebagai gantinya.
6. Di Era Digital Saat Ini
Hampir setiap prompt tentang teknologi, masyarakat, atau budaya memicu di era digital saat ini sebagai pembuka. Varian termasuk di dunia kita yang semakin terhubung dan di era modern. Frasa tidak membawa informasi. Itu ada untuk melembutkan model ke paragraf pembuka.
7. Bahasa Hedging
ChatGPT terus melindungi. Bisa diperdebatkan bahwa, seseorang mungkin mengatakan, beberapa ahli percaya, ini bisa dilihat sebagai. Hedging adalah sisa RLHF: penilai manusia lebih menyukai jawaban yang tidak berkomitmen pada klaim kuat. Hasilnya adalah prosa yang terdengar hati-hati tetapi jarang mengambil posisi.
8. Panjang Paragraf Seragam
Paragraf ChatGPT berkumpul di sekitar tiga hingga lima kalimat masing-masing. Buka respons lima paragraf dan ukur: sebagian besar paragraf akan mendarat dalam satu kalimat satu sama lain. Penulis manusia berayun dari paragraf satu baris ke paragraf sepuluh baris tergantung pada penekanan. Ritme metronom ChatGPT adalah salah satu tanda non-kosakata paling keras.
9. Struktur Daftar
Saat ragu, ChatGPT membuat bullet. Bahkan respons prosa terinterupsi oleh daftar bernomor atau berbutir, kadang untuk tiga item yang akan terbaca lebih baik sebagai satu kalimat. Gemini lebih buruk pada dimensi ini, tetapi ChatGPT masih jauh di atas baseline manusia.
10. Argumen Simetris
Setiap klaim mendapat counter. Di satu sisi, di sisi lain, sementara X benar, Y juga harus dipertimbangkan. Simetri begitu konsisten sehingga peneliti telah menggunakan keseimbangan-argumen sebagai sidik jari model. Penulis manusia lebih sering memilih sisi.
11. Menutup Dengan Sebagai Kesimpulan
Esai manusia nyata jarang menggunakan frasa literal sebagai kesimpulan. ChatGPT menggunakannya sebagai transisi penutup default. Varian termasuk untuk merangkum, secara ringkas, akhirnya. Paragraf penutup kemudian mengulangi pendahuluan daripada menambahkan wawasan baru.
12. Nada yang Terlalu Sopan di Setiap Register
Apakah prompt meminta tweet sinis, surat lamaran formal, atau postingan blog kasual, ChatGPT default ke register sopan, netral, profesional. Sinisme tulus, opini tajam, dan frustrasi tanpa dilindungi jarang dalam output default. Datarnya adalah pemberi tanda. Penulis nyata memiliki suasana hati. ChatGPT memiliki satu suasana hati.
ChatGPT vs Claude vs Gemini: Perbedaan Gaya
Tiga besar model frontier berbagi baseline burstiness rendah dan pengulangan kosakata, tetapi masing-masing memiliki sidik jari sendiri.
- ChatGPT: Bertele-tele, banyak em-dash, rentan hedging, pembuka sopan, menyelami dan permadani, akhiran sebagai kesimpulan.
- Claude: Tempo hati-hati, klise tetap lebih sedikit, lebih banyak koreksi diri (misalnya, sebenarnya, pada refleksi), masih panjang paragraf seragam, lebih suka koma daripada em-dash.
- Gemini: Bernomor, banyak tabel, didorong daftar, sering membuka dengan jawaban langsung satu baris lalu bullet, sidik jari struktural kuat.
- Ketiganya berbagi: Burstiness rendah, pengulangan kosakata dalam 500 kata, argumen simetris, contoh generik.
Mendeteksi GPT-4 vs GPT-3.5
GPT-3.5 memakai tandanya di lengan. Struktur esai lima paragraf, dua menyelami, empat em-dash, dan akhiran sebagai kesimpulan muncul dalam draf 500 kata tipikal. GPT-4 lebih sulit. Penggunaan em-dash sedikit turun, hedging lebih bernuansa, dan klise muncul lebih jarang. GPT-4o melembutkan pembuka sopan lebih jauh.
Tetapi sinyal statistik yang dalam tetap. Burstiness tetap rendah. Panjang paragraf tetap seragam. Penggunaan em-dash tetap meningkat. Tentu! masih menyelinap masuk. Peneliti yang menjalankan deteksi benchmark pada GPT-4o (Mitchell et al. dan pekerjaan lanjutan pada 2024) menemukan bahwa detektor terkuat masih menandai teks GPT-4o jauh di atas baseline manusia. Tanda-tanda bermigrasi, tetapi tidak menghilang.
Demo Langsung: Jalankan Teks Ini Melalui Detektor Kami
Berikut adalah sampel 110 kata yang ditulis oleh GPT-4 dari prompt tulis paragraf singkat tentang kerja jarak jauh:
Di era digital saat ini, kerja jarak jauh telah secara fundamental mengubah cara profesional menavigasi kompleksitas karier mereka. Sementara menawarkan permadani manfaat, termasuk peningkatan fleksibilitas dan kemampuan untuk menyelami keseimbangan kerja-hidup yang lebih sehat, juga menyajikan tantangan, seperti perasaan isolasi dan kesulitan memisahkan kehidupan pribadi dan profesional. Perusahaan harus mengadopsi kerangka kerja yang kuat untuk mendukung tim terdistribusi mereka, memanfaatkan alat komunikasi dan memupuk budaya kepercayaan. Akhirnya, masa depan pekerjaan terus berkembang, dan organisasi yang merangkul pergeseran ini sambil mengatasi kompleksitasnya akan berkembang di dunia yang semakin saling terhubung. Sebagai kesimpulan, kerja jarak jauh akan tetap ada.
Tempelkan paragraf itu ke Detektor AI kami dan vonis kembali Hampir Pasti AI dalam waktu kurang dari satu detik. Detektor menandai enam frasa klise (di era digital saat ini, menavigasi kompleksitas, permadani, menyelami, kerangka kerja yang kuat, memanfaatkan, terus berkembang, sebagai kesimpulan), burstiness rendah (kalimat berkumpul antara 18 dan 28 kata), dan simetri struktural (perkenalkan, daftar manfaat, daftar tantangan, simpulkan). Masing-masing adalah tanda dari daftar di atas.
Kapan Tanda-tanda Ini Menyesatkan
12 tanda menghasilkan false positive dalam tiga genre penting.
- Abstrak akademik. Abstrak jurnal formal, dilindungi, simetris, dan dikemas dengan kosakata aman. Mereka terlihat seperti ChatGPT karena ditulis dengan kendala yang sama: keringkasan, keseimbangan, dan netralitas.
- Dokumentasi teknis dan hukum. Spesifikasi, brief kebijakan, dan memo hukum menghargai hedging dan simetri dengan sengaja. Skor AI tinggi pada kontrak biasanya merupakan false positive.
- Penulis bahasa Inggris non-asli. Liang et al. (Stanford 2023) menemukan bahwa detektor GPT menandai 61% esai TOEFL oleh penutur bahasa Inggris non-asli sebagai dihasilkan AI. Kosakata formal, simetri hati-hati, dan hedging adalah karakteristik bahasa Inggris akademis bahasa kedua.
12 tanda paling dapat diandalkan pada esai siswa, draf blog, postingan sosial, salinan pemasaran, dan korespondensi pribadi. Gunakan sebagai sinyal untuk menyelidiki, bukan sebagai bukti sendiri. Jika Anda seorang guru atau editor, gabungkan beberapa tanda sebelum menarik kesimpulan. Jika Anda seorang penulis yang khawatir tentang false positive, baca panduan pendamping kami tentang cara membuat teks AI terlihat manusiawi untuk teknik yang memperbaiki sinyal yang mendasarinya, bukan hanya kata permukaan.
Pemeriksaan 30 Detik
Ketika Anda menduga ChatGPT menulis sesuatu, jalankan ini secara berurutan.
- Hitung karakter em-dash dalam 200 kata pertama.
- Pindai untuk menyelami, permadani, menavigasi, di era digital saat ini.
- Ukur varians panjang paragraf. Kluster ketat sekitar 3 hingga 5 kalimat adalah sinyal.
- Cari argumen simetris dan frasa sebagai kesimpulan.
- Tempel teks ke Detektor AI gratis kami untuk menilai sinyal yang sama secara otomatis.
Dua atau tiga kecocokan dalam 30 detik cukup untuk mengidentifikasi output ChatGPT secara andal. Tambahkan skor detektor tinggi dan kasusnya pada dasarnya ditutup.
Sources
- Mitchell, E., Lee, K., Khazatsky, A., Manning, C.D., & Finn, C. (2023). DetectGPT: Zero-Shot Machine-Generated Text Detection using Probability Curvature. Stanford University.
- Gehrmann, S., Strobelt, H., & Rush, A.M. (2019). GLTR: Statistical Detection and Visualization of Generated Text. Harvard NLP / MIT-IBM Watson AI Lab.
- OpenAI (2024). GPT-4 System Card and GPT-4o Technical Report.
- Anthropic (2024). Claude 3 Model Family Documentation and Constitutional AI Principles.