Apa cara tercepat untuk memberi tahu apakah ChatGPT menulis sesuatu?

Pindai tiga hal di paragraf pertama: penggunaan em-dash berlebihan, kata menyelami, dan panjang kalimat seragam. Jika dua dari tiga hadir dalam 150 kata, ChatGPT adalah penulis yang paling mungkin. Tambahkan skor tinggi dari detektor dan pembuka sopan seperti Tentu! dan kasusnya hampir diputuskan.

Apakah ChatGPT benar-benar menggunakan em-dash sesering itu?

Ya, lebih dari hampir semua penulis lain. Sampel independen output GPT-4 rata-rata dua hingga empat karakter em-dash per 500 kata, dibandingkan dengan kurang dari satu dalam tulisan siswa tipikal. Pola ini bertahan di GPT-3.5, GPT-4, dan GPT-4o. Ini adalah salah satu sidik jari karakter tunggal paling jelas dalam model.

Mengapa ChatGPT mengatakan menyelami begitu banyak?

Menyelami jarang dalam bahasa Inggris kasual tetapi umum dalam penggunaan bahasa Inggris akademis dan Afrika. Data pelatihan RLHF dan register membantu, formal yang dioptimalkan OpenAI mendorong menyelami ke dalam kosakata probabilitas tinggi ChatGPT. Pada 2024, menyelami begitu sering digunakan sehingga peneliti menggunakan frekuensinya saja sebagai sinyal AI lemah.

Bagaimana Claude berbeda dari ChatGPT dalam gaya?

Claude cenderung menulis dengan lebih banyak koreksi diri dan klise tetap yang lebih sedikit. Itu melindungi dengan bijaksana daripada secara refleks, sering mengakui beberapa sisi tanpa jatuh ke dalam pola di sisi lain yang simetris dari ChatGPT. Claude masih menggunakan panjang paragraf seragam dan daftar struktural, yang menjaga burstinessnya tetap rendah.

Bagaimana Gemini berbeda dari ChatGPT dalam gaya?

Gemini condong ke daftar bernomor, tabel, dan judul tebal bahkan dalam jawaban pendek. Ini sering dibuka dengan jawaban langsung satu baris, lalu bullet. Di mana ChatGPT mengisi, Gemini membuat perancah. Keduanya berbagi burstiness rendah dan kosakata berulang, tetapi sidik jari struktural Gemini lebih visual.

Bisakah model GPT yang lebih baru menyembunyikan tanda-tanda ini?

Sebagian. GPT-4o kurang jelas daripada GPT-3.5 dan menghindari beberapa klise terburuk ketika diminta dengan hati-hati. Tetapi penggunaan em-dash berlebihan, pembuka sopan seperti Tentu!, dan panjang paragraf seragam bertahan bahkan di GPT-4o secara default. Prompt sistem kustom dapat menekan beberapa tanda tetapi jarang semuanya.

Apakah tanda-tanda ini dapat diandalkan pada tulisan akademik atau teknis?

Kurang dapat diandalkan. Abstrak akademik, memo hukum, dan dokumentasi teknis berbagi banyak fitur dengan teks AI: nada formal, hedging, simetri hati-hati, suara pribadi rendah. Skor tinggi pada genre tersebut lebih mungkin merupakan false positive. Selalu pertimbangkan genre sebelum memutuskan ChatGPT menulis dokumen.

Apakah detektor AI memeriksa tanda-tanda spesifik ini?

Detektor modern menggabungkan sinyal statistik seperti burstiness dan perplexity dengan heuristik kosakata dan struktural yang mencerminkan 12 tanda. Detektor AI kami sendiri menandai enam kluster sinyal yang sama yang digunakan guru. Tidak ada detektor yang bergantung pada satu tanda. Menggabungkan tanda adalah apa yang menghasilkan vonis yang dapat diandalkan.

Akankah menulis ulang memperbaiki tanda-tanda?

Ya jika Anda menulis ulang dengan tangan dan menambahkan kekhususan. Ganti karakter em-dash dengan titik atau koma, tukar menyelami dengan kata kerja yang sebenarnya Anda gunakan, variasikan panjang kalimat, dan jatuhkan satu contoh pribadi per paragraf. Meminta ChatGPT untuk membuat ini terdengar lebih manusiawi jarang menghapus sidik jari statistik yang dalam.

Apakah tanda-tanda ini bias terhadap penulis bahasa Inggris non-asli?

Beberapa ya. Liang dan koleganya di Stanford menemukan bahwa detektor GPT menandai 61% esai TOEFL oleh penutur bahasa Inggris non-asli sebagai dihasilkan AI. Kosakata formal, simetri hati-hati, dan hedging adalah umum dalam bahasa Inggris akademis bahasa kedua. Gunakan tanda-tanda ini sebagai sinyal untuk diselidiki, tidak pernah sebagai bukti sendiri.

Ciri-ciri Gaya Tulisan ChatGPT: Cara Mengidentifikasi Teks AI dalam 30 Detik

Jawaban Singkat

Tulisan ChatGPT membawa 12 tanda spesifik: penggunaan em-dash berlebihan, pembuka sopan seperti Tentu!, kata menyelami dan permadani, menavigasi kompleksitas, di era digital saat ini, frasa hedging, panjang paragraf seragam, penggunaan daftar berlebihan, argumen simetris, akhiran sebagai kesimpulan, dan nada yang terlalu sopan. Dua atau tiga bersamaan dalam paragraf cukup untuk mengidentifikasi output GPT dalam waktu sekitar 30 detik.

Sebagian besar pembaca dapat belajar mengenali ChatGPT dalam satu paragraf setelah melihat pola dinamai sekali. Panduan ini menjabarkan 12 tanda tangan spesifik, mengapa muncul, bagaimana Claude dan Gemini dibandingkan, dan di mana tanda-tanda menyesatkan. Untuk menguji paragraf terhadap sinyal yang sama yang digunakan guru, tempelkan ke alat Detektor AI kami.

Mengapa ChatGPT Memiliki Tanda Tangan Gaya

ChatGPT menulis seperti itu karena suatu alasan. OpenAI melatih model pada irisan teks internet dan buku yang luas, lalu menyetelnya dengan Reinforcement Learning from Human Feedback (RLHF). Penilai manusia secara konsisten lebih menyukai respons yang sopan, seimbang, terstruktur, dan dilindungi. Model mempelajari menulis seperti itu secara default.

Preferensi RLHF yang sama untuk output membantu dan tidak berbahaya melatih model untuk menggunakan kosakata aman, simetri hati-hati, dan register sopan. Hasilnya adalah teks yang terbaca kompeten tetapi dapat diprediksi. Sidik jari muncul di GPT-3.5, GPT-4, dan GPT-4o, dengan setiap versi yang lebih baru sedikit kurang jelas tetapi tidak pernah tak terlihat.

12 Tanda ChatGPT

1. Kecanduan Em-Dash

ChatGPT menyukai karakter em-dash. Sampel independen output GPT-4 rata-rata dua hingga empat em-dash per 500 kata. Tulisan sarjana tipikal memiliki kurang dari satu. Cari frasa parenthetical yang dipisahkan dengan em-dash di mana koma atau titik akan menyelesaikan pekerjaan. Contoh: Proyek tertunda, dipisahkan dengan em-dash di sekitar meskipun usaha terbaik tim, hingga akhir Agustus.

2. Membuka Dengan Tentu! atau Saya Di Sini untuk Membantu

ChatGPT tidak bisa berhenti sopan. Ketika diberi tugas, sering membuka dengan Tentu!, Tentu saja!, Pasti!, atau Saya di sini untuk membantu. Bahkan ketika prompt meminta draf dan bukan balasan obrolan, sisa register asisten menyelinap masuk. Esai formal yang dibuka dengan afirmasi satu baris hampir selalu merupakan paste-dari-ChatGPT.

3. Menyelami

Kata kerja menyelami jarang dalam bahasa Inggris kasual. Pada 2024 begitu sering muncul dalam output ChatGPT sehingga peneliti menggunakan frekuensinya saja sebagai sinyal AI lemah. Jika tulisan 500 kata menggunakan menyelami sekali, itu bisa kebetulan. Dua kali mencurigakan. Tiga kali adalah sidik jari.

4. Permadani

Saudara dekat menyelami. ChatGPT menjangkau permadani untuk menggambarkan apa pun yang kompleks atau saling terhubung: permadani pengalaman, permadani budaya, permadani suara yang kaya. Metafora ini fungsional tetapi model bersandar padanya jauh lebih keras daripada penulis manusia.

5. Menavigasi Kompleksitas

Frasa menavigasi kompleksitas (atau menavigasi tantangan, menavigasi nuansa) muncul kira-kira di satu dari dua puluh esai ChatGPT tentang topik sosial. Itu adalah hedge yang menandakan kedalaman tanpa berkomitmen pada klaim spesifik. Penulis manusia asli biasanya memilih kata kerja konkret sebagai gantinya.

6. Di Era Digital Saat Ini

Hampir setiap prompt tentang teknologi, masyarakat, atau budaya memicu di era digital saat ini sebagai pembuka. Varian termasuk di dunia kita yang semakin terhubung dan di era modern. Frasa tidak membawa informasi. Itu ada untuk melembutkan model ke paragraf pembuka.

7. Bahasa Hedging

ChatGPT terus melindungi. Bisa diperdebatkan bahwa, seseorang mungkin mengatakan, beberapa ahli percaya, ini bisa dilihat sebagai. Hedging adalah sisa RLHF: penilai manusia lebih menyukai jawaban yang tidak berkomitmen pada klaim kuat. Hasilnya adalah prosa yang terdengar hati-hati tetapi jarang mengambil posisi.

8. Panjang Paragraf Seragam

Paragraf ChatGPT berkumpul di sekitar tiga hingga lima kalimat masing-masing. Buka respons lima paragraf dan ukur: sebagian besar paragraf akan mendarat dalam satu kalimat satu sama lain. Penulis manusia berayun dari paragraf satu baris ke paragraf sepuluh baris tergantung pada penekanan. Ritme metronom ChatGPT adalah salah satu tanda non-kosakata paling keras.

9. Struktur Daftar

Saat ragu, ChatGPT membuat bullet. Bahkan respons prosa terinterupsi oleh daftar bernomor atau berbutir, kadang untuk tiga item yang akan terbaca lebih baik sebagai satu kalimat. Gemini lebih buruk pada dimensi ini, tetapi ChatGPT masih jauh di atas baseline manusia.

10. Argumen Simetris

Setiap klaim mendapat counter. Di satu sisi, di sisi lain, sementara X benar, Y juga harus dipertimbangkan. Simetri begitu konsisten sehingga peneliti telah menggunakan keseimbangan-argumen sebagai sidik jari model. Penulis manusia lebih sering memilih sisi.

11. Menutup Dengan Sebagai Kesimpulan

Esai manusia nyata jarang menggunakan frasa literal sebagai kesimpulan. ChatGPT menggunakannya sebagai transisi penutup default. Varian termasuk untuk merangkum, secara ringkas, akhirnya. Paragraf penutup kemudian mengulangi pendahuluan daripada menambahkan wawasan baru.

12. Nada yang Terlalu Sopan di Setiap Register

Apakah prompt meminta tweet sinis, surat lamaran formal, atau postingan blog kasual, ChatGPT default ke register sopan, netral, profesional. Sinisme tulus, opini tajam, dan frustrasi tanpa dilindungi jarang dalam output default. Datarnya adalah pemberi tanda. Penulis nyata memiliki suasana hati. ChatGPT memiliki satu suasana hati.

ChatGPT vs Claude vs Gemini: Perbedaan Gaya

Tiga besar model frontier berbagi baseline burstiness rendah dan pengulangan kosakata, tetapi masing-masing memiliki sidik jari sendiri.

ChatGPT: Bertele-tele, banyak em-dash, rentan hedging, pembuka sopan, menyelami dan permadani, akhiran sebagai kesimpulan.
Claude: Tempo hati-hati, klise tetap lebih sedikit, lebih banyak koreksi diri (misalnya, sebenarnya, pada refleksi), masih panjang paragraf seragam, lebih suka koma daripada em-dash.
Gemini: Bernomor, banyak tabel, didorong daftar, sering membuka dengan jawaban langsung satu baris lalu bullet, sidik jari struktural kuat.
Ketiganya berbagi: Burstiness rendah, pengulangan kosakata dalam 500 kata, argumen simetris, contoh generik.

Mendeteksi GPT-4 vs GPT-3.5

GPT-3.5 memakai tandanya di lengan. Struktur esai lima paragraf, dua menyelami, empat em-dash, dan akhiran sebagai kesimpulan muncul dalam draf 500 kata tipikal. GPT-4 lebih sulit. Penggunaan em-dash sedikit turun, hedging lebih bernuansa, dan klise muncul lebih jarang. GPT-4o melembutkan pembuka sopan lebih jauh.

Tetapi sinyal statistik yang dalam tetap. Burstiness tetap rendah. Panjang paragraf tetap seragam. Penggunaan em-dash tetap meningkat. Tentu! masih menyelinap masuk. Peneliti yang menjalankan deteksi benchmark pada GPT-4o (Mitchell et al. dan pekerjaan lanjutan pada 2024) menemukan bahwa detektor terkuat masih menandai teks GPT-4o jauh di atas baseline manusia. Tanda-tanda bermigrasi, tetapi tidak menghilang.

Demo Langsung: Jalankan Teks Ini Melalui Detektor Kami

Berikut adalah sampel 110 kata yang ditulis oleh GPT-4 dari prompt tulis paragraf singkat tentang kerja jarak jauh:

Di era digital saat ini, kerja jarak jauh telah secara fundamental mengubah cara profesional menavigasi kompleksitas karier mereka. Sementara menawarkan permadani manfaat, termasuk peningkatan fleksibilitas dan kemampuan untuk menyelami keseimbangan kerja-hidup yang lebih sehat, juga menyajikan tantangan, seperti perasaan isolasi dan kesulitan memisahkan kehidupan pribadi dan profesional. Perusahaan harus mengadopsi kerangka kerja yang kuat untuk mendukung tim terdistribusi mereka, memanfaatkan alat komunikasi dan memupuk budaya kepercayaan. Akhirnya, masa depan pekerjaan terus berkembang, dan organisasi yang merangkul pergeseran ini sambil mengatasi kompleksitasnya akan berkembang di dunia yang semakin saling terhubung. Sebagai kesimpulan, kerja jarak jauh akan tetap ada.

Tempelkan paragraf itu ke Detektor AI kami dan vonis kembali Hampir Pasti AI dalam waktu kurang dari satu detik. Detektor menandai enam frasa klise (di era digital saat ini, menavigasi kompleksitas, permadani, menyelami, kerangka kerja yang kuat, memanfaatkan, terus berkembang, sebagai kesimpulan), burstiness rendah (kalimat berkumpul antara 18 dan 28 kata), dan simetri struktural (perkenalkan, daftar manfaat, daftar tantangan, simpulkan). Masing-masing adalah tanda dari daftar di atas.

Kapan Tanda-tanda Ini Menyesatkan

12 tanda menghasilkan false positive dalam tiga genre penting.

Abstrak akademik. Abstrak jurnal formal, dilindungi, simetris, dan dikemas dengan kosakata aman. Mereka terlihat seperti ChatGPT karena ditulis dengan kendala yang sama: keringkasan, keseimbangan, dan netralitas.
Dokumentasi teknis dan hukum. Spesifikasi, brief kebijakan, dan memo hukum menghargai hedging dan simetri dengan sengaja. Skor AI tinggi pada kontrak biasanya merupakan false positive.
Penulis bahasa Inggris non-asli. Liang et al. (Stanford 2023) menemukan bahwa detektor GPT menandai 61% esai TOEFL oleh penutur bahasa Inggris non-asli sebagai dihasilkan AI. Kosakata formal, simetri hati-hati, dan hedging adalah karakteristik bahasa Inggris akademis bahasa kedua.

12 tanda paling dapat diandalkan pada esai siswa, draf blog, postingan sosial, salinan pemasaran, dan korespondensi pribadi. Gunakan sebagai sinyal untuk menyelidiki, bukan sebagai bukti sendiri. Jika Anda seorang guru atau editor, gabungkan beberapa tanda sebelum menarik kesimpulan. Jika Anda seorang penulis yang khawatir tentang false positive, baca panduan pendamping kami tentang cara membuat teks AI terlihat manusiawi untuk teknik yang memperbaiki sinyal yang mendasarinya, bukan hanya kata permukaan.

Pemeriksaan 30 Detik

Ketika Anda menduga ChatGPT menulis sesuatu, jalankan ini secara berurutan.

Hitung karakter em-dash dalam 200 kata pertama.
Pindai untuk menyelami, permadani, menavigasi, di era digital saat ini.
Ukur varians panjang paragraf. Kluster ketat sekitar 3 hingga 5 kalimat adalah sinyal.
Cari argumen simetris dan frasa sebagai kesimpulan.
Tempel teks ke Detektor AI gratis kami untuk menilai sinyal yang sama secara otomatis.

Dua atau tiga kecocokan dalam 30 detik cukup untuk mengidentifikasi output ChatGPT secara andal. Tambahkan skor detektor tinggi dan kasusnya pada dasarnya ditutup.