Đếm độ dài và số đoạn SMS tức thì
Công cụ Đếm Ký Tự SMS miễn phí có phát hiện GSM-7 / UCS-2, số đoạn và sử dụng ký tự mỗi đoạn.
Giới Hạn Ký Tự SMS Là Bao Nhiêu?
Một SMS đơn chứa 160 ký tự khi mã hóa GSM-7, hoặc 70 ký tự khi mã hóa UCS-2. Việc nhà mạng chọn mã nào do nội dung tin nhắn quyết định tự động: nếu mọi ký tự đều thuộc bảng chữ GSM-7 mặc định, bạn được dùng đủ 160. Chỉ cần một ký tự ngoài bảng, cả tin nhắn được mã hóa lại thành UCS-2 và giới hạn giảm còn 70.
Khi vượt 160 / 70, tin nhắn bị chia thành đoạn nối tiếp. Mỗi đoạn mang một header 6 byte để điện thoại nhận ghép lại, nên SMS nhiều đoạn chỉ dùng 153 ký tự (GSM-7) hoặc 67 ký tự (UCS-2) mỗi đoạn.
Mã GSM-7: Tiêu Chuẩn 160 Ký Tự
GSM-7 là mã hóa SMS mặc định định nghĩa trong chuẩn GSM 03.38. Nó nén 7 bit mỗi ký tự, vì vậy 160 ký tự vừa khít 1.120 bit (140 byte) tải trọng SMS. Bảng chữ có 128 ký tự cơ bản cộng bảng mở rộng 10 ký tự.
Quy tắc thực tế: nếu tin nhắn của bạn đọc như tiếng Anh, Pháp, Đức, Tây Ban Nha hoặc Bồ Đào Nha thuần không emoji, không dấu nháy cong và không gạch dài kiểu cách, bạn gần như chắc chắn ở GSM-7 và có thể dùng cả 160 ký tự mỗi đoạn. Tiếng Việt có dấu sẽ buộc UCS-2.
Mã UCS-2: Khi Bạn Bị Ép Còn 70 Ký Tự
UCS-2 là mã hóa Unicode 16-bit (2-byte). Cùng tải trọng 140 byte chứa 70 đơn vị mã UCS-2 mỗi đoạn, hoặc 67 khi nối tiếp. Nhà mạng chuyển sang UCS-2 ngay khi có một ký tự rơi ngoài GSM-7.
Bẫy ẩn với emoji
Hầu hết emoji được mã hóa thành cặp thay thế trong UCS-2, mỗi emoji tốn 2 trong 70 ký tự. Biến thể sắc tố da và emoji ghép có thể tốn 4 trở lên.
SMS Nối Tiếp: Vì Sao Đoạn Chỉ 153 / 67 Ký Tự
Khi tin nhắn vượt giới hạn SMS đơn, nó bị chia thành các đoạn và mỗi đoạn được gửi như một SMS riêng qua sóng. Để điện thoại người nhận lắp lại đúng thứ tự, mỗi đoạn mang một User Data Header (UDH) 6 byte với số tham chiếu, tổng số đoạn và vị trí. UDH ăn 7 ký tự GSM-7 hoặc 3 đơn vị UCS-2.
Chi Phí Thực Của SMS Nhiều Đoạn
Hầu hết API SMS thương mại tính phí theo đoạn, không theo tin nhắn. Twilio US khoảng 0,0079 USD mỗi đoạn; quốc tế từ 0,05 đến hơn 0,50 USD. Một chiến dịch viết với dấu nháy thông minh âm thầm gấp đôi số đoạn và gấp đôi hóa đơn.
Ký Tự Phổ Biến Buộc Chuyển UCS-2
- Dấu nháy thông minh (cong): Word và macOS tự thay nháy thẳng bằng nháy cong. Cả bốn dạng đều buộc UCS-2.
- Em dash và en dash: Cả hai buộc UCS-2. Dùng gạch nối ASCII có khoảng trắng hai bên.
- Mọi emoji: Mỗi emoji buộc UCS-2 và hầu hết tốn 2 trong 70 ký tự.
- Chữ không phải Latin: Cyrillic, Hy Lạp thường, Ả Rập, Hebrew, Thái, Devanagari, Trung, Nhật, Hàn - tất cả đều UCS-2. Tiếng Việt có dấu cũng buộc UCS-2.
- Chữ có dấu ngoài GSM-7: Hầu hết chữ có dấu châu Âu phổ biến nằm trong GSM-7, nhưng nhiều chữ khác thì không.
iMessage / RCS / WhatsApp: Khi Giới Hạn Không Áp Dụng
- iMessage: Dịch vụ Apple, giới hạn mềm khoảng 20.000 ký tự. Không phân biệt GSM-7 / UCS-2, không tính phí theo đoạn.
- RCS: Người kế thừa SMS được GSMA hậu thuẫn. Không giới hạn ký tự cố định (thường 8.000-20.000).
- WhatsApp: 65.536 ký tự mỗi tin nhắn, không phân đoạn, không quy tắc mã hóa.
Cách Giảm Chi Phí SMS
- Dùng ASCII thuần: Loại dấu nháy thông minh, gạch dài kiểu cách và ellipsis trước khi gửi.
- Bỏ emoji trừ khi đáng click: Mỗi emoji buộc UCS-2 và tốn ít nhất 2 ký tự.
- SMS quảng cáo dưới 160 ký tự: Tối ưu chi phí tốt nhất là ở trong 1 đoạn GSM-7.
- Rút gọn link: Một URL https đầy đủ với UTM có thể ăn 70+ ký tự.
- Đếm trước khi gửi: Chạy mọi chiến dịch qua công cụ đếm phát hiện mã hóa và hiển thị đoạn.
Đếm độ dài và số đoạn SMS tức thì
Mở Công Cụ Đếm SMSCâu Hỏi Thường Gặp
Một SMS đơn chứa 160 ký tự khi mã hóa GSM-7, bảng chữ 7-bit mặc định cho văn bản Latin thuần. Nếu tin nhắn chứa bất kỳ ký tự nào ngoài bảng đó (hầu hết emoji, dấu nháy thông minh, chữ có dấu, Cyrillic, CJK...), nhà mạng chuyển sang UCS-2 (Unicode 16-bit) và giới hạn đơn đoạn giảm còn 70 ký tự.
Khi vượt 160 ký tự GSM-7 hay 70 ký tự UCS-2, tin nhắn được chia thành các đoạn nối tiếp. Mỗi đoạn mang 6-byte User Data Header (UDH) để thiết bị nhận ghép lại, vì vậy đoạn nối tiếp còn 153 ký tự (GSM-7) hoặc 67 ký tự (UCS-2).
Trực quan trông như 1 ký tự nhưng mỗi emoji buộc cả tin nhắn chuyển UCS-2. Hầu hết emoji còn tính 2 đơn vị mã UCS-2 (cặp thay thế), nên một emoji có thể tiêu 4 trong 70 ký tự của bạn. Thêm một emoji vào tin nhắn 100 ký tự có thể biến tin 1 đoạn thành 2 đoạn.
GSM-7 là mã hóa 7-bit với khoảng 128 ký tự cơ bản cộng 10 ký tự mở rộng, tối ưu cho SMS Latin thuần. UCS-2 là mã hóa Unicode 16-bit dùng khi tin chứa ký tự ngoài bảng GSM-7. GSM-7 vừa 160 ký tự/đoạn; UCS-2 vừa 70.
Gần như mọi API SMS và nhà mạng tính phí theo đoạn, không phải theo tin nhắn. Tin nhắn GSM 320 ký tự là 3 đoạn (153+153+14) và bị tính 3. Tin nhắn 71 ký tự có một emoji cũng là 2 đoạn vì emoji buộc UCS-2 và đẩy bạn qua 70.
iMessage, RCS và WhatsApp không phải SMS. Chúng chạy qua dữ liệu, không qua đường ống 160 / 70 của SMS, và có giới hạn thực tế hàng chục nghìn ký tự (iMessage khoảng 20.000).
Mọi emoji, dấu nháy cong (do Word và macOS tự thay), em dash và en dash, ký tự ellipsis, chữ có dấu ngoài bảng mở rộng GSM, và mọi ký tự Cyrillic, Hy Lạp, Ả Rập, Hebrew hay CJK. Chỉ một ký tự như vậy trong tin 200 ký tự sẽ giảm giới hạn đoạn xuống 67.
Không qua SMS thuần. Các giới hạn 160 / 70 được khắc trong chuẩn GSM. Lựa chọn: (1) chấp nhận phí nhiều đoạn, (2) liên kết tới trang web, (3) chuyển sang kênh dữ liệu như iMessage, RCS hoặc WhatsApp Business.