API usage-based billing
Mitra Arsitek
May 20, 2026
GLM 5.1 sebenarnya tidak memakai sistem “token harian tetap” seperti beberapa model lain. Yang tersedia saat ini lebih ke:
- API usage-based billing (bayar per token)
-
atau subscription quota berbasis:
- 5-hour limit
- weekly limit
- jumlah prompt
Untuk API resmi GLM 5.1 dari Z.ai, tidak ada batas token harian publik yang jelas. Yang dipublikasikan justru:
- context window sekitar 200K token
- harga per 1 juta token
Perkiraan limit dari komunitas pengguna:
-
Paket Lite:
- sekitar 10–16 juta token per 5 jam
- atau sekitar 80–120 prompt / 5 jam
Beberapa pengguna Pro bahkan melaporkan:
- pemakaian hingga miliaran token per bulan sebelum terkena throttle
Jadi kesimpulannya:
| Sistem | Limit |
|---|---|
| API GLM 5.1 | Tidak ada kuota harian tetap, tergantung saldo & rate limit |
| Coding Plan Lite | ±10–16 juta token / 5 jam |
| Coding Plan Pro | Jauh lebih besar |
| Reset quota | Umumnya rolling 5 jam + weekly quota |
Kalau Anda mau, saya juga bisa bantu jelaskan:
- perbedaan GLM 5.1 vs Gemini Flash Lite vs Claude Sonnet
- estimasi berapa token untuk coding/web development
- apakah GLM lebih hemat untuk workflow Firebase + HTML + JS Anda.