API usage-based billing

Mitra Arsitek
Mitra Arsitek
May 20, 2026

 


GLM 5.1 sebenarnya tidak memakai sistem “token harian tetap” seperti beberapa model lain. Yang tersedia saat ini lebih ke:

  • API usage-based billing (bayar per token)
  • atau subscription quota berbasis:
    • 5-hour limit
    • weekly limit
    • jumlah prompt

Untuk API resmi GLM 5.1 dari Z.ai, tidak ada batas token harian publik yang jelas. Yang dipublikasikan justru:

  • context window sekitar 200K token
  • harga per 1 juta token

Perkiraan limit dari komunitas pengguna:

  • Paket Lite:
    • sekitar 10–16 juta token per 5 jam
    • atau sekitar 80–120 prompt / 5 jam

Beberapa pengguna Pro bahkan melaporkan:

  • pemakaian hingga miliaran token per bulan sebelum terkena throttle

Jadi kesimpulannya:

SistemLimit
API GLM 5.1Tidak ada kuota harian tetap, tergantung saldo & rate limit
Coding Plan Lite±10–16 juta token / 5 jam
Coding Plan ProJauh lebih besar
Reset quotaUmumnya rolling 5 jam + weekly quota

Kalau Anda mau, saya juga bisa bantu jelaskan:

  • perbedaan GLM 5.1 vs Gemini Flash Lite vs Claude Sonnet
  • estimasi berapa token untuk coding/web development
  • apakah GLM lebih hemat untuk workflow Firebase + HTML + JS Anda.

Tag Artikel