Sastrawi Tokenizer

PHP library untuk memecah kalimat Bahasa Indonesia menjadi token-token.


Tokenization

Tokenization adalah proses memecah kalimat menjadi token-token, contoh:

Ini kalimat pertama. Ini kalimat kedua.

akan dipecah menjadi:

  • Ini
  • kalimat
  • pertama
  • .
  • Ini
  • kalimat
  • kedua
  • .

Lebih Lanjut Mengenai Sastrawi Tokenizer