pythainlp.classify
- class pythainlp.classify.GzipModel(training_data: list[tuple[str, str]] | None = None, model_path: str = '')[source]
This class is a re-implementation of “Low-Resource” Text Classification: A Parameter-Free Classification Method with Compressors (Jiang et al., Findings 2023)
- Parameters:
- training_data: NDArray[Any]
- predict(x1: str, k: int = 1) str[source]
Predict the label for the given text.
- Parameters:
- Returns:
predicted label
- Return type:
- Example:
>>> from pythainlp.classify import GzipModel
>>> training_data = [ ... ("รายละเอียดตามนี้เลยค่าา ^^", "Neutral"), ... ("กลัวพวกมึงหาย อดกินบาบิก้อน", "Neutral"), ... ("บริการแย่มากก เป็นหมอได้ไง😤", "Negative"), ... ("ขับรถแย่มาก", "Negative"), ... ("ดีนะครับ", "Positive"), ... ("ลองแล้วรสนี้อร่อย... ชอบๆ", "Positive"), ... ("ฉันรู้สึกโกรธ เวลามือถือแบตหมด", "Negative"), ... ("เธอภูมิใจที่ได้ทำสิ่งดี ๆ และดีใจกับเด็ก ๆ", "Positive"), ... ("นี่เป็นบทความหนึ่ง", "Neutral"), ... ] >>> model = GzipModel(training_data) >>> print(model.predict("ฉันดีใจ", k=1)) Positive