pythainlp.classify

class pythainlp.classify.GzipModel(training_data: List[Tuple[str, str]])[source]

This class is a re-implementation of “Low-Resource” Text Classification: A Parameter-Free Classification Method with Compressors (Jiang et al., Findings 2023)

Parameters:

training_data (list) – list [(text_sample,label)]

__init__(training_data: List[Tuple[str, str]])[source]
train()[source]
predict(x1: str, k: int = 1) str[source]
Parameters:
  • x1 (str) – the text that we want to predict label for.

  • k (str) – k

Returns:

label

Return type:

str

Example:

from pythainlp.classify import GzipModel

training_data =  [
    ("รายละเอียดตามนี้เลยค่าา ^^", "Neutral"),
    ("กลัวพวกมึงหาย อดกินบาบิก้อน", "Neutral"),
    ("บริการแย่มากก เป็นหมอได้ไง😤", "Negative"),
    ("ขับรถแย่มาก", "Negative"),
    ("ดีนะครับ", "Positive"),
    ("ลองแล้วรสนี้อร่อย... ชอบๆ", "Positive"),
    ("ฉันรู้สึกโกรธ เวลามือถือแบตหมด", "Negative"),
    ("เธอภูมิใจที่ได้ทำสิ่งดี ๆ และดีใจกับเด็ก ๆ", "Positive"),
    ("นี่เป็นบทความหนึ่ง", "Neutral")
]
model = GzipModel(training_data)
print(model.predict("ฉันดีใจ", k=1))
# output: Positive