pythainlp.classify
- class pythainlp.classify.GzipModel(training_data: List[Tuple[str, str]])[source]
This class is a re-implementation of “Low-Resource” Text Classification: A Parameter-Free Classification Method with Compressors (Jiang et al., Findings 2023)
- Parameters:
training_data (list) – list [(text_sample,label)]
- predict(x1: str, k: int = 1) str [source]
- Parameters:
- Returns:
label
- Return type:
- Example:
from pythainlp.classify import GzipModel training_data = [ ("รายละเอียดตามนี้เลยค่าา ^^", "Neutral"), ("กลัวพวกมึงหาย อดกินบาบิก้อน", "Neutral"), ("บริการแย่มากก เป็นหมอได้ไง😤", "Negative"), ("ขับรถแย่มาก", "Negative"), ("ดีนะครับ", "Positive"), ("ลองแล้วรสนี้อร่อย... ชอบๆ", "Positive"), ("ฉันรู้สึกโกรธ เวลามือถือแบตหมด", "Negative"), ("เธอภูมิใจที่ได้ทำสิ่งดี ๆ และดีใจกับเด็ก ๆ", "Positive"), ("นี่เป็นบทความหนึ่ง", "Neutral") ] model = GzipModel(training_data) print(model.predict("ฉันดีใจ", k=1)) # output: Positive