<?xml version="1.0" encoding="utf-8"?><feed xmlns="http://www.w3.org/2005/Atom" ><generator uri="https://jekyllrb.com/" version="3.9.5">Jekyll</generator><link href="http://pythainlp.github.io/th/th/feed.xml" rel="self" type="application/atom+xml" /><link href="http://pythainlp.github.io/th/th/" rel="alternate" type="text/html" /><updated>2024-04-14T08:55:31+00:00</updated><id>http://pythainlp.github.io/th/th/feed.xml</id><title type="html">PyThaiNLP</title><subtitle>โครงการซอฟต์แวร์เปิดด้านการประมวลผลภาษาไทย</subtitle><entry><title type="html">เอกสารคู่มือ PyThaiNLP ภาษาไทยมาแล้ว!</title><link href="http://pythainlp.github.io/th/th/thai_tutorials/" rel="alternate" type="text/html" title="เอกสารคู่มือ PyThaiNLP ภาษาไทยมาแล้ว!" /><published>2024-04-13T00:00:00+00:00</published><updated>2024-04-13T00:00:00+00:00</updated><id>http://pythainlp.github.io/th/th/thai_tutorials</id><content type="html" xml:base="http://pythainlp.github.io/th/th/thai_tutorials/"><![CDATA[<p>เอกสารคู่มือ PyThaiNLP ภาษาไทยมาแล้ว! เป็นเอกสารคู่มือ PyThaiNLP ที่จะพาคุณไปรู้จักการประมวลผลภาษาไทย</p>

<p>เข้าไปอ่านได้ที่ <a href="https://pythainlp.github.io/thai-tutorials/index.html">https://pythainlp.github.io/thai-tutorials/</a></p>]]></content><author><name></name></author><category term="news" /><summary type="html"><![CDATA[เอกสารคู่มือ PyThaiNLP ภาษาไทยมาแล้ว! เป็นเอกสารคู่มือ PyThaiNLP ที่จะพาคุณไปรู้จักการประมวลผลภาษาไทย]]></summary></entry><entry><title type="html">รู้จักกับ Wisesight Sentiment Corpus</title><link href="http://pythainlp.github.io/th/th/wisesight_sentiment_corpus/" rel="alternate" type="text/html" title="รู้จักกับ Wisesight Sentiment Corpus" /><published>2023-12-20T00:00:00+00:00</published><updated>2023-12-20T00:00:00+00:00</updated><id>http://pythainlp.github.io/th/th/wisesight_sentiment_corpus</id><content type="html" xml:base="http://pythainlp.github.io/th/th/wisesight_sentiment_corpus/"><![CDATA[<p><img src="https://i.imgur.com/PH6OX2p.png" alt="" /></p>

<p>Wisesight Sentiment Corpus เป็นชุดข้อมูลที่ทาง Wisesight ได้ปล่อยออกมาสำหรับงาน Sentiment analysis บนโดเมนเครือข่ายสังคมออนไลน์ มีป้ายกำกับความรู้สึก (บวก, กลางๆ, ลบ, คำถาม) รวม 26,737 ข้อความ เผยแพร่เป็นสมบัติสาธารณะ ภายใต้สัญญาอนุญาต Creative Commons Zero v1.0 Universa ซึ่งปัจจุบันได้กลายเป็นชุดข้อมูลมาตรฐานภาษาไทยสำหรับงาน Sentiment analysis บนโดเมนเครือข่ายสังคมออนไลน์</p>

<p>นอกจากจะเป็น Sentiment Corpus อย่างเดียว ภายในมีชุดข้อมูลย่อยสำหรับตัดคำภาษาไทยบนโดเมนเครือข่ายสังคมออนไลน์ 2 ชุดข้อมูล คือ wisesight-160 (160 ข้อความ) และ wisesight-1000 (1000 ข้อความ) พัฒนาโดยคุณเติ้ล เรียกได้ว่ามีทั้งชุดข้อมูล Sentiment analysis กับตัดคำภาษาไทยภายในตัว</p>

<p>ปัจจุบัน Wisesight Sentiment Corpus สามารถใช้งานได้ผ่าน HF Hub: <a href="https://huggingface.co/datasets/wisesight_sentiment">https://huggingface.co/datasets/wisesight_sentiment</a></p>

<p>ส่วนชุดข้อมูล กับ ข้อมูลต้นฉบับ wisesight-160, wisesight-1000 สามารถโหลดได้จาก <a href="https://github.com/PyThaiNLP/wisesight-sentiment">https://github.com/PyThaiNLP/wisesight-sentiment</a></p>]]></content><author><name></name></author><category term="corpus" /><summary type="html"><![CDATA[]]></summary></entry><entry><title type="html">ร่วมทดสอบ PyThaiNLP รุ่นกำลังพัฒนาทำอย่างไร?</title><link href="http://pythainlp.github.io/th/th/testing/" rel="alternate" type="text/html" title="ร่วมทดสอบ PyThaiNLP รุ่นกำลังพัฒนาทำอย่างไร?" /><published>2023-12-19T00:00:00+00:00</published><updated>2023-12-19T00:00:00+00:00</updated><id>http://pythainlp.github.io/th/th/testing</id><content type="html" xml:base="http://pythainlp.github.io/th/th/testing/"><![CDATA[<p>หลังจากที่ PyThaiNLP ออก PyThaiNLP รุ่น 4.0 เราได้มีการปรับปรุงครั้งใหญ่ในโค้ดตัวตัดคำ newmm ที่จะแก้ไขปัญหาที่เคยเจอเมื่อใช้งานตัวตัดคำ ทำให้เราต้องเปลี่ยนแผนจากเดิมที่จะออก PyThaiNLP รุ่น 4.1 เปลี่ยนมาออก <strong>PyThaiNLP รุ่น 5.0</strong> แทน!</p>

<p>เนื่องจาก PyThaiNLP รุ่น 5.0 ยังอยู่ในช่วงกำลังพัฒนา ทำให้เราทิ้งช่วงการออกรุ่นใหม่มาสักพัก แต่เรายังคงต้องการความคิดเห็นในการใช้งาน PyThaiNLP รุ่น 5.0 เพื่อมาปรับปรุงก่อนทำการออกรุ่นจริง โดยคุณสามารถร่วมทดสอบ PyThaiNLP รุ่นที่กำลังพัฒนาได้ ไม่จำกัดเพียง PyThaiNLP 5.0 และยังรวมถึงรุ่นอื่น ๆ ที่ใหม่กว่าได้ด้วย (เผื่อมีท่านใดเข้ามาอ่าน)</p>

<p>1.ทดสอบผ่าน PyPI: PyThaiNLP เราปล่อยรุ่นทดสอบ 2 แบบ คือ แบบ dev เป็นรุ่นที่กำลังพัฒนาที่ API สามารถเปลี่ยนแปลงได้คลอด กับ แบบ beta รุ่นที่พร้อมใช้งานระดับหนึ่งสำหรับนักพัฒนา</p>

<p>สามารถติดตั้งได้โดยใช้คำสั่ง</p>

<div class="language-plaintext highlighter-rouge"><div class="highlight"><pre class="highlight"><code>pip install --pre --force-reinstall pythainlp
</code></pre></div></div>

<p>โดยการติดตั้งผ่านช่องทางนี้จะไม่ใช่ตัวอัปล่าสุด แต่เป็นการปล่อยแต่ละรอบ</p>

<p>2.ทดสอบผ่าน GitHub: คุณสามารถร่วมทดสอบด้วยโค้ด PyThaiNLP ที่อยู่บน GitHub ล่าสุดได้ด้วยคำสั่ง</p>

<div class="language-plaintext highlighter-rouge"><div class="highlight"><pre class="highlight"><code>pip install --force-reinstall https://github.com/pythainlp/pythainlp/archive/dev.zip
</code></pre></div></div>

<p>การติดตั้งนี้จะทำให้คุณได้รับโค้ดล่าสุดของ PyThaiNLP บน Github</p>

<p>เมื่อคุณทดสอบหรือใช้งานแล้วเจอข้อผิดพลาด อย่าลืมแจ้งปัญหาที่พบเข้ามาใน <a href="https://github.com/PyThaiNLP/pythainlp/issues">https://github.com/PyThaiNLP/pythainlp/issues</a> ของเรา</p>

<p>อ่านเอกสารของรุ่นที่กำลังพัฒนาได้ที่ <a href="https://pythainlp.github.io/dev-docs/">https://pythainlp.github.io/dev-docs/</a></p>

<p>แจ้งข้อผิดพลาดของ PyThaiNLP ได้ที่ <a href="https://github.com/PyThaiNLP/pythainlp/issues">https://github.com/PyThaiNLP/pythainlp/issues</a></p>]]></content><author><name></name></author><category term="news" /><summary type="html"><![CDATA[หลังจากที่ PyThaiNLP ออก PyThaiNLP รุ่น 4.0 เราได้มีการปรับปรุงครั้งใหญ่ในโค้ดตัวตัดคำ newmm ที่จะแก้ไขปัญหาที่เคยเจอเมื่อใช้งานตัวตัดคำ ทำให้เราต้องเปลี่ยนแผนจากเดิมที่จะออก PyThaiNLP รุ่น 4.1 เปลี่ยนมาออก PyThaiNLP รุ่น 5.0 แทน!]]></summary></entry><entry><title type="html">PyThaiNLP เข้าร่วม Hacktoberfest 2023!</title><link href="http://pythainlp.github.io/th/th/pythainlp-hacktoberfest2023/" rel="alternate" type="text/html" title="PyThaiNLP เข้าร่วม Hacktoberfest 2023!" /><published>2023-09-22T00:00:00+00:00</published><updated>2023-09-22T00:00:00+00:00</updated><id>http://pythainlp.github.io/th/th/pythainlp-hacktoberfest2023</id><content type="html" xml:base="http://pythainlp.github.io/th/th/pythainlp-hacktoberfest2023/"><![CDATA[<p>PyThaiNLP เข้าร่วม Hacktoberfest 2023!
คุณสามารถร่วมพัฒนา PyThaiNLP พร้อมได้ของที่ระลึกฟรีจาก Hacktoberfest 2023 ได้
เพียงแค่โค้ดและส่ง pull request!</p>

<p>Contributing to PyThaiNLP: <a href="https://github.com/PyThaiNLP/pythainlp/blob/dev/CONTRIBUTING.md">https://github.com/PyThaiNLP/pythainlp/blob/dev/CONTRIBUTING.md</a>
GitHub: <a href="https://github.com/PyThaiNLP/pythainlp">https://github.com/PyThaiNLP/pythainlp</a>
Hacktoberfest: <a href="https://hacktoberfest.com">https://hacktoberfest.com</a></p>

<p>#Hacktoberfest2023 #Hacktoberfest #PyThaiNLP #ThaiNLP</p>]]></content><author><name></name></author><category term="news" /><summary type="html"><![CDATA[PyThaiNLP เข้าร่วม Hacktoberfest 2023! คุณสามารถร่วมพัฒนา PyThaiNLP พร้อมได้ของที่ระลึกฟรีจาก Hacktoberfest 2023 ได้ เพียงแค่โค้ดและส่ง pull request!]]></summary></entry><entry><title type="html">ทำไม Open Data ไม่ควรใช้ license แปลก ๆ รวมถึง CC ที่ใช้ NC หรือ ND</title><link href="http://pythainlp.github.io/th/th/opendata/" rel="alternate" type="text/html" title="ทำไม Open Data ไม่ควรใช้ license แปลก ๆ รวมถึง CC ที่ใช้ NC หรือ ND" /><published>2023-09-12T00:00:00+00:00</published><updated>2023-09-12T00:00:00+00:00</updated><id>http://pythainlp.github.io/th/th/opendata</id><content type="html" xml:base="http://pythainlp.github.io/th/th/opendata/"><![CDATA[<p>เพราะการใช้ license แปลก ๆ จะทำให้มีปัญหาในการตีความก่อนนำไปใช้งาน เนื่องจากข้อกำหนด license ต่าง ๆ ถ้า license  นั้นเป็นภาษาไทย จะทำให้ต่างชาติเอาไปใช้งานลำบาก อาจมีปัญหากับ open source ได้ และสำหรับ Creative Commons CC-BY-NC, CC-BY-NC-SA, และ CC-BY-NC-ND นั้นเข้ากันไม่ได้กับ Open Source [1]</p>

<p>โดยหนึ่งในหลักการของ open source คือไม่จำกัดการใช้งานไม่ว่าจะเป็นที่ไหน แม้แต่บริษัทอะไรก็ตาม ดังนั้น NC ที่ห้ามนำไปใช้งานในเชิงการค้า จึงไม่สมควรถูกนำไปใช้งานกับ open source ใด ๆ และ ND คือ ห้ามดัดแปลง ซึ่งขัดต่อหลัก open source ที่จำกัดการใช้งานในการดัดแปลงต่าง ๆ</p>

<p>เป็นเรื่องน่าเศร้าที่ปัจจุบันยังคงมีหน่วยงานภาครัฐของไทย ยังคงเผยแพร่ชุดข้อมูลหรือ Open Data เหล่านี้ด้วย license แปลก ๆ หรือใช้ CC BY-SA-NC</p>

<p><strong>อ้างอิง</strong>
[1] Why are “Non-Commercial” licenses not Open Source? https://community.oscedays.org/t/why-are-non-commercial-licenses-not-open-source/569/8</p>

<p>เขียนโดย วรรณพงษ์ ภัททิยไพบูลย์</p>]]></content><author><name></name></author><category term="opendata" /><summary type="html"><![CDATA[เพราะการใช้ license แปลก ๆ จะทำให้มีปัญหาในการตีความก่อนนำไปใช้งาน เนื่องจากข้อกำหนด license ต่าง ๆ ถ้า license นั้นเป็นภาษาไทย จะทำให้ต่างชาติเอาไปใช้งานลำบาก อาจมีปัญหากับ open source ได้ และสำหรับ Creative Commons CC-BY-NC, CC-BY-NC-SA, และ CC-BY-NC-ND นั้นเข้ากันไม่ได้กับ Open Source [1]]]></summary></entry><entry><title type="html">สวัสดีบล็อกภาษาไทยของ PyThaiNLP!</title><link href="http://pythainlp.github.io/th/th/hello/" rel="alternate" type="text/html" title="สวัสดีบล็อกภาษาไทยของ PyThaiNLP!" /><published>2023-05-06T00:00:00+00:00</published><updated>2023-05-06T00:00:00+00:00</updated><id>http://pythainlp.github.io/th/th/hello</id><content type="html" xml:base="http://pythainlp.github.io/th/th/hello/"><![CDATA[<p>วันนี้ (6 พฤษาภาคม พ.ศ.2566) ทางโครงการ PyThaiNLP ได้เปิดบล็อกภาษาไทยแล้ว! เพื่อให้ได้แจ้งข่าวสาร ลงเอกสาร คู่มือการใช้งาน เคล็บลับต่าง ๆ เป็นภาษาไทย สำหรับให้ผู้ที่สนใจการประมวลผลภาษาธรรมชาติ ภาษาไทย ได้อ่านเข้าใจมากยิ่งขึ้น</p>

<p>อย่าลืมติดตามบล็อกภาษาไทย PyThaiNLP กัน!</p>]]></content><author><name></name></author><category term="news" /><summary type="html"><![CDATA[วันนี้ (6 พฤษาภาคม พ.ศ.2566) ทางโครงการ PyThaiNLP ได้เปิดบล็อกภาษาไทยแล้ว! เพื่อให้ได้แจ้งข่าวสาร ลงเอกสาร คู่มือการใช้งาน เคล็บลับต่าง ๆ เป็นภาษาไทย สำหรับให้ผู้ที่สนใจการประมวลผลภาษาธรรมชาติ ภาษาไทย ได้อ่านเข้าใจมากยิ่งขึ้น]]></summary></entry></feed>