PyThaiNLP 3.0 ออกแล้ว

วันนี้ 30 มกราคม พ.ศ.2565 ทางทีมพัฒนา PyThaiNLP ได้ปล่อยแพ็กเกจประมวลผลภาษาธรรมชาติ PyThaiNLP รุ่น 3.0 หลังจากที่ปล่อย PyThaiNLP 2.3 ไปเมื่อปีก่อน

PyThaiNLP 3.0 มีความเปลี่ยนแปลงสรุปได้ดังนี้

  • เพิ่มโมเดลแปลภาษาจีนกลาง - ภาษาไทย
  • ปรับปรุงพจานุกรมตัดคำหลักและตัวตัดคำ newmm
  • ปรับปรุงคลาสสำหรับเรียกเครื่องมือแปลภาษา
  • เพิ่มตัวแก้คำผิด
  • เพิ่มเครื่องมือสำหรับสร้างข้อความและ Text Augmentation ภาษาไทย
  • ปรับปรุง API จาก syllable_tokenize ให้เปลี่ยนไปใช้งาน subword_tokenize
  • ปรับปรุง API สำหรับ Word Vector
  • เพิ่ม TLTK เข้ามาเป็นตัวเลือก engine ในทั้งตัดคำ, วิเคราะห์ไวยากรณ์, แก้คำผิด และอื่น ๆ

ข้อมูลเปิดเผย: ผู้เขียนเป็นหนึ่งในทีมนักพัฒนา PyThaiNLP

No Description

ที่มา: PyThaiNLP v3.0.0 Released! - GitHub



from Blognone https://ift.tt/s74rle0nv
via IFTTT
เรื่องอื่น ๆ ที่น่าตามต่อที่ MODSNOTE หรือ @aimods

ความคิดเห็น

โพสต์ยอดนิยมจากบล็อกนี้

HPE ไตรมาสล่าสุด เติบโตทั้งธุรกิจหลักและธุรกิจใหม่ตามกลยุทธ์

Coinbase ปลดพนักงานออก 1,100 คน คิดเป็น 18% ของทั้งบริษัท เตรียมรับ Crypto Winter