[https://developer.nvidia.com/cuda-downloads]
wget http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1404/x86_64/7fa2af80.pub
as root not sudo
# -*- coding: utf-8 -*- | |
""" | |
โค้ดทดสอบก่อนถูกนำไปรวมกับ PyThaiNLP | |
ใช้ Apache License 2.0 | |
เขียนโดย นาย วรรณพงษ์ ภัททิยไพบูลย์ | |
""" | |
import re | |
""" | |
หลักการทำงาน | |
----------- |
>>> import nlpnet | |
>>> path="ที่ตั้งโฟลเดอร์ที่เก็บไฟล์train" | |
>>> nlpnet.set_data_dir(path) | |
>>> tagger = nlpnet.POSTagger() | |
# โหลดฟังก์ชัน arrUnicode แสดงผลภาษาไทยใน Python 2.7 ได้จาก https://gist.github.com/wannaphongcom/266e340b80b0b21e11f4f768965fe8b0 | |
>>> print arrUnicode(tagger.tag('คุณ เป็น ครู ภาษาไทย ใช่ไหม')) | |
[[(u'คุณ', u'JSBR'), (u'เป็น', u'VSTA'), (u'ครู', u'NCMN'), (u'ภาษาไทย', u'VATT'), (u'ใช่ไหม', u'NCMN')]] | |
>>> print arrUnicode(tagger.tag('คุณ เป็น คุณครู ภาษาไทย ใช่ไหม')) | |
[[(u'คุณ', u'JSBR'), (u'เป็น', u'VSTA'), (u'คุณครู', u'NCMN'), (u'ภาษาไทย', u'NCMN'), (u'ใช่ไหม', u'NCMN')]] | |
>>> print arrUnicode(tagger.tag('สวัสดี ครับ ทุกคน สบายดี กัน ไหม ครับ ตอนนี้ ผม ง่วง นอน มาก เลย แล ค ล่ะ')) |
# -*- coding: utf-8 -*- | |
def arrUnicode(myArr): | |
uniStr = [unicode(i, encoding='UTF-8') if isinstance(i, basestring) else i for i in myArr] | |
s = repr(uniStr).decode('unicode_escape').encode('utf-8') | |
if s.startswith("[u'"): | |
s2 = s.replace("u'", "'") | |
elif s.startswith('[u"'): | |
s2 = s.replace('u"', '"') | |
else: |
from pythainlp.tokenize import word_tokenize # ใช้ในการตัดคำ | |
from pythainlp.tag import pos_tag | |
from nltk import RegexpParser | |
chunker = RegexpParser(""" | |
Bank: | |
{<NCMN>+} | |
""") | |
text='ธนาคารบัวเทพร่วมมือกันแก้ไขปัญหาทางการเงินของไทย' | |
a=word_tokenize(text,engine='mm') | |
b=pos_tag(a,engine='artagger') |
# -*- coding: utf-8 -*- | |
from bottle import route, run, template,get, post, request | |
import csv | |
import codecs | |
@route('/') | |
def home(): | |
return ''' | |
<!DOCTYPE html> |
def listcut(text): | |
''' | |
ใช้หาคำที่สามารถตัดได้ทั้งหมดโดยจะเป็น list โดยมี | เป็นตัวแบ่งใน list | |
''' | |
listdata = list(tcut(text)) | |
listdata1=['']*len(listdata) | |
i=0 | |
maxnum=0 | |
numall=1 | |
listnum=[0]*len(listdata) |
# ตาม guru.sanook.com/1520 | |
import re | |
t1 = str.maketrans("กขฃคฅฆงจฉชฌซศษสญยฎดฏตณนฐฑฒถทธบปผพภฝฟมรลฬฤฦวหฮอ", | |
"กกกกกกงจชชชซซซซยยดดตตนนททททททบปพพพฟฟมรรรรรวหหอ") | |
t2 = str.maketrans( | |
"กขฃคฅฆงจฉชซฌฎฏฐฑฒดตถทธศษสญณนรลฬฤฦบปพฟภผฝมำยวไใหฮาๅึืเแโุูอ", | |
"1111112333333333333333333444444445555555667777889AAABCDEEF") | |
def LK82(s): | |
res = [] |
[https://developer.nvidia.com/cuda-downloads]
wget http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1404/x86_64/7fa2af80.pub
as root not sudo
import pandas as pd | |
import numpy as np | |
import matplotlib.pyplot as plt | |
time = pd.date_range('1951', periods=67, freq='A') # สร้างช่วงเวลา โดยจะเรียงจาก ปี 1951 ไล่ต่อมา 67 ปี A คือ ปี | |
listtime=time.tolist() | |
plt.plot(listtime,thai) | |
plt.show() # แสดงข้อมูลประชากรจากอดีต | |
data=pd.DataFrame({'date':time.values,'value':thai}) | |
data['date_ordinal'] = data['date'].apply(lambda x: x.toordinal()) # แปลงวันเดือนปีไปเป็น proleptic Gregorian ordinal |
# ทำนายจำนวนประชากรของไทยด้วย Scikit-learn ใน Python | |
# เขียนโดย นาย วรรณพงษ์ ภัททิยไพบูลย์ | |
# https://python3.wannaphong.com | |
# อ่านได้ที่ https://python3.wannaphong.com/2017/05/thailand-population-scikit-learn-python.html | |
# 14 พ.ค. 2560 | |
''' | |
สร้าง dataset ข้อมูลประชากร | |
''' | |
thai = [20986780, | |
21550597, |