MeCabを入れてみます。
1 2 3 4 5 6 7 |
$sudo apt-get update $sudo apt-get install mecab libmecab-dev mecab-ipadic-utf8 python-mecab $sudo apt-get install swig $sudo pip3 install mecab-python3 |
やってみます
1 2 3 4 5 6 7 8 9 10 11 12 13 14 |
$python3 >>>import MeCab エラーが出なければOK 形態素解析 >>>mecab = MeCab.Tagger ("-Ochasen") >>>print(mecab.parse("明日晴れるかな")) 分かち書き >>>mecab = MeCab.Tagger ("-Owakati") >>>print(mecab.parse("明日晴れるかな")) |
結果から読みと品詞の要素を抽出してみます。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 |
import MeCab list = MeCab.Tagger().parse("明日晴れるかな").split('\n') for x in list: #読み aa = x.split(",") bb = len(aa) if(bb != 0 and aa[bb-1] != u'EOS'): print(aa[bb-1]) #品詞 cc = x.split('\t') if(len(cc) > 1): dd = cc[1].split(",") print(dd[0]) |
Google Assistantからの結果を利用する場合の注意点
Assistantの結果を文字列として受け取る際、結果には改行文字(\n)が含まれている場合があります。
例えばJSON形式にして交換する際には、改行文字(\n)を読点(。)に置換するような処置をしとかないと、受け取る時にJSONが崩れるので注意です。
Leave a Reply