Mecabを使用する目的
- 文章を解析するために、読み込んだ、日本語を「分かち書き」に変換
- 文章の単語を品詞分解する
Mecabのインストール
PythonでMecabを使用する場合は、以下のコマンドを強いようするだけでインストールできる。
!pip install mecab-python3
!pip install unidic
# 辞書のダウンロード
!python -m unidic download
ハローワールド的に下のコードで、起動確認ができるようです。(ワカチガキ)
wakati = MeCab.Tagger('-Owakati')
result = wakati.parse(sample_txt)
print(sample_txt)
print(result)
分かち書き
<コマンド>
echo 昔々、あるところに、おじいさんとおばあさんがおりました。 | mecab -Owakati
<出力結果>※見た目上わからないので半角スペースを「<スペース>」に変換して記載しています。
昔 々 、 ある ところ に 、 おじいさん と おばあさん が おり まし た 。
シンプル(simple)
<コマンド>
echo 昔々、あるところに、おじいさんとおばあさんがおりました。 | mecab -O simple
<出力結果>
昔 名詞-副詞可能 々 記号-一般 、 記号-読点 ある 連体詞 ところ 名詞-非自立-副詞可能 に 助詞-格助詞-一般 、 記号-読点 おじいさん 名詞-一般 と 助詞-並立助詞 おばあさん 名詞-一般 が 助詞-格助詞-一般 おり 動詞-自立 まし 助動詞 た 助動詞 。 記号-句点 EOS
参照している辞書の情報表示
<コマンド>
mecab -D
<出力結果>
filename: /usr/local/mecab/lib/mecab/dic/ipadic/sys.dic version: 102 charset: utf8 type: 0 size: 392126 left size: 1316 right size: 1316
TensorFLowを学ぶ
- Tensorflow Keras 〜初めてのKeras〜
- Tensorflow Keras Errors〜”python is not installed as a framework.”〜
- Python Tensorflow 〜初めての人工知能(TensorFlowインストール)〜
- Tensorflow Keras〜初めのトレーニング_1〜
- Tensorflow Keras〜初めのトレーニング_2:前処理〜
- TensorFlow Keras〜テキストの分類〜
- Python TensorFlow tutorial〜チュートリアルを進めるコツ、ワンポイント〜
- TensorFlow Keras〜回帰、準備から予測まで〜
- TensorFlow Java 環境構築〜JavaでもTensorFlow〜
[rakuten ids="auc-ky-honpo:10000320"]