Mecabの使い方〜ワンポイントレッスン的な〜

Mecabを使用する目的

  1. 文章を解析するために、読み込んだ、日本語を「分かち書き」に変換
  2. 文章の単語を品詞分解する

Mecabのインストール

PythonでMecabを使用する場合は、以下のコマンドを強いようするだけでインストールできる。

!pip install mecab-python3
!pip install unidic
# 辞書のダウンロード
!python -m unidic download

ハローワールド的に下のコードで、起動確認ができるようです。(ワカチガキ)

wakati = MeCab.Tagger('-Owakati')
result = wakati.parse(sample_txt)
print(sample_txt)
print(result)

Mecabのインストール手順を記載した記事を参照ください。

分かち書き

<コマンド>

echo 昔々、あるところに、おじいさんとおばあさんがおりました。 | mecab -Owakati

<出力結果>※見た目上わからないので半角スペースを「<スペース>」に変換して記載しています。

昔 々 、 ある ところ に 、 おじいさん と おばあさん が おり まし た 。 

シンプル(simple)

<コマンド>

echo 昔々、あるところに、おじいさんとおばあさんがおりました。 | mecab -O simple

<出力結果>

昔 名詞-副詞可能
々 記号-一般
、 記号-読点
ある 連体詞
ところ 名詞-非自立-副詞可能
に 助詞-格助詞-一般
、 記号-読点
おじいさん 名詞-一般
と 助詞-並立助詞
おばあさん 名詞-一般
が 助詞-格助詞-一般
おり 動詞-自立
まし 助動詞
た 助動詞
。 記号-句点
EOS

参照している辞書の情報表示

<コマンド>

mecab -D

<出力結果>

filename: /usr/local/mecab/lib/mecab/dic/ipadic/sys.dic
version: 102
charset: utf8
type: 0
size: 392126
left size: 1316
right size: 1316

TensorFLowを学ぶ

  1. Tensorflow Keras 〜初めてのKeras
  2. Tensorflow Keras Errors”python is not installed as a framework.”
  3. Python Tensorflow 〜初めての人工知能(TensorFlowインストール)
  4. Tensorflow Keras〜初めのトレーニング_1
  5. Tensorflow Keras〜初めのトレーニング_2:前処理〜
  6. TensorFlow Keras〜テキストの分類〜
    1. TensorFlow Keras 実行結果〜テキストの分類〜
  7. Python TensorFlow tutorial〜チュートリアルを進めるコツ、ワンポイント〜
  8. TensorFlow Keras〜回帰、準備から予測まで〜
  9. TensorFlow Java 環境構築〜JavaでもTensorFlow〜


[rakuten ids="auc-ky-honpo:10000320"]

投稿者:

takunoji

音響、イベント会場設営業界からIT業界へ転身。現在はJava屋としてサラリーマンをやっている。自称ガテン系プログラマー(笑) Javaプログラミングを布教したい、ラスパイとJavaの相性が良いことに気が付く。 Spring framework, Struts, Seaser, Hibernate, Playframework, JavaEE6, JavaEE7などの現場経験あり。 SQL, VBA, PL/SQL, コマンドプロント, Shellなどもやります。

コメントを残す