【Python】漢字を分解するライブラリを使ってみた【部首分解】

公開日: : 最終更新日:2021/03/08 Python , , , ,

Python で漢字を部首やさらに細かい部分に分解してくれるライブラリがあったので使ってみました。

このライブラリを使うと、ある漢字を与えると、その漢字を自動的に分解して部首(偏・旁・冠)や部分をリスト形式で返してくれます。

kanjivg-radical というライブラリで、以下のURLからダウンロードし、解凍します。

https://github.com/yagays/kanjivg-radical

json 形式のファイル読み込む

kanjivg-radical では json 形式のファイルを読み込むため、以下のような関数を用意します。

kanjivg-radical の特徴

このライブラリでできることは、大きく分けて以下の2つがあります。

  • 漢字を部分(部首など)に分解する
  • 部分(部首など)を含む漢字を抽出する

それぞれいくつか細かい特徴が異なる関数が用意されています。

漢字を部分(部首など)に分解する系

これは、「kanji2xxxx」となっている関数が該当します。

基本的に漢字を1文字与えると分解したものをリストで返します。

それぞれ使い方と結果を示します。

kanji2radical

文字を一回だけ分解します。

結果は以下のようになります。

[‘石’, ‘少’]

kanji2element

文字を再帰的に分解していきます。

結果をみると、kanji2radical と比較して、細かく分解されていることが分かると思います。

[‘石’, ‘丿’, ‘少’, ‘口’, ‘小’]

kanji2radical_left_right

文字を「偏」と「旁」に分解します。「偏」と「旁」に分解できない漢字についてはエラーとなります。

結果は以下のとおり。

[‘石’, ‘少’]

kanji2radical_top_buttom

文字を「冠」と「脚」に分解します。「冠」と「脚」に分解できない漢字についてはエラーとなります。

結果は以下のとおり。

[‘少’, ‘目’]

部分(部首など)を含む漢字を抽出する系

これは、「xxxx2kanji」となっている関数が該当します。

部分を与えると、それが含まれる漢字をリストで返します。

それぞれ、コードと結果のみを以下に示します。

radical2kanji

[‘尠’, ‘沙’, ‘鈔’, ‘抄’, ‘眇’, ‘秒’, ‘省’, ‘劣’, ‘杪’, ‘紗’, ‘雀’, ‘歩’, ‘賓’, ‘炒’, ‘隲’, ‘毟’, ‘妙’, ‘砂’]

element2kanji

[‘尠’, ‘瀕’, ‘沙’, ‘鈔’, ‘濱’, ‘抄’, ‘鯊’, ‘頻’, ‘鬢’, ‘捗’, ‘眇’, ‘秒’, ‘殯’, ‘省’, ‘擯’, ‘莎’, ‘劣’, ‘嬪’, ‘渉’, ‘裟’, ‘杪’, ‘紗’, ‘雀’, ‘渺’, ‘顰’, ‘歩’, ‘賓’, ‘炒’, ‘繽’, ‘陟’, ‘蘋’, ‘緲’, ‘隲’, ‘毟’, ‘妙’, ‘檳’, ‘砂’, ‘娑’]

radical2kanji_left_right

[‘尠’, ‘沙’, ‘鈔’, ‘抄’, ‘眇’, ‘秒’, ‘杪’, ‘紗’, ‘炒’, ‘妙’, ‘砂’]

関連記事

【Pandas】 DataFrame のインデックスを置き換える方法【Python】

今回は、Pandas の DataFrame型で、インデックス(index)を分かりやすいものに置き

記事を読む

【Python】Beautiful Soup を使ってスクレイピングする方法。

Beautiful Soup は、シンプルでわかりやすい API でデータを抜き出せる Python

記事を読む

【Atomエディタ】Python 開発用にインストールしてみた。

Python でプログラミングするときの エディタ を探していたのですが、とりあえず Atom とい

記事を読む

【Python】API を使って Amazon の商品情報を収集する方法。

AmazonAPI ライブラリをインストール 以下のコマンドで python-amazon-sim

記事を読む

【Pandas】 DataFrame で2行の列ごとの差を計算する方法【Python】

今回は、Pandas の DataFrame で、2行間の列ごとの値の差を計算し、その結果を Dat

記事を読む

【matplotlib】 Python でヒストグラムの横軸と棒(ビン)の数を調整する方法。

Python の matplotlib を使ってヒストグラムを描画し、横軸の目盛りと棒(ビン)がそろ

記事を読む

【Python】機械学習のために SciPy・Matplotlib・scikit-learn をインストール。

Python で機械学習を行うために、Windows OS の python 2 系にライブラリ「S

記事を読む

【Python】 複数の辞書型の同じ key を持つ value を計算に用いる方法。

Python で、複数の辞書型を読み込んで、同じキー(key)を持つ数値(value)を計算に使う方

記事を読む

【Python】 Series 型を dict(辞書型)に変換する方法。

Python で Series 型を dict(辞書型)に簡単に変換する方法を紹介します。 「

記事を読む

【Python】プログレスバーを表示させる【tqdm】

Python でスクリプトの実行時間が長くなると、進捗状況が知りたくなったので、標準出力にどのくらい

記事を読む

【MT4】日付と時間を指定してPCを自動起動させる方法【DELL】

今回は、日付と時間を指定してPCを自動的に起動させる方法について紹介し

【MT4】PCが再起動しても自動的に起動させる方法【FX自動売買】

今回は、FX 自動売買用のツールの MT4 で、実行しているPCが再起

【MT4】複数口座を同時に起動させる方法【FX・CFD】

今回は、MT4(メタトレーダー4)で複数口座を同時にログインし、起動さ

【MQL4】スプレッドを取得する方法【MT4】

今回は、MQL4 で対象通貨ペアのスプレッドを取得する方法について紹介

【楽天CFD】取引口座を開設してみた【MT4】

今回は、楽天CFDの取引口座(本番口座)の開設方法について紹介します。

→もっと見る

PAGE TOP ↑