mecabに辞書を追加してみた話
せっかく前回のエントリでmecabを利用できるようにしたので、優秀な形態素解析くんになってほしく辞書を追加しました。
追加する方法はほぼ以下の記事の通りです。
テキトーにワークディレクトリを用意しておきます。
# mkdir dicMaker # cd dicMaker
まずは「はてな」のワードを落とします。
curl -L http://d.hatena.ne.jp/images/keyword/keywordlist_furigana.csv | iconv -f euc-jp -t utf-8 > keywordlist_furigana.csv
次にWikipediaのワードを落とします。
curl -L http://dumps.wikimedia.org/jawiki/latest/jawiki-latest-all-titles-in-ns0.gz | gunzip > jawiki-latest-all-titles-in-ns0
さすがのWikipedia。1分半ほど時間かかりました。
% Total % Received % Xferd Average Speed Time Time Time Current Dload Upload Total Spent Left Speed 100 9255k 100 9255k 0 0 104k 0 0:01:28 0:01:28 --:--:-- 146k
落としてる間に、先ほどの記事の通りRubyのソースを書きます。
名前はテキトーにdicMaker.rbとしておきました。
require 'csv' original_data = { wikipedia: 'jawiki-latest-all-titles-in-ns0', hatena: 'keywordlist_furigana.csv' } CSV.open("custom.csv", 'w') do |csv| original_data.each do |type, filename| next unless File.file? filename open(filename).each do |title| title.strip! next if title =~ %r(^[+-.$()?*/&%!"'_,]+) next if title =~ /^[-.0-9]+$/ next if title =~ /曖昧さ回避/ next if title =~ /_\(/ next if title =~ /^PJ:/ next if title =~ /の登場人物/ next if title =~ /一覧/ title_length = title.length if title_length > 3 score = [-36000.0, -400 * (title_length ** 1.5)].max.to_i csv << [title, nil, nil, score, '名詞', '一般', '*', '*', '*', '*', title, '*', '*', type] end end end end
はてな、WikipediaのキーワードCSVが用意できたら早速Rubyを実行してみます。
# ruby dicMaker.rb
するとcustom.csvが出来上がります。
超簡単です。ynakayamaさんありがとう!
ここまでは本当に記事のとおりです。
ynakayamaさんの記事では以下のコマンドでした。
/usr/local/libexec/mecab/mecab-dict-index -d /usr/local/lib/mecab/dic/ipadic -u custom.dic -f utf-8 -t utf-8 custom.csv
私のmacにbrewで入れたmecabさんは以下のようになりました。
/usr/local/Cellar/mecab/0.996/libexec/mecab/mecab-dict-index -d /usr/local/Cellar/mecab/0.996/lib/mecab/dic/ipadic -u custom.dic -f utf-8 -t utf-8 custom.csv
PATH通してあげればいいんでしょうけど面倒なのでそのままにしてます。
とりあえず無事dicファイルができあがりました!
macでmecabを利用してみる
macに日本語形態素解析のMecabをインストールするよってエントリーです。
brew install mecab brew install mecab-ipadic
mecab-ipadicでエラーが出た。
Error: Failed to download resource "mecab-ipadic"
brewでインストールできるバージョンを把握しようと以下を実行してみる。
brew versions mecab
するとまたエラーが出た。ふぁぁぁあ!!
Error: Unknown command: versions
brewが2.0以降(?)versionsに対応しなくなったらしいと噂を聞く。
別途インストールして利用することができるようなので入れてみる。
brew install versions
そしてこれもエラー。。。
Error: No available formula for versions
ほんと泣けてくる。
とりあえずbrewのバージョンが中途半端ぽいので以下で一回アップデートして試す。
brew update brew tap homebrew/boneyard brew versions mecab
無事使えた。
インストールする必要ないんじゃん・・・
You should use the homebrew-versions tap instead: https://github.com/Homebrew/homebrew-versions 0.996 git checkout 10f80f1 /usr/local/Library/Formula/mecab.rb 0.995 git checkout 1c6ad82 /usr/local/Library/Formula/mecab.rb 0.994 git checkout 4844910 /usr/local/Library/Formula/mecab.rb 0.993 git checkout 642c664 /usr/local/Library/Formula/mecab.rb 0.992 git checkout bb95f13 /usr/local/Library/Formula/mecab.rb 0.99 git checkout 01788c0 /usr/local/Library/Formula/mecab.rb 0.98 git checkout 0476235 /usr/local/Library/Formula/mecab.rb
単純にbrewのバージョンが古かったっぽいので以下を実行して再度試す。
brew install mecab-ipadic
無事インストール完了。
なんだ・・・
これでやっとmecabを利用できるようになりました。
brewでインストールできない場合とりあえずupdate汁ってことか。
暇だからAndroid Studioを入れてみる
XCodeをアップデートしてる間暇なのでAndroidStudioを入れてみよう。
まずはAndroidStudioのダウンロード
Android Studio | Android Developers
macで入れてるとJava6入れろボケェ言われるから言われるがまま入れる。
ディレクトリの確認かな?
とりあえずデフォで入れてみる。
するとすぐにインストール終わって起動できた。
ここまでは意外と簡単なもんすな・・・
↓ちなみにAndroidStudioを日本語化するらしい。
「マンガ新刊」アプリ2.0を公開しました。
今回「マンガ新刊」アプリ2.0を公開しました。
前回の1.0は初めてのアプリリリースで、審査通ってAppStoreに掲載されることが目的でした。
今回はお気に入り登録、発売日のプッシュ通知、デザインの変更を中心に手を加えています。
トップのデザインから大きな変更を加えました。
どのようなデザインか、どんな機能があるか気になる方はぜひ上のリンクを押してみてくださいね!ぜひ!!(強め)
最新刊情報をバックグラウンドで毎日確認しているので、常に最新の情報を得ることができます。
お気に入り登録機能とプッシュ通知が今回の目玉ですかね・・
Twitterで「アプリ 新刊 マンガ」とかって検索すると、
お気に入りのマンガや作家さんの新刊情報を通知してくれるアプリないかしら?
— ke-sanβ ❀ ↯↯↯ (@keisanbeta) 2014, 2月 12
登録した漫画の新刊発売日を自動でお知らせしてくれる神アプリありませんか?Amazon?
— 孫(まご) (@s_wara65) 2014, 8月 25
自分が購読している漫画の新刊の発売を教えてくれたり、すでに買ってあるのは○刊ですって教えてくれるアプリないですか
— ひかる (@hikaru811) 2014, 8月 28
新刊何買ってないかもう全然わからないから漫画を登録しておくと新刊の発売日を通知してくれるアプリとかあればいいのに
— 芥子はPQプレイ中 (@ko_keshi_) 2014, 9月 6
漫画の新刊情報を教えてくれる便利なアプリないっすかね
— f'(ヨシダ) (@namiutigiwaP) 2014, 9月 7
と要望は高いようです。
個人的に新刊情報を手軽かつ確実に得たいという意思もあり作ったわけですが、 同じような悩みを抱える人にも使ってもらえればなと思います。
そんなこと言いながら広告付けやがって!見難いんだよ!とか、結局金儲けか・・と言う方もいるかと思います。
今回このアプリを実現するためにサーバをレンタルしています。
私は個人というだけでなく、本職で得た収入は全て嫁に納めており、少ないお小遣い制です。。(涙目)
その少ないお小遣いの中からサーバをレンタルして運用してますので、どうか許してください(震え声)
それでリリースして気になったことなんですが、アプリリリースしたからってすぐダウンロードされるわけではないんですよね・・
何万ものアプリ?何億ものアプリ?がある中から見つけてもらわないといけない・・・
発掘して頂く必要があるようです。
そんなの待ってられません。
Google先生に聞いてみたんですが、AppBankなどアプリ紹介サイトに掲載を依頼することが可能なようです。。
今回いろいろなアプリ紹介サイト様に掲載のお願いメールを出させていただきました。
どうぞ、掲載のほどよろしくお願いします。m( )m
アプリの宣伝でこうやったら効果あるよ!って情報お持ちの方ぜひ教えて下さい!!(前のめり!)
以上でーす。