mecabに辞書を追加してみた話

せっかく前回のエントリmecabを利用できるようにしたので、優秀な形態素解析くんになってほしく辞書を追加しました。
追加する方法はほぼ以下の記事の通りです。

テキトーにワークディレクトリを用意しておきます。

# mkdir dicMaker
# cd dicMaker

まずは「はてな」のワードを落とします。

curl -L http://d.hatena.ne.jp/images/keyword/keywordlist_furigana.csv | iconv -f euc-jp -t utf-8 > keywordlist_furigana.csv

次にWikipediaのワードを落とします。

curl -L http://dumps.wikimedia.org/jawiki/latest/jawiki-latest-all-titles-in-ns0.gz | gunzip > jawiki-latest-all-titles-in-ns0

さすがのWikipedia。1分半ほど時間かかりました。

% Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
Dload  Upload   Total   Spent    Left  Speed
100 9255k  100 9255k    0     0   104k      0  0:01:28  0:01:28 --:--:--  146k

落としてる間に、先ほどの記事の通りRubyのソースを書きます。
名前はテキトーにdicMaker.rbとしておきました。

require 'csv'

original_data = {
  wikipedia: 'jawiki-latest-all-titles-in-ns0',
  hatena: 'keywordlist_furigana.csv'
}

CSV.open("custom.csv", 'w') do |csv|
original_data.each do |type, filename|
next unless File.file? filename
open(filename).each do |title|
title.strip!

next if title =~ %r(^[+-.$()?*/&%!"'_,]+)
next if title =~ /^[-.0-9]+$/
next if title =~ /曖昧さ回避/
next if title =~ /_\(/
  next if title =~ /^PJ:/
  next if title =~ /の登場人物/
  next if title =~ /一覧/
  
  title_length = title.length
  
  if title_length > 3
  score = [-36000.0, -400 * (title_length ** 1.5)].max.to_i
  csv << [title, nil, nil, score, '名詞', '一般', '*', '*', '*', '*', title, '*', '*', type]
  end
  end
  end
  end

はてなWikipediaのキーワードCSVが用意できたら早速Rubyを実行してみます。

# ruby dicMaker.rb

するとcustom.csvが出来上がります。
超簡単です。ynakayamaさんありがとう!

ここまでは本当に記事のとおりです。
ynakayamaさんの記事では以下のコマンドでした。

/usr/local/libexec/mecab/mecab-dict-index -d /usr/local/lib/mecab/dic/ipadic -u custom.dic -f utf-8 -t utf-8 custom.csv

私のmacbrewで入れたmecabさんは以下のようになりました。

/usr/local/Cellar/mecab/0.996/libexec/mecab/mecab-dict-index -d /usr/local/Cellar/mecab/0.996/lib/mecab/dic/ipadic -u custom.dic -f utf-8 -t utf-8 custom.csv 

PATH通してあげればいいんでしょうけど面倒なのでそのままにしてます。
とりあえず無事dicファイルができあがりました!

macでmecabを利用してみる

めかぶ

macに日本語形態素解析Mecabをインストールするよってエントリーです。

brew install mecab
brew install mecab-ipadic

mecab-ipadicでエラーが出た。

Error: Failed to download resource "mecab-ipadic"

brewでインストールできるバージョンを把握しようと以下を実行してみる。

brew versions mecab

するとまたエラーが出た。ふぁぁぁあ!!

Error: Unknown command: versions

brewが2.0以降(?)versionsに対応しなくなったらしいと噂を聞く。
別途インストールして利用することができるようなので入れてみる。

brew install versions

そしてこれもエラー。。。

Error: No available formula for versions

ほんと泣けてくる。
とりあえずbrewのバージョンが中途半端ぽいので以下で一回アップデートして試す。

brew update
brew tap homebrew/boneyard
brew versions mecab

無事使えた。
インストールする必要ないんじゃん・・・

You should use the homebrew-versions tap instead:
  https://github.com/Homebrew/homebrew-versions

0.996    git checkout 10f80f1 /usr/local/Library/Formula/mecab.rb
0.995    git checkout 1c6ad82 /usr/local/Library/Formula/mecab.rb
0.994    git checkout 4844910 /usr/local/Library/Formula/mecab.rb
0.993    git checkout 642c664 /usr/local/Library/Formula/mecab.rb
0.992    git checkout bb95f13 /usr/local/Library/Formula/mecab.rb
0.99     git checkout 01788c0 /usr/local/Library/Formula/mecab.rb
0.98     git checkout 0476235 /usr/local/Library/Formula/mecab.rb

単純にbrewのバージョンが古かったっぽいので以下を実行して再度試す。

brew install mecab-ipadic

無事インストール完了。
なんだ・・・

これでやっとmecabを利用できるようになりました。
brewでインストールできない場合とりあえずupdate汁ってことか。

暇だからAndroid Studioを入れてみる

XCodeをアップデートしてる間暇なのでAndroidStudioを入れてみよう。

まずはAndroidStudioのダウンロード

Android Studio | Android Developers

macで入れてるとJava6入れろボケェ言われるから言われるがまま入れる。

Java for OS X 2014-001

ディレクトリの確認かな?

とりあえずデフォで入れてみる。

http://saku-java.be-ourselves.jp/wp-content/uploads/2014/03/ss_201403110106.png

するとすぐにインストール終わって起動できた。

http://saku-java.be-ourselves.jp/wp-content/uploads/2014/03/ss_201403110107.png

ここまでは意外と簡単なもんすな・・・

↓ちなみにAndroidStudioを日本語化するらしい。

The Developer Disk Image could not be mounted.

終電続きで久しぶりにXCode開いて実機で動かそうとしたら以下のようなエラーが出た。

The Developer Disk Image could not be mounted. XXXXXXX may be running a version of iOS that is not supported by this version of Xcode.

ずっとEclipse触って1ヶ月ぶりぐらいにXCode触ったもんだから一瞬ファッ!?となったが

単純に実機のiOS8.2が新しくてXCodeが対応してないよということ。

AppStoreでXCodeのアップデートを。。

「マンガ新刊」アプリ2.0を公開しました。

今回「マンガ新刊」アプリ2.0を公開しました。

前回の1.0は初めてのアプリリリースで、審査通ってAppStoreに掲載されることが目的でした。

今回はお気に入り登録、発売日のプッシュ通知、デザインの変更を中心に手を加えています。

トップのデザインから大きな変更を加えました。

どのようなデザインか、どんな機能があるか気になる方はぜひ上のリンクを押してみてくださいね!ぜひ!!(強め)

最新刊情報をバックグラウンドで毎日確認しているので、常に最新の情報を得ることができます。

お気に入り登録機能とプッシュ通知が今回の目玉ですかね・・

Twitterで「アプリ 新刊 マンガ」とかって検索すると、

と要望は高いようです。

個人的に新刊情報を手軽かつ確実に得たいという意思もあり作ったわけですが、 同じような悩みを抱える人にも使ってもらえればなと思います。

そんなこと言いながら広告付けやがって!見難いんだよ!とか、結局金儲けか・・と言う方もいるかと思います。

今回このアプリを実現するためにサーバをレンタルしています。

私は個人というだけでなく、本職で得た収入は全て嫁に納めており、少ないお小遣い制です。。(涙目)

その少ないお小遣いの中からサーバをレンタルして運用してますので、どうか許してください(震え声)

それでリリースして気になったことなんですが、アプリリリースしたからってすぐダウンロードされるわけではないんですよね・・

何万ものアプリ?何億ものアプリ?がある中から見つけてもらわないといけない・・・

発掘して頂く必要があるようです。

そんなの待ってられません。

Google先生に聞いてみたんですが、AppBankなどアプリ紹介サイトに掲載を依頼することが可能なようです。。

今回いろいろなアプリ紹介サイト様に掲載のお願いメールを出させていただきました。

どうぞ、掲載のほどよろしくお願いします。m( )m

アプリの宣伝でこうやったら効果あるよ!って情報お持ちの方ぜひ教えて下さい!!(前のめり!)

以上でーす。