2012-05-06から1日間の記事一覧

javaとかScalaで全角を半角に変換する方法

Scalaでテキストの類似度計算の前処理として全角を半角に変換したいんだけど、commonsとかにも無いみたい。まあ、日本人とかにしか関係ない処理だしなぁ。 正規表現でゴリゴリやっても良かったのだけど、どう考えても車輪の再発明だと思って探してみたらIBM…

レーベンシュタイン距離で文字列の類似度を計算してみる

電子書籍のタイトルをAmazonAPIに投げて、その結果からISBNを取得しようとコードを書いてるんだけど、Amazonさんの検索結果上位だからといって、必ずしも検索したい文字列に最も近い語というわけではないみたい。きっと、色々良い感じの補正をかけているので…