タグ別アーカイブ: MlLib

カエルでもわかる!Spark / MLlib でやってみる協調フィルタリング(後編)

はじめに

前編では MLlib で実装されている協調フィルタリングについて、アルゴリズムの面から解説してみました。 いわば理論編です。 後編は実践編として Java コードや性能評価実験の結果を見ていきます。

続きを読む カエルでもわかる!Spark / MLlib でやってみる協調フィルタリング(後編)

カエルでもわかる!Spark / MLlib でやってみる協調フィルタリング(前編)

はじめに

当ブログでは Apache Spark プロジェクトの機械学習ライブラリ MLlib について何度か取り上げました。

今回のエントリでは MLlib の協調フィルタリングについて書きます。 アルゴリズムの簡単な解説と Java からの利用方法、性能評価実験などの話をします。 Spark 1.1.0 が9月にリリースされてからしばらくたってしまいましたが、1.1.0 から実装された機能も紹介します。

少し長くなるので前・後編に分かれます。

続きを読む カエルでもわかる!Spark / MLlib でやってみる協調フィルタリング(前編)

Scala ではじめる Spark / MLlib の単純ベイズ分類器

はじめに

以前のエントリにて Spark / MLlib の K-means を取り上げましたが、今回は同じく MLlib にて提供されている機械学習アルゴリズムの一つ、 単純ベイズ分類器 (Naive Bayes, ナイーブベイズ) を使ってみましょう&K-分割交差検証をしてみましょう、 というエントリです。

単純ベイズ分類器そのものについては読者の皆様はご存知、という前提でこの後の話を進めてしまいますので、 「ちょっと良くわからないよ待ってくれ!」という方は

などのページを一読することをおすすめします。

続きを読む Scala ではじめる Spark / MLlib の単純ベイズ分類器