ALBERT_engineer のすべての投稿

Redshiftで遊ぼう~アソシエーション分析~(後編)

まえがき

Redshiftで遊ぼう~共起分析~(前編)の続きです。

前回作成したクエリではまだ DS_BCAST_INNERが発生しており、改善できる余地があるように思われます。

今回のエントリではこれを解消するとともに、クエリを作っていくときの注意点をまとめてみます。

続きを読む Redshiftで遊ぼう~アソシエーション分析~(後編)

Redshiftで遊ぼう~アソシエーション分析~(前編)

まえがき

弊社のsmarticA! DMPでは、 DWHとしてAmazon Redshiftを使用しています。
RedshiftはPostgreSQL 8.0.2をベースに開発されており、SQLを使った柔軟な分析が可能です。
今回のエントリでは、Redshiftに蓄積されたログデータを用いて共起分析をやってみようということで、 共起性の指標となるさまざまな係数を計算してみます。

その上で、Redshiftを使うときの注意点をまとめてみます。

続きを読む Redshiftで遊ぼう~アソシエーション分析~(前編)

文字コード地獄秘話 第3話:後戻りの効かないUnicode正規化

はじめに

おっと、またまた会いましたね。文字コードおじさんです。前回、Unicodeにおける結合文字列という話題を取り上げました。思わず「いやあ、結合文字列は強敵でしたね」と口走りそうになる代物でしたが、今回はそれに関連したUnicode正規化のお話をしてみようと思います。

続きを読む 文字コード地獄秘話 第3話:後戻りの効かないUnicode正規化