サーバーワークスの村上です。
このブログでは Amazon Quick Suite を使い、Kaggleの小売データセットを題材に、簡単な顧客離反(Churn)分析をやってみます(推論ではなくデータ分析)。
概要
今回試したことを簡単にまとめます。
- シナリオ(Scenarios)を使うと、プロンプトを入力するだけで要約・可視化が可能。追加の質問でネクストアクションを提案させることも可能
- 今回は解約と相関係数の高い要素の分析・可視化を行いました。
- Quick Researchで外部情報+社内データを横断し、引用付きの詳細な調査レポートを作れる
- 日本企業の実例を調査し、それを踏まえたアクションプランの立案をしました。
- SaaS系の生成AIソリューションとの違いは、BIツールである点・AWSサービスであるゆえのガバナンス面
Amazon Quick Suiteについて
Amazon Quick Suite は従来のAmazon QuickSightに複数の AI を活用した機能を追加したサービスの名称です。
機能の概要についてはAWS公式ブログにあるため、ここでの説明は控えます。
使用するデータセットについて
公開されているサンプルの店舗小売データセットを利用します。次のようなデータが格納されたExcelです。
- custid: 顧客ID。各顧客を一意に識別するためのIDです。
- retained: 顧客維持フラグ。1は顧客がサービスを継続して利用していること(維持)を、0は利用をやめたこと(離反)を示します。これが予測したい目的の変数です。
- created: アカウント作成日。顧客がアカウントを登録した日付です。
- firstorder: 初回注文日。顧客が最初に注文した日付です。
- lastorder: 最終注文日。顧客が最後に注文した日付です。
- esent: メール送信回数。顧客に送信されたメールの総数です。
- eopenrate: メール開封率。送信されたメールのうち、顧客が開封した割合(%)です。
- eclickrate: メールクリック率。送信されたメールのうち、顧客がリンクをクリックした割合(%)です。
- avgorder: 平均注文額。顧客の1回あたりの平均注文金額です。
- ordfreq: 注文頻度。一定期間内にどれくらいの頻度で注文しているかを示す指標です。
- paperless: ペーパーレス請求の利用状況。1は利用している、0は利用していないことを示します。
- refill: 詰め替え商品の購入状況。1は購入あり、0は購入なしを示します。
- doorstep: 玄関先配達サービスの利用状況。1は利用あり、0は利用なしを示します。
- favday: 最もよく注文する曜日。
- city: 顧客の居住都市。
シナリオ(Scenarios)機能を利用した分析
Scenariosについては、従来のAmazon Quick Sightで既に存在した機能です。
データに対して、プロンプトだけでデータ分析・推奨アクション提案などが可能です。
この機能については過去のブログでも触れています。過去のブログでは次のようなプロンプトを入力しています。
- 「解約率が高い都道府県にどのようなアプローチをすべきですか?」
- 「一部顧客に10%割引を適用したときの費用対効果」
今回は解約と相関がある要素を調査しました。すると以下のようにメールエンゲージメントが重要である旨のレポートが生成されます。

次に、アクションプランを作成しました。すると次のようにデータに基づいた提案が作成されます。
データ分析に基づき、顧客離反を防ぐための重点戦略を以下に示します:
– メールエンゲージメントの向上:パーソナライズされた週刊ニュースレターとプロモーションメールを送信(離反率との相関が最も強く-0.718)
– ペーパーレス通信の促進:ペーパーレス化に切り替える顧客に割引を提供
– 自動補充サービスの登録促進:自動補充サービス開始後3ヶ月間5%割引を提供
– 曜日別ターゲティングの強化:日曜日に特別プロモーションを送信しエンゲージメント向上を図る(解約率33.2%)
– メールコンテンツの質向上:件名のA/Bテストを実施し開封率を改善
Quick Reserch
Quick Researchは新たに実装された、所謂Deep Researchに相当する機能です。
今回のデータセットと日本の実例を踏まえた分析・提案を指示しました。以下が入力プロンプトです。
store_dataを見てください。わが社の顧客データです。カラムの概要は以下のとおり。顧客の離反がどのような要因で起きているのか分析し、対策を打つための提案をしてください。提案するときは、store_dataだけではなく日本における成功・失敗事例を参考に根拠を示して提案してください
custid: 顧客ID。各顧客を一意に識別するためのIDです。
retained: 顧客維持フラグ。1は顧客がサービスを継続して利用していること(維持)を、0は利用をやめたこと(離反)を示します。これが予測したい目的の変数です。
created: アカウント作成日。顧客がアカウントを登録した日付です。
firstorder: 初回注文日。顧客が最初に注文した日付です。
lastorder: 最終注文日。顧客が最後に注文した日付です。
esent: メール送信回数。顧客に送信されたメールの総数です。
eopenrate: メール開封率。送信されたメールのうち、顧客が開封した割合(%)です。
eclickrate: メールクリック率。送信されたメールのうち、顧客がリンクをクリックした割合(%)です。
avgorder: 平均注文額。顧客の1回あたりの平均注文金額です。
ordfreq: 注文頻度。一定期間内にどれくらいの頻度で注文しているかを示す指標です。
paperless: ペーパーレス請求の利用状況。1は利用している、0は利用していないことを示します。
refill: 詰め替え商品の購入状況。1は購入あり、0は購入なしを示します。
doorstep: 玄関先配達サービスの利用状況。1は利用あり、0は利用なしを示します。
favday: 最もよく注文する曜日。
city: 顧客の居住都市。
結果を抜粋して掲載します。BIツールとしての強みが見られたのですが、表以外にもグラフを示して説明してくれます。このあたりは他のDeep Researchには見られない機能かと思います。

また、日本の事例についても調査させているので、メールエンゲージメントが重要だとしつつ、単にメール送信の頻度を増やすのは悪手だと説明しています。具体的な企業名は伏せます。

アクションプランの作成では、実例を踏まえ「メール送信は週1-2回程度」と提案しています。

SaaS系のAIソリューションとの違い
BIツールである点
Amazon Quick Suiteは新しいサービスですが、元々実装されていたAmazon Quick Sightの機能はそのまま利用できます。
それだけでなく、新たに実装されたAI機能とも親和性が高く、例えば先ほど示したようにQuick Researchの出力結果にグラフが出力されたり、Quick Sight側で作成したダッシュボードをQuick SuiteのSpaceで利用したりできます。
料金体系やガバナンス面
最も大きな違いかと思いますが、当然料金面では単価はもちろん、利用料金がAWS利用料として請求される点や、認証・証跡管理についてもAWSとの統合されている点があります。
例えばIAM Identity Centerを利用した認証や、CloudTrailに証跡が残ったり、IAMロールを使ってAmazon Quick SuiteがAmazon S3やAmazon Q Businessと接続するなど、管理面での違いです。
村上博哉 (執筆記事の一覧)
2020年4月入社。機械学習が好きです。記事へのご意見など:hiroya.murakami@serverworks.co.jp
コメント