データエンジニアリング

For achieving success of digital transformation

拡張性のある持続可能な分析エコシステムには、信頼性の高いデータエンジニアリングが不可欠です。AURIQはデータレイクソフトウェア「essentia」の利活用を支援するデータエンジニアリングサービスを提供しています。お客様のビジネス課題を理解した経験豊富なコンサルタントが、業務運用を踏まえた実務的なデータ活用を適切な規模感でご提案いたします。

企業によるデータ活用の促進を人的にサポートするサービスのため、新たなサイロを生み出すような冗長なシステムはご提案いたしません。すでにお持ちのアセットは有効に活用し、データ処理、データ分析の要件に見合った機能をessentiaおよび最新のテクノロジーを駆使し、高いコストメリットでご提供いたします。

顧客課題と解決策

あらゆるシステムから集めたデータを分析に使える状態に準備するプロセスは、データプレパレーションと呼ばれますが、膨大な作業量と高いコストがかかるのが現状です。結果が見えない状態での投資判断のハードルを下げ、適切な規模からのミニマムスタートを確実に成功させるために、AURIQは利用期間の制約のないデータレイクサービスの提供および、経験豊富なデータエンジニアリングサービスでお客様と並走し、ともに成果を出すことを目指しています。

提供例

  • ◆バッチやリアルタイムストリーミングを含むすべてのデータソースの統合
  • ◆ETLなどの事前データ処理
  • ◆多数のデータソースと多数のキーを用いた複雑な名寄せ処理
  • ◆分析の前段階としてのデータアセスメントの提供
  • ◆データサイエンスを用いたデータの探査
  • ◆最適なアルゴリズムやモデルを使用したデータ処理やアナリティクス
  • ◆特徴量エンジニアリングを用いた予測精度向上
  • ◆超大規模データのリアルタイムのデータ処理および他システムとのデータ連携
  • ◆持続的でかつスケーラブルな分散型エコシステムの提供
  • ◆取り扱うデータのレベルに応じた適切なデータセキュリティの提供

データエンジニアリングによってできること

複数のCookie値を一意の会員IDに名寄せする

移動中はスマートフォン、会社ではデスクトップやラップトップ端末、自宅ではタブレットなど、現在社会では一人のユーザが日常生活の中で複数の端末を使い分けています。使用するブラウザが異なると、Webサイトから発行されるCookie値が変わり、実際は同一人物のアクセスであったとしても、データ上では異なるユーザとして記録されます。そこで必要となるのが、「名寄せ処理」です。複数のCookie値を一意の会員IDと紐付けマスター化することで、CVの時点から過去に遡って、来訪や購入、会員登録のきっかけとなった広告やキャンペーンの効果測定や貢献度の分析、リテンションへのデータ活用などが可能になります。

ユーザー判定テーブルデータ処理例

  1. N回目訪問で、cookie: xxとログインID(uid1)を取得。ユーザ判定テーブルに記録。
  2. N+1回目訪問で、cookie: xxを記録。ユーザ判定テーブルを参照し、会員IDはuid1と判明。uid1のログインなし訪問として処理。
  3. 次の訪問で、uid1がcookie: aaの端末でアクセスし、ログイン、会員IDはuid1と判明。cookie: aaをuid1のユーザ判定テーブルに追記。
  4. 更に次の訪問で、uid1がcookie: aaの端末でアクセス。ログインしなかったが、ユーザ判定テーブルのuid1の情報と照合し、uid1のログインなしの訪問として記録。

デジタルチャネルシフトに向けた顧客接点強化

Webサイト上の行動とコールセンターへのコンタクト履歴は、通常、データ上は分断されています。コールセンターのコンタクト履歴はその範囲内でしか行動を把握できません。会員のWeb上の行動データを統合することで、タッチポイントを跨いだ時系列での会員の行動履歴を可視化し、インバウンドコールにおける問い合わせの因果関係の把握・自己解決の促進、アウトバウンドコールにおける対象顧客の抽出・効果的なセグメンテーションに活用することが可能です。

顧客接点強化に向けたデータエンジニアリング

実際にコールセンターに架電した会員がその過程においてWebサイト上でどのように情報収集していたかを分析、効果的なコミュニケーションや情報提供の方法、FAQの利用促進の検討に活用します。会員が閲覧中のFAQページをコールセンターのオペレータが把握し、顧客対応力を強化することで顧客満足度を上げ、自己解決率の向上を図ることで、将来的な入電を減らすなど長期的、かつ幅広い用途でのデータ活用が可能です。

タッチポイントの統合で見えてくる顧客体験イメージ

Webログ、コールセンターログのデータを会員に名寄せすることで、タッチポイントを統合し、実際の顧客行動や顧客体験に近づけ、正確な顧客理解に導きます。

Data Engineering
CASE STUDY

CASE STUDY1 複数のサービスでそれぞれに付与されているIDを集約し、集合IDを付与

複数のサービスでそれぞれ付与されているIDを一定のルールで集約し、集合IDを付与します。 過去に接触があった各サービスや媒体、キャンペーンで取得できるIDを一定のルールで名寄せし、行動やタッチポイントの特徴を明らかにすることで、ターゲティングや各種施策にデータを活用します。

【データ処理概要】
STEP1 IDの値が入っているデータと入っていないデータを分離
STEP2 空のカラムには他と重複しない番号を付番、集合IDを付与
STEP3 処理対象のデータが同一の値で集合IDが異なる場合は集約
STEP4 元データの集合IDをSTEP3の値に修正
STEP5 同様の処理をIDごとに繰り返し実行し、最終的な集合IDのリストをアウトプット

CASE STUDY2 オンライン購入者の予測
~特徴量エンジニアリング

特定商品を買う可能性がある会員を予測し、適切な施策を実行し、売上をアップしたい。データ量が膨大(100億超)なため、一部のデータしか活用できず、予測精度が良くない。これらの課題に対し、PivotBillionsで全件データ(100億超)から特徴量を抽出し、AWS SageMakerのアルゴリズム群を活用し、最適解を探索しました。

CASE STUDY3 IoTデータ ~ジオフェンスを用いた行動分析

ジオフェンスや端末データを用いて移動距離や行動範囲、行動時間帯などを分析し、データを活用したい。対象となるデータが100億超あり、これまではサンプリングで調査・分析をしていた。全件を対象にデータ処理を行い、実態を正確に把握したい。これらの課題を距離差や時間差の曖昧結合処理で解決しました。

今日からはじめてみませんか?

AURIQの製品・ソリューションの
資料をお配りしています。
お電話でも承ります。お気軽にご相談ください。