DEVELOPER’s BLOG

技術ブログ

トップ
技術ブログ
記事詳細

AI・機械学習が作り出すデータの活用方法

2020.02.26 細井奎吾

利用事例機械学習論文解説

機械学習のアルゴリズムがつくりだす状況を利用して、自然実験に近い分析をおこなった事例を紹介します。
このような事例を応用すれば、実際に実験をおこなわなくても介入効果などが分かるかもしれません。

はじめに

昨今、AI・機械学習の進歩のおかげで、様々な予測をおこなうことができるようになりました。
みなさんも機械学習を使った株価の予測などニュースでみかけることも増えたと思います。
株価だけでなく、交通量からチケットの売上・電力消費量etc......
なんでも予測されていますね。笑
このように2019年現在、たくさんの企業がなんらかの予測をするためにデータを集めています。

今回はこうした集めたデータを利用して、さらに分析をした事例を紹介します。
※正確に表現すると機械学習アルゴリズムが作った状況を利用して分析する事例です。

介入効果とは

介入効果と書くとピンと来ませんが、おこなったアクションに効果があったのかということです。

ある会社で商品の宣伝のために、全国でテレビCMをおこなったとします。
その結果、商品の売上が30％も上がりました！　すごい！　これからどんどんテレビCMを放送しよう！

本当にこれで良いでしょうか？

クリスマス時期のため売上が上がったかも...。（実際に多くの売上のデータでは季節調整がされています。）
もしくは、有名人がたまたまSNSでその商品の写真をupしたことで、若者を中心に大流行したからかも...。

テレビCMはお金をかけてやる必要があったのでしょうか？
広告の効果を正確に知るには、広告以外の状況が同じ店舗の売上を比べればわかります。(ざっくりいうとほぼ状況が同じものを比較する)

この場合だと、地域ごとにテレビCMを放送する地域、しない地域で分け、さらに売上状況や天気等、条件を揃えて比較する必要があります。

残念ながらこのような状況を意図的に作り出すのは難しいです。
より多くクリックされるweb広告を比較したり、奨学金の効果など、状況を同じにして効果を実験したい例はたくさんあります。

こうした詳しく原因を分析することを因果推論といいますが、これについては当社の記事「はじめての因果推論」を参考にしてみてください!

アルゴリズムが生むランダム化実験

ここで登場するのが、機械学習のアルゴリズムを利用して得るデータです。
需要と供給によって価格が変わるUberXのデータを使って、利用者がどれくらい価格に反応するか(価格弾力性)を測る分析を紹介します。
ここでネックなのが、価格だけの影響を知りたい場合に、どうやって他の要因を排除するか...
この点は、先程のテレビCMの効果を測る例と共通しています。

ここで役立つのが、機械学習を使ったアルゴリズムで集めたデータです！
Uberはもともと状況に応じて、自動で価格を上げ下げする仕組みです。そのためアルゴリズム内部では、1.249など少数点以下もしっかり計算されています。
しかし、利用者はそこまで細かい金額では払えないので、少数点第二位以下を四捨五入して表示するようプログラムされています。
ここにランダム化実験を見出すことができます。
つまりUberでは、1.249は1.2と表示され、1.251 は1.3と表示されることになります。
しかし値段以外の要因は1.249と1.251では、ほとんど同じです。よってこの２つで比較すれば、価格が利用者にどう影響するかを明らかにできます。

アルゴリズムが生むランダム化実験の応用性

このように、機械学習のアルゴリズムで集めたデータに自然実験が行えるような例は、たくさんあるのではないでしょうか？
例えば、裁判官の判決や奨学金を与えると生徒はどうなるのかなどです。
実際サイバーエージェントでは、こうした手法を使い広告の効果を測定する研究も行われているそうです。

このような手法を使えば、ランダム化実験や人為的なABテストなど、時間やコストが多くかかるプロセスを
回避できるかもしれません。

参考文献

・矢田紘平、成田悠輔「機械学習は自然実験を作り出す」『経済セミナーe-book No.15』、日本評論社、2019年12月、19-20ページ
・Cohen, Peter, Robert Hahn, Jonathan Hall, Steven Levitt and Robert Metcalfe （2016） "Using Big Data to Estimate Consumer Surplus: The Case of Uber,"NBER Working Paper 22627.
・Narita, Yusuke, Shota Yasui and Kohei Yata （2019） "Efficient Counterfactual Learning from Bandit Feedback,"Proceedings of the Thirty-Third AAAI Conference on Artificial Intelligence, pp.4634-4641.

Twitter・Facebookで定期的に情報発信しています！
Follow @acceluniverse

一覧にもどる

通信をすべてNAT Gatewayを通していませんか？棚卸しによる70%のコスト削減に成功！

目次背景原因究明解決策結果背景 AUCでは、SRE活動の一環として、AWSコストの適正化を行っています。（技術ブログ『SRE：コスト抑制のための異常値検知機構の実装』）コスト適正化における課題は、大きく分けて下記の4つです。 ①コストは月末にチェックしており、月中でコストが急激に上昇した場合発見が遅れてしまう。 ② 不要なリソースが放置されていたり、新たなリリースによって生じたコストを確認していない。 ③ AWSが提供するベスト

記事詳細

通信をすべてNAT Gatewayを通していませんか？棚卸しによる70%のコスト削減に成功！

AWS SRE 利用事例

目次実装前の課題採用した技術と理由実装した内容の紹介改善したこと（抑制できたコスト）実装前の課題 SRE（Site Reliability Engineering：サイト信頼性エンジニアリング）とは、Googleが提唱したシステム管理とサービス運用に対するアプローチです。システムの信頼性に焦点を置き、企業が保有する全てのシステムの管理、問題解決、運用タスクの自動化を行います。弊社では2021年2月からSRE活動を行っており、セキュリ

記事詳細

SRE：コスト抑制のための異常値検知機構の実装

AWS SRE 利用事例

目次 AUCの使用ツール GitHub、CircleCI使用までの流れ AWSの構成図まとめ AUCの使用ツール弊社ではGitHubとCircleCIの2つのツールを利用し、DevOpsの概念を実現しております。 DevOpsとは、開発者(Development)と運用者(Operations)が強調することで、ユーザーにとってより価値の高いシステムを提供する、という概念です。　開発者は、「システムへ新しい機能を追加したい」　運用者は、「システムを

記事詳細

AWSを利用した弊社の開発環境

利用事例

2022年卒大学生の皆さん！コロナウイルスが流行していることで就活にどういう影響があるのか、とても不安ですよね。今回は業界ごとに採用人数を予測し、「どの業界が狙い目なのか」機械学習を使った分析手順を紹介します！目次概要手順今後の課題 1.概要データセットの内容分析対象の7業界・各4企業化粧品電子機器商社不動産金融サービス IT・情報説明変数と目的変数特徴量年初の株価、決算報告書提出翌日の株価、一株あたりの純資産額、従業員数

記事詳細

機械学習で採用予定人数を予測する。狙い目企業はどこ？

利用事例機械学習

DEVELOPER’s BLOG

AI・機械学習が作り出すデータの活用方法

はじめに

介入効果とは

アルゴリズムが生むランダム化実験

アルゴリズムが生むランダム化実験の応用性

参考文献

関連記事