マーケティング

  1. HOME
  2. 事業
  3. マーケティング

はじめに

はじめに

FEGでは、業務の多くが金融機関様相手の仕事になりますので、業務を金融関係とそれ以外とに分けています。その際の金融機関以外の業務が非金融系業務ということになります。つまるところ、データ解析のうち金融系業務以外ということで、いわば、「何でもあり」となっています。

金融系業務も非金融系業務もともにデータ解析を行っていますから、分析のやり方については、特に違いがあるわけではありません。ただ、非金融系業務については、FEGにとって初めてのお客様だったり、初めての問題領域だったりすることも多いです。その場合には、当該領域に関する業務知識の面で、お客様のお持ちになっている知識量との圧倒的な差が存在するということも多くあります。そこで「俺たちは自分の会社のことをもう良く知っている。」「外からきたお前たちに教えてもらうことなどない」と言った、現場でデータをよく扱っている方々からの反発を受けることもあります。

その場合でもFEGはまずはデータを虚心坦懐に眺めることから始めます。お客様の業務知識に基づく仮説をないがしろにするわけではなく、もちろん、多くの場面で参考にはさせていただくのですが、まずはデータを見ることを行います。比喩的な表現になりますが、データを見ることから明らかになった事実が10あった場合に、8はお客様がすでにご存知のことです。残り2のうちの1は、データの間違いや、システムのエラーなどになって、これは知らなかったとお客様がおっしゃる業務上の知見は1つしかありません。しかし、この1つがかなり重要な場合が多いです。しかも、この1つは、従来の業務知識に基づく仮説からは絶対に得ることができません。データそのものから発見するしかないのです。ここに、私どものような外部の者がデータを分析する価値があると思います。

FEGは創業以来、数はあまり多くはないものの、データ解析のノウハウを使って、金融系以外の様々な業務を行ってきました。もちろん、データ解析の多くの適用領域のうちの一部にすぎませんが、FEGで取り扱ったことのある事例から、いくつかご紹介していきたいと思います。

顧客抽出

ある商品についての話、たとえば、来月にキャンペーンをするこの製品を誰が買ってくれるのか、という問題であれば、まさにそういう商品を買ってくれる「お客様」を探すことになります。逆に、あるお客様を特定すれば、そのお客様は「どのような商品だったら買ってくれるのか」という問題に読みかえることになります。前者であれば、新製品の広告メールなりを出すお客様のリスト抽出などに結実するでしょうし、後者であれば、いわゆるレコメンデーションということになります。また、買わなくなるだろう「お客様を探す」というように課題を読み替えると離反分析という課題になります。

先にも述べたように、ある商品を買ってくれるお客様を探すことが課題です。以前はマーケティング・コストがかかっていたので、買う確率の高いお客様を抽出して、あまり買う可能性のないお客様は施策対象外とすることによって、全体の費用を圧縮して利益を最大化することが課題でした。現在ではデジタル・マーケティング技術の発展により、個々のダイレクト・マーケティングのコストは下がっていますので、問題領域が異なってきています。すなわち、同じお客様に頻繁にご案内が行くことによる広告効果の減少やCS(顧客満足度)の低下ということが新しい問題になっています。

ある目的(この商品を買うかどうか)を定めて、それを当てに行くという、「教師有り学習」の手法を活用してモデルを作ることになります。その際、決定木などの可読性の高い手法を使うと、お客様ごとの確率がつくとともに、木の分岐項目をもとに、対応施策を考えることができます。例えば、下記のような「離反分析」のモデルができた場合に、通話量の多い顧客のうち、「海外通話料金」が10,000円以上か未満かで離反率が大きく変化しています。これを参考にして、通話量の多いお客様の「海外通話料金」を安くするという離反防止策を考えることができます。

携帯電話の離反モデルの一部

※上記の事例は、わかりやすくするために、2000年くらいの状況についてのダミー・モデルです。2016年現在、移動通信の利用状況は大きく変化し、より複雑なものとなっています。このように「わかりやすい」例は、残念ながら、まず見ることができません。

不正検知

不正検知

不正検知とは何か

以前、データマイニングと言う表現がよく使われていた頃に、データマイニングの主要適用領域の一つとして挙げられていたのが「不正検知」です。実際に法に触れているかどうかは別として、ビジネスにとって好ましくない行為や、そういう行為をする人を見つけ出すという課題に答えるためのデータ分析のことを言います。たとえば、オークションにおける詐欺出品を見つけたり、振り込め詐欺に使われている口座を見つけたり、あるいは研究所から機密情報を持ち出す人を見つけるようなことが対象になります。

見つけ出す対象が「この新商品を買ってくれる人」から「ネットオークションで詐欺をする人」に変わっただけだと思えば、必要な技術的な課題については、ある程度見通しがつくかもしれません。ただし、以下のような「不正検知」に固有の事情があることには注意しておいてよいでしょう。

不正検知と人間判断

さきほどの「この新商品を買ってくれる人」をみつける場合には、通常の場合の2倍から3倍、購入確率が高ければ、その人にダイレクト・マーケティングを仕掛ける価値がありそうです。(もちろん、実際にはその商品が売れた場合の利益と、マーケティングコストによって、どれくらい確率が増えれば良いかが決まるわけですが。)しかし、不正検知の場合はそうは行きません。失敗した場合のコストがとても大きいからです。たとえば、ネットオークションの詐欺出品を見つけた場合の対処法としては、その出品を削除したり、あるいはその出品者の出品権限を停止することなどが考えられますが、これが間違っていた場合に、CS(顧客満足度)を著しく棄損することになり、とりかえしのつかない事態になることは十分に予想されます。それはどれだけモデルによる確率が高くなったとしても、避けることのできないリスクとなります。そこで、多くの企業では、こうしたデリケートな案件では、機械(モデル)による判断を参考にするとしても、最後の決定は人間が下すようにすることにしています。そうした場合、良いモデルというのは、最終的に人間が判断すべき件数を少なくするために、濃いグループを抽出するという「フィルタリング」の能力が高いことを言うことになります。

フィルタリング機能としての「不正検知」モデル

不正検知と「はずれ値」分析

ネットオークション詐欺や振り込め詐欺などの場合は、被害届が出されますので、探し出すべき不芳行為は、その全貌がほぼ明らかになっていると言ってよいでしょう。そこで、明らかになった不芳行為を見つけるための判別モデルを作ることになります。技術的にはオーソドックスな教師有り学習ということになります。

ところが、保険金詐欺などの場合、巧妙な犯罪行為が露見していない場合が考えられます。特に自動車保険の物損事故などの場合には、隠れた詐欺行為がかなりあるのではないかと思われます。そうした場合、今、明らかになっている詐欺行為だけを目的変数としていて良いのかという疑問が生じます。今、明らかになっている行為だけを目的としたモデルを作っても、隠れた詐欺は見つけることができないからです。さらには、研究所の機密情報持ち出しなどの場合は、そうした行為がそもそも少なく、また、露見することはもっと少ないという問題があります。こうした場合には、通常の教師有り学習の手法では課題を解決することは非常に困難です。

このような場合に良く使われる方法が、「はずれ値」分析です。何らかの不芳行為を行う場合には、その他の正常な行為を行う場合とは異なった振る舞いをするのではないかという仮定のもとに、全体の中で「はずれた」行為を見つけに行くという方法です。

はずれ値の例

Type1のような場合、たとえば多くの人は1日あたりのコピー枚数が50枚以内なのに、500枚以上になる人がいるとか、Type2の場合、いつもは朝10時過ぎに出勤して午後8時くらいに帰宅するのに、この2日間は朝8時に出社して帰宅も午後9時以降だったというような場合に、より詳しく調べてみる対象者に加えても良いかもしれません。これらの手法は、どれが正しいとか、どれが全ての場合に適当だというようなものではありません。事案により、またデータにより、ふさわしい手法を使って、様々な不芳行為を検知するモデルを作成して、ビジネス課題の解決のお手伝いをしています。