スペシャルトピックス

世界に誇る分析力の証明~国際的データマイニング・コンテストで世界第2位を2度獲得~

  1. HOME
  2. トピックス
  3. スペシャルトピックス

当社は、2009年2015年と2度もデータマイニングの世界大会である米国KDD CUP()にて世界第2位を獲得しています。当社の世界トップレベルのデータマイニング技術は、金融業界に留まらず、あらゆる業界から信頼され仕事の引き合いがあります。 最先端の技術水準を保ちながらも、世の中の様々なものに興味を持ち探究し、自己研鑽を続ける姿勢が、権威ある賞を受賞できたことにつながっています。

2015年 国際的データマイニング・コンテストで2009年に続き再び世界第2位に入賞

株式会社金融エンジニアリング・グループ(本社:東京都中央区、代表取締役社長:宮村 幸夫、以下:FEG)、および新日鉄住金ソリューションズ株式会社(本社:東京都中央区、代表取締役社長:謝敷 宗敬、以下NSSOL)の連合チーム『FEG&NSSOL@DataVeraci』が、データマイニングの世界大会であるKDD Cupにおいて第2位となりました。

KDD Cup(Knowledge Discovery and Data Mining Cup)は、コンピューターサイエンス分野で最も古く権威ある競技会のひとつです。過去には2009年にFEGが単独で第2位となりましたが、今回はFEG、NSSOL連合チームでの初入賞となりました。

2015年の課題は、CRM分析の中でも特に重要な要素である、顧客の離反分析に関する内容で、「オンライン学習講座(MOOC)の受講生のアクセスログを用いて、講座の履修を脱落する確率を予測する」という課題でした。

今回の勝因は、モデル構築技術の高さに加えて、人間行動の断片であるデータを実務経験豊富なデータサイエンティストが分析し、データの裏側にある実像を的確に捉えたことと、NSSOLのシステム研究開発センターで開発したデータ分析統合環境『Data Veraci(ダータヴェラーチ)』により、さまざまな得意分野を持つデータサイエンティストの叡智の結集が、非常に高度なレベルで実現したことにあります。

FEGは世界トップレベルのデータマイニング技術を活かし、金融分野を中心に調査、分析、コンサルティングといったサービスを提供してまいりました。 NSSOLは、製造業、流通業、サービス業、社会・公共分野を含む広範な業種に顧客基盤を持ち、BI、大規模DWHシステムの構想・設計・構築実績を積み重ねてまいりました。2011年6月には、データ分析・モデル化及び戦略的情報活用を主眼としたシステム構築需要への対応力を一層強化するため、両社にてデータサイエンス&テクノロジーセンターを設立しております。

FEGおよびNSSOLは、これからもIoTやビックデータを含めたデータ分析サービスおよび統合マーケティング基盤の構築サービスを提供し、お客様の既存ビジネスの革新的な進化や新たなビジネスの実現を強力にサポートして参ります。

KDD Cupについて

KDD Cup(Knowledge Discovery and Data Mining Cup)は、コンピューターサイエンス分野の学会であり、100カ国以上、9万2千人の会員規模を誇るACM(the Association for Computing Machinery 本部米国)の分科会であるSIGKDD(Special Interest Group on Knowledge Discovery and Data Mining)が毎年開催する競技会であり、この分野で最も古く権威ある競技会のひとつです。

1997年に第1回が開催されて以来、主催者(SIGKDD)が提示する様々な課題(「ウェブマイニングによるマーケティング」、「テキストマイニングによる論文の分類」、「バイオデータの分析」、「医学データの分析による病気の予測」など)に対し、世界中の大学や企業、研究機関が参加して、モデル精度の高さを競っています。

データ分析統合環境 『Data Veraci(ダータヴェラーチ)』 について

2014年10月9日のプレスリリース「新日鉄住金ソリューションズ、データ分析統合環境Data Veraciによるデータ分析コンサルティングサービスの提供を開始」をご参照ください。

  • NS Solutions、NSロゴ、及びData Veraci/ダータヴェラーチは、新日鉄住金ソリューションズ株式会社の登録商標です。
  • 本文中の会社および商品名は、各社の商標または登録商標です。

株式会社インプレスによるサイトIT Leadersにて、KDD Cup 2015で準優勝したチームメンバーによる連載

データサイエンティストの思考法~KDDCup世界第2位の頭の中~」(全7回)が掲載されています。

競技会でのデータ分析の中で分析者が何を思い、何を考え、何をしたかという事からデータ分析の新潮流まで幅広く語っております。(記事をご覧になるにはIT Leadersへの登録(無料)が必要です。)

チームメンバーである加藤亮による「エストレーラ」寄稿文

機械学習による個人ローン審査業務のイノベーション」機械学習と新たなイノベーションの潮流について語っております。

本件問合せ先

株式会社金融エンジニアリング・グループ
TEL:03-5117-9000(代表)

その他に関するお問い合わせ

2009年 国際的データマイニング・コンテストで世界第2位に入賞

データマイニングの分野で活発な研究活動を行っている国際的団体に、ACM/SIGKDD(※1)があります。毎年、同団体主催でKDDカップ(Knowledge Discovery and Data Mining Cup)と呼ばれる競技会が開催され、精度の高いモデルを構築する技術を競っています。今年は450を越えるチームが全世界からエントリーし、その中で、当社は SLOW TRACK (モデル構築の期間が1ヶ月)のセクションで過去最高の第2位となり、また、FAST TRACK(モデル構築の期間が5日間)のセクションでも入賞は逸しましたが第5位となりました。

2009年のテーマは、携帯電話のチャーニング(乗り換え)、クロスセル、アップセルに関わる問題でした。これらの行動に関する個人データを分析して予測モデルを構築し、その精度につき競います。具体的には、主催者側より上記行動を行ったかどうかを示すフラグが付いたデータセットが提示され、構築したモデルをフラグが付いていないデータセットに適用し、ROC(※2)を尺度とし判定し、その説明力により精度を競います。3つの行動確率が予測されますが、最終評価は3つのROCの平均値が対象となります。説明変数はLARGE(変数が約1万5千項目)とSMALL(変数が240項目)の2種類が用意されました。

当社は若手のコンサルタント主体に4チーム(各チーム4名程度)を編成し、基本的には各自、業務終了後の作業で対応しました。各チームそれぞれ工夫を凝らした分析手法を採用しました。第2位になったチームが採用した分析手法は、Stochastic Gradient Boostingと呼ばれるもので、変数の選択・加工のステップにかなり独自の工夫をこらしています。必ずしも、採用した手法・ツールのみで分析の精度が決定するわけではありませんが、日頃の実務経験によって蓄積された分析に関するノウハウが活かされたものと考えています。

(※1)ACM : the Association for Computing Machinery /SIGKDD:Special Interest Group on Knowledge Discovery and Data Mining
(※2)ROC :Receiver Operating Characteristic

本件問合せ先

その他に関するお問い合わせ