ブレインパッド、ビッグデータ対応の分析基盤としてインメモリコンピューティング製品「SAP HANA(R)」の提供を開始

株式会社ブレインパッドは、SAPジャパン株式会社が提供するインメモリコンピューティング(*1)製品「SAP HANA(R)」の提供を本日より開始いたします。このたび、ブレインパッド、SAPジャパン、シスコシステムズ合同会社の3社は、「SAP HANA」と「Cisco UCSサーバー」を活用し、ビッグデータ対応 機械学習・予測分析システム「SAP(R) BusinessObjects(TM) Predictive Analytics(2016年5月にSAP(R) Predictive Analyticsより名称変更)」による予測モデル構築に関するパフォーマンス検証を実施いたしました。

その結果、一般的にデータマイニング(*2)工程の大半を占め、ボトルネックとなりやすいと言われる大量の説明変数を構築する作業の処理速度が高速化され、従来のリレーショナルデータベース(RDBMS、*3)と比較して、最大で97%の工数削減となるなど、劇的にパフォーマンスが改善することが実証されました。

今後ブレインパッドは、この検証結果をもとに、データ分析にかかる時間を大幅に削減したいと考えている企業向けに、これらの製品を組み合わせた予測分析システムの導入を行ってまいります。

(注)
・SAP HANA:エスエーピー・ハナ
・Cisco UCS:シスコ・ユーシーエス
・SAP BusinessObjects Predictive Analytics:エスエーピー・ビジネスオブジェクツ・プレディクティブ・アナリティクス

▽本検証結果をさらに詳しくお知りになりたい方は、以下URLより資料をダウンロードください。
 URL:https://form.brainpad.co.jp/webapp/form/19108_ygcb_32/index.do

■パフォーマンス検証実施の背景
ブレインパッドは、ビッグデータ対応の予測分析システムとして、「自動」「高速」「高精度」を実現する、「SAP BusinessObjects Predictive Analytics」を10年以上にわたり多くの企業に対して導入してまいりました。しかしながら、同製品の優位性である高速性を活かすには、データの参照先となるデータベース側の性能やその構築状況に依存する部分も多いため、本来の分析速度を活かしきれないケースもありました。

このような課題意識から、インメモリ技術による「超」高速データ処理に定評があり、世界中で導入が進む「SAP HANA」とそのアプライアンス製品(*4)である「Cisco UCSサーバー」を活用した、「SAP BusinessObjects Predictive Analytics」のパフォーマンス検証を行う運びとなりました。なお、本検証は、SAPジャパンの研究施設「SAP Co-Innovation Lab Tokyo(COIL Tokyo)(東京都千代田区)」にて実施されました。

■パフォーマンス検証の結果
今回の検証は、データマイニング工程のボトルネックとなりやすい大量の説明変数の構築をはじめとするデータ加工プロセスが、「SAP HANA」を活用することで、どれほど高速化されるかを検証いたしました。その結果、分類モデルの作成・適用において、従来のRDBMSに比べて、データ加工~データ取得処理時間が最大97%減、購買データを用いたレコメンデーションモデルの作成・適用において、モデル適用時間が最大で99%減、使用ディスクサイズ(データ容量)が最大で6分の1まで圧縮され、劇的なパフォーマンスの改善が確認されました。

■パフォーマンスの改善を実現したSAP製品の特徴
「SAP BusinessObjects Predictive Analytics」は、統計スキルに依存せず、同じデータを投入すれば、誰でも精度の高い結果を得ることができ、かつ、独自のインメモリ処理(*5)により大量データを安定的かつ高速に処理できるという特徴をもっております。
 「SAP HANA」は、超高速かつ大量のデータ処理を得意とするリアルタイムデータプラットフォームとして、RDBMSとしての基本性能はもちろん、ERP(*6)CRM(*7)などに代表される大量のデータ処理やトランザクション処理、データマイニングにおける大量の説明変数の構築処理においてもパフォーマンスの低下を招くことなく、高速な処理が行えるという特徴をもっております。加えて「SAP HANA」は、「SAP BusinessObjects Predictive Analytics」で行う予測分析をインデータベース(InDB)(*8)での処理として行うことで、データの移動を最小化し高速なデータ処理を行うことが可能です。

(*1)インメモリコンピューティングとは、メインメモリ上にデータを持つデータベース管理の技術の総称。メモリ上でデータアクセスを行うことで、ディスクと比較し、より高速かつ安定した処理を行うことができる。
(*2)データマイニングとは、企業や社会に大量に蓄積されるデータを解析し、その中に潜む重要なパターンや法則性を抽出すること。
(*3)リレーショナルデータベース(RDBMS)とは、データベースの種類の一つで、データをテーブルといわれる表形式の構造で管理する特徴をもつ。
(*4)アプライアンス製品とは、特定の機能や用途に特化して、設計・開発された専用機器のこと。
(*5)インメモリ処理とは、ソフトウェアを実行する際、使用するプログラムやデータをメモリ上に読み込み、ハードディスクなどの外部記憶装置を使わない処理のこと。
(*6)ERP(Enterprise Resource Planning)とは、企業のさまざまな資源を統合的に管理し、業務の効率化や経営の全体最適を目指すために利用される業務システムのこと。
(*7)CRM(Customer Relationship Management)とは、顧客属性や接触履歴を記録・管理し、企業と顧客が長期的かつ良好な関係を形成するために利用される業務システムのこと。
(*8)インデータベース(InDB)とは、クライアント端末から外部データベースにクエリ要求を送る際に、外部データベース内でクエリや演算を実行し、必要なサマリ情報だけをクライアント端末側に返す仕組みのこと。