TOPSoftware > データベース内機械学習に対応している製品8選(下)

Software

データベース内機械学習に対応している製品8選(下)

2021/03/12

Matthew Finnegan Computerworld

 現在は以下のようなモデルをサポートしている。

  • Oracle AutoML
  • Keras
  • Scikit-learn
  • XGBoost
  • ADSTuner(ハイパーパラメータチューニング)

 また、Machine Learning Explainability(MLX)もサポートしている。

ポイント:Oracle Cloud Infrastructureにデータサイエンスのリソースを保持し、データウエアハウス、オブジェクトストレージ、関数のサービスと連携することで、モデル開発のライフサイクル全体に対応できる。

Vertica

 Vertica Analytics Platformは、列指向データベースを利用したスケーラブルなデータウエアハウス。その動作には、EnterpriseモードとEONモードという2つのモードがある。Enterpriseモードの場合は、データベースを構成するノードのファイルシステムにデータをローカルで保存する。EONモードの場合は、すべてのコンピューティングノードで共用する形でデータを保存する。

 Verticaは、超並列処理を利用してペタバイト級のデータを扱い、内部での機械学習にもデータの並列処理を生かしている。標準で対応しているアルゴリズムは、データ準備が8種類、回帰分析が3種類、分類が4種類、クラスタリングが2種類。そのほかに、モデル管理の機能や、TensorFlowとPMMLのトレーニング済みモデルのインポート機能がある。またC++、Java、Python、R言語を使って、ユーザー定義拡張関数を作成することもできる。トレーニングや推論は、SQLの構文で行える。

ポイント:Verticaは、さまざまな種類の機械学習アルゴリズムに対応しており、TensorFlowとPMMLのモデルのインポートも行える。インポートしたモデルと独自のモデルのどちらでも、予測を実行できる。

 今回の記事では、データベース内機械学習をサポートしている8種類の製品を取り上げた。扱うデータの量が膨大で、データセット全体に対するモデルの構築が簡単ではない時に、この種の製品は役に立つ。仕組みの違いや機能の優劣はあるにせよ、データのエクスポートに伴うオーバーヘッドなしで、モデルの構築や利用を進められる。

(了)

翻訳:内山卓則=ニューズフロント
記事原文(英語)はこちら

↑ページ先頭へ