TOPSoftware > 機械学習ライフサイクル管理のプラットフォーム(下)

Software

機械学習ライフサイクル管理のプラットフォーム(下)

2020/10/16

Martin Heller InfoWorld

 プロフェッショナルのソフトウエア開発者にとっては、ALM(アプリケーションライフサイクルマネジメント)の利用は当たり前のことだ。一方、ソフトウエア開発のバックグラウンドを必ずしも持たないデータサイエンティストは、機械学習モデルにライフサイクルマネジメントを適用していない場合も多い。だがこの問題は、機械学習のライフサイクルマネジメントに対応したMLOpsの環境やフレームワークの登場に伴って、数年前に比べればかなり対処しやすくなった。

前回から続く)

MLflow

Credit: IDG

 MLflowは、米Databricksが手がけるオープンソースの機械学習ライフサイクルマネジメントプラットフォーム。ホスティング型のサービスとしても提供されている。MLflowの主な構成要素には、MLflow Tracking、MLflow Projects、MLflow Modelsがある。

 MLflow Trackingは、実験の情報(コード、データ、設定、結果)の記録と確認の部分を担う。記録はAPI呼び出しで行うことができ、結果はWebインタフェースで確認できる。

 MLflow Projectsは、データサイエンスのコードを、再利用と再現が可能な形でパッケージ化するためのフォーマットを定めている。こうしたプロジェクトを実行するためのAPIやコマンドラインツールも含まれており、複数のプロジェクトを組み合わせたワークフローも構成できる。

 MLflow Modelsは、機械学習モデルをパッケージ化するための標準フォーマットを定めている。パッケージ化したモデルは、例えばREST APIを通じたリアルタイムでの使用や、Apache Sparkでのバッチ推論など、さまざまなツールで利用できる。パッケージ化のフォーマットには、利用する各ツールがそれぞれ理解できる形式でモデルを保存するための「フレーバー」という仕組みも定められている。

↑ページ先頭へ