TOPアプリ/OS > TensorFlowよりPyTorchを選んだ企業3社の事例...

アプリ/OS

TensorFlowよりPyTorchを選んだ企業3社の事例(上)

2021/01/04

Scott Carey InfoWorld

Disney:アニメーションの顔を識別

 メディアエンターテイメント大手の米Walt Disneyでは、エンジニアやデータサイエンティストらが「Content Genome」と呼ぶプラットフォームの開発を2012年から進めてきた。機械学習を活用した検索、パーソナライズ、制作などを実現するための基盤作りとして、Disneyが有する膨大なコンテンツのメタデータを集約したナレッジグラフを構築するための取り組みだ。

 開発チームのメンバーが執筆したMediumの記事によると、このプラットフォームで取りまとめたメタデータは、Disneyの作家がコンテンツ制作に使用するツールの強化や、独創的な物語作りの支援、レコメンドエンジン、デジタルナビゲーション、コンテンツ発見によるユーザー体験の強化、ビジネスインテリジェンスなどに活用される。

 Disneyは、この試みを実現するために、手動と自動でのアノテーション、コンピュータービジョン、機械学習の手法に多額の投資を行った。画像認識のディープラーニングモデルを使用する自動タグ付けのパイプラインを構築し、人物、キャラクター、場所の膨大な画像を識別できるようにした。

 Disneyのエンジニアらは、まずはTensorFlowをはじめとするさまざまなフレームワークを試したうえで、2019年にPyTorchへの統合を決断。HOG特徴量やSVMを使用する手法から、R-CNN(Regions with Convolutional Neural Network)の一種を使用する物体検出の手法に移行した。Disneyの作品でよく見られるような、実写、アニメーション、視覚効果をまとめて扱うには、こちらの方が対応しやすい。

 「アニメーションでは、顔とは何かを定義することは簡単ではない。そこで、物体検出のディープラーニング手法に移行し、転移学習を使用した」と、Disney Researchのエンジニア、Monica Alfaro氏は言う。この新しいモデルは、わずか数千の顔を処理した段階で、実写、アニメーション、視覚効果の3種類のユースケースのいずれにおいても、顔の識別に広く対応できた。このモデルは2020年1月に実稼働に入った。

翻訳:内山卓則=ニューズフロント

↑ページ先頭へ