人型ロボットのカメラで撮影した画像をAIで認識し、その結果に応じてロボットが発話する