Add num_epochs to non-sink training

4 years ago · 9cee0d2143
parent e69d868016
commit 9cee0d2143
40 changed files with 50 additions and 49 deletions
--- a/mindspore/nn/probability/infer/variational/svi.py
+++ b/mindspore/nn/probability/infer/variational/svi.py
@ -63,7 +63,7 @@ class SVI:
        for _ in range(1, epochs+1):
            train_loss = 0
            dataset_size = 0
-            for data in train_dataset.create_dict_iterator():
+            for data in train_dataset.create_dict_iterator(num_epochs=1):
                x = Tensor(data['image'], dtype=mstype.float32)
                y = Tensor(data['label'], dtype=mstype.int32)
                dataset_size += len(x)
--- a/mindspore/train/dataset_helper.py
+++ b/mindspore/train/dataset_helper.py
@ -145,7 +145,7 @@ class DatasetHelper:
            self.iter = iterclass(dataset, sink_size, epoch_num)
        else:
            iterclass = _DatasetIterNormal
-            self.iter = iterclass(dataset)
+            self.iter = iterclass(dataset, epoch_num=epoch_num)
    def __iter__(self):
        return self.iter.__iter__()
@ -290,11 +290,12 @@ class _DatasetIterPSLite(_DatasetIter):
 class _DatasetIterNormal:
    """Iter for normal(non sink) mode, feed the data from host."""
-    def __init__(self, dataset):
+
    def __init__(self, dataset, epoch_num=-1):
        self.dataset = dataset
        self.device_num = _get_device_num()
        self.global_rank = _get_global_rank()
-        self.iter = self.dataset.create_tuple_iterator()
+        self.iter = self.dataset.create_tuple_iterator(num_epochs=epoch_num)
    def __iter__(self):
        return self
--- a/mindspore/train/model.py
+++ b/mindspore/train/model.py
@ -460,7 +460,8 @@ class Model:
                                                  is_train=True,
                                                  phase='train',
                                                  dataset=train_dataset,
-                                                  dataset_sink_mode=False)
+                                                  dataset_sink_mode=False,
                                                  epoch_num=epoch)
        cb_params.cur_step_num = 0
        run_context = RunContext(cb_params)
        list_callback.begin(run_context)
--- a/model_zoo/official/cv/faster_rcnn/eval.py
+++ b/model_zoo/official/cv/faster_rcnn/eval.py
@ -57,7 +57,7 @@ def FasterRcnn_eval(dataset_path, ckpt_path, ann_file):
    print("total images num: ", total)
    print("Processing, please wait a moment.")
    max_num = 128
-    for data in ds.create_dict_iterator():
+    for data in ds.create_dict_iterator(num_epochs=1):
        eval_iter = eval_iter + 1
        img_data = data['image']
--- a/model_zoo/official/cv/maskrcnn/eval.py
+++ b/model_zoo/official/cv/maskrcnn/eval.py
@ -57,7 +57,7 @@ def MaskRcnn_eval(dataset_path, ckpt_path, ann_file):
    print("total images num: ", total)
    print("Processing, please wait a moment.")
    max_num = 128
-    for data in ds.create_dict_iterator(output_numpy=True):
+    for data in ds.create_dict_iterator(output_numpy=True, num_epochs=1):
        eval_iter = eval_iter + 1
        img_data = data['image']
--- a/model_zoo/official/cv/resnext50/eval.py
+++ b/model_zoo/official/cv/resnext50/eval.py
@ -200,7 +200,7 @@ def test(cloud_args=None):
                                            per_batch_size=args.per_batch_size,
                                            max_epoch=1, rank=args.rank, group_size=args.group_size,
                                            mode='eval')
-        eval_dataloader = de_dataset.create_tuple_iterator(output_numpy=True)
+        eval_dataloader = de_dataset.create_tuple_iterator(output_numpy=True, num_epochs=1)
        network = get_network(args.backbone, num_classes=args.num_classes, platform=args.platform)
        if network is None:
            raise NotImplementedError('not implement {}'.format(args.backbone))
--- a/model_zoo/official/cv/ssd/eval.py
+++ b/model_zoo/official/cv/ssd/eval.py
@ -44,7 +44,7 @@ def ssd_eval(dataset_path, ckpt_path):
    print("\n========================================\n")
    print("total images num: ", total)
    print("Processing, please wait a moment.")
-    for data in ds.create_dict_iterator(output_numpy=True):
+    for data in ds.create_dict_iterator(output_numpy=True, num_epochs=1):
        img_id = data['img_id']
        img_np = data['image']
        image_shape = data['image_shape']
--- a/model_zoo/official/cv/vgg16/eval.py
+++ b/model_zoo/official/cv/vgg16/eval.py
@ -159,7 +159,7 @@ def test(cloud_args=None):
        for model in args.models:
            dataset = classification_dataset(args.data_path, args.image_size, args.per_batch_size, mode='eval')
-            eval_dataloader = dataset.create_tuple_iterator(output_numpy=True)
+            eval_dataloader = dataset.create_tuple_iterator(output_numpy=True, num_epochs=1)
            network = vgg16(args.num_classes, args, phase="test")
            # pre_trained
--- a/model_zoo/official/cv/yolov3_darknet53/eval.py
+++ b/model_zoo/official/cv/yolov3_darknet53/eval.py
@ -299,7 +299,7 @@ def test():
    input_shape = Tensor(tuple(config.test_img_shape), ms.float32)
    args.logger.info('Start inference....')
-    for i, data in enumerate(ds.create_dict_iterator()):
+    for i, data in enumerate(ds.create_dict_iterator(num_epochs=1)):
        image = data["image"]
        image_shape = data["image_shape"]
--- a/model_zoo/official/cv/yolov3_darknet53/train.py
+++ b/model_zoo/official/cv/yolov3_darknet53/train.py
@ -239,7 +239,7 @@ def train():
    old_progress = -1
    t_end = time.time()
-    data_loader = ds.create_dict_iterator(output_numpy=True)
+    data_loader = ds.create_dict_iterator(output_numpy=True, num_epochs=1)
    for i, data in enumerate(data_loader):
        images = data["image"]
--- a/model_zoo/official/cv/yolov3_darknet53_quant/eval.py
+++ b/model_zoo/official/cv/yolov3_darknet53_quant/eval.py
@ -305,7 +305,7 @@ def test():
    input_shape = Tensor(tuple(config.test_img_shape), ms.float32)
    args.logger.info('Start inference....')
-    for i, data in enumerate(ds.create_dict_iterator()):
+    for i, data in enumerate(ds.create_dict_iterator(num_epochs=1)):
        image = data["image"]
        image_shape = data["image_shape"]
--- a/model_zoo/official/cv/yolov3_darknet53_quant/train.py
+++ b/model_zoo/official/cv/yolov3_darknet53_quant/train.py
@ -224,7 +224,7 @@ def train():
    old_progress = -1
    t_end = time.time()
-    data_loader = ds.create_dict_iterator(output_numpy=True)
+    data_loader = ds.create_dict_iterator(output_numpy=True, num_epochs=1)
    shape_record = ShapeRecord()
    for i, data in enumerate(data_loader):
--- a/model_zoo/official/cv/yolov3_resnet18/eval.py
+++ b/model_zoo/official/cv/yolov3_resnet18/eval.py
@ -44,7 +44,7 @@ def yolo_eval(dataset_path, ckpt_path):
    print("\n========================================\n")
    print("total images num: ", total)
    print("Processing, please wait a moment.")
-    for data in ds.create_dict_iterator(output_numpy=True):
+    for data in ds.create_dict_iterator(output_numpy=True, num_epochs=1):
        img_np = data['image']
        image_shape = data['image_shape']
        annotation = data['annotation']
--- a/model_zoo/official/nlp/bert/run_classifier.py
+++ b/model_zoo/official/nlp/bert/run_classifier.py
@ -119,7 +119,7 @@ def do_eval(dataset=None, network=None, num_class=2, assessment_method="accuracy
        raise ValueError("Assessment method not supported, support: [accuracy, f1, mcc, spearman_correlation]")
    columns_list = ["input_ids", "input_mask", "segment_ids", "label_ids"]
-    for data in dataset.create_dict_iterator():
+    for data in dataset.create_dict_iterator(num_epochs=1):
        input_data = []
        for i in columns_list:
            input_data.append(data[i])
--- a/model_zoo/official/nlp/bert/run_ner.py
+++ b/model_zoo/official/nlp/bert/run_ner.py
@ -128,7 +128,7 @@ def do_eval(dataset=None, network=None, use_crf="", num_class=2, assessment_meth
            raise ValueError("Assessment method not supported, support: [accuracy, f1, mcc, spearman_correlation]")
        columns_list = ["input_ids", "input_mask", "segment_ids", "label_ids"]
-        for data in dataset.create_dict_iterator():
+        for data in dataset.create_dict_iterator(num_epochs=1):
            input_data = []
            for i in columns_list:
                input_data.append(data[i])
--- a/model_zoo/official/nlp/bert/run_squad.py
+++ b/model_zoo/official/nlp/bert/run_squad.py
@ -109,7 +109,7 @@ def do_eval(dataset=None, vocab_file="", eval_json="", load_checkpoint_path="",
    output = []
    RawResult = collections.namedtuple("RawResult", ["unique_id", "start_logits", "end_logits"])
    columns_list = ["input_ids", "input_mask", "segment_ids", "unique_ids"]
-    for data in dataset.create_dict_iterator():
+    for data in dataset.create_dict_iterator(num_epochs=1):
        input_data = []
        for i in columns_list:
            input_data.append(data[i])
--- a/model_zoo/official/nlp/mass/src/transformer/infer_mass.py
+++ b/model_zoo/official/nlp/mass/src/transformer/infer_mass.py
@ -107,7 +107,7 @@ def transformer_infer(config, dataset):
    probs = []
    source_sentences = []
    target_sentences = []
-    for batch in dataset.create_dict_iterator(output_numpy=True):
+    for batch in dataset.create_dict_iterator(output_numpy=True, num_epochs=1):
        source_sentences.append(batch["source_eos_ids"])
        target_sentences.append(batch["target_eos_ids"])
@ -232,7 +232,7 @@ def transformer_infer_ppl(config, dataset):
    lengths = []
    source_sentences = []
    target_sentences = []
-    for batch in dataset.create_dict_iterator(output_numpy=True):
+    for batch in dataset.create_dict_iterator(output_numpy=True, num_epochs=1):
        source_sentences.append(batch["source_eos_ids"])
        target_sentences.append(batch["target_eos_ids"])
--- a/model_zoo/official/nlp/tinybert/run_task_distill.py
+++ b/model_zoo/official/nlp/tinybert/run_task_distill.py
@ -278,7 +278,7 @@ def do_eval_standalone():
    callback = Accuracy()
    columns_list = ["input_ids", "input_mask", "segment_ids", "label_ids"]
-    for data in eval_dataset.create_dict_iterator():
+    for data in eval_dataset.create_dict_iterator(num_epochs=1):
        input_data = []
        for i in columns_list:
            input_data.append(data[i])
--- a/model_zoo/official/nlp/tinybert/src/utils.py
+++ b/model_zoo/official/nlp/tinybert/src/utils.py
@ -93,7 +93,7 @@ class EvalCallBack(Callback):
        if cb_params.cur_step_num % 100 == 0:
            callback = Accuracy()
            columns_list = ["input_ids", "input_mask", "segment_ids", "label_ids"]
-            for data in self.dataset.create_dict_iterator():
+            for data in self.dataset.create_dict_iterator(num_epochs=1):
                input_data = []
                for i in columns_list:
                    input_data.append(data[i])
--- a/model_zoo/official/nlp/transformer/eval.py
+++ b/model_zoo/official/nlp/transformer/eval.py
@ -113,7 +113,7 @@ def run_transformer_eval():
    predictions = []
    source_sents = []
    target_sents = []
-    for batch in dataset.create_dict_iterator(output_numpy=True):
+    for batch in dataset.create_dict_iterator(output_numpy=True, num_epochs=1):
        source_sents.append(batch["source_eos_ids"])
        target_sents.append(batch["target_eos_ids"])
        source_ids = Tensor(batch["source_eos_ids"], mstype.int32)
--- a/model_zoo/utils/cv_to_mindrecord/Caltech-UCSD-Birds-200-2011/create_dataset.py
+++ b/model_zoo/utils/cv_to_mindrecord/Caltech-UCSD-Birds-200-2011/create_dataset.py
@ -22,7 +22,7 @@ def create_dataset(data_file):
                              num_parallel_workers=num_readers,
                              shuffle=True)
    index = 0
-    for item in data_set.create_dict_iterator(output_numpy=True):
+    for item in data_set.create_dict_iterator(output_numpy=True, num_epochs=1):
        print("example {}: {}".format(index, item))
        index += 1
        if index % 1000 == 0:
--- a/model_zoo/utils/graph_to_mindrecord/reader.py
+++ b/model_zoo/utils/graph_to_mindrecord/reader.py
@ -28,7 +28,7 @@ args = parser.parse_args()
 data_set = ds.MindDataset(args.path)
 num_iter = 0
-for item in data_set.create_dict_iterator(output_numpy=True):
+for item in data_set.create_dict_iterator(output_numpy=True, num_epochs=1):
    print(item)
    num_iter += 1
 print("Total items # is {}".format(num_iter))
--- a/model_zoo/utils/nlp_to_mindrecord/aclImdb/create_dataset.py
+++ b/model_zoo/utils/nlp_to_mindrecord/aclImdb/create_dataset.py
@ -22,7 +22,7 @@ def create_dataset(data_file):
                              num_parallel_workers=num_readers,
                              shuffle=True)
    index = 0
-    for item in data_set.create_dict_iterator(output_numpy=True):
+    for item in data_set.create_dict_iterator(output_numpy=True, num_epochs=1):
        print("example {}: {}".format(index, item))
        index += 1
        if index % 1000 == 0:
--- a/model_zoo/utils/nlp_to_mindrecord/aclImdb_preprocess/create_dataset.py
+++ b/model_zoo/utils/nlp_to_mindrecord/aclImdb_preprocess/create_dataset.py
@ -22,7 +22,7 @@ def create_dataset(data_file):
                              num_parallel_workers=num_readers,
                              shuffle=True)
    index = 0
-    for item in data_set.create_dict_iterator(output_numpy=True):
+    for item in data_set.create_dict_iterator(output_numpy=True, num_epochs=1):
        print("example {}: {}".format(index, item))
        index += 1
        if index % 1000 == 0:
--- a/tests/dataset_mock.py
+++ b/tests/dataset_mock.py
@ -55,7 +55,7 @@ class MindData:
        self.send_epoch_end = send_epoch_end
        return self
-    def create_tuple_iterator(self):
+    def create_tuple_iterator(self, num_epochs=-1):
        return self.__iter__()
    def send(self, num_epochs=-1):
--- a/Show More
+++ b/Show More