GATEOverflow · arjunsuresh · Oct 16, 2024 · Oct 13, 2024 · Oct 14, 2024 · Oct 15, 2024
diff --git a/script/app-mlperf-inference-nvidia/_cm.yaml b/script/app-mlperf-inference-nvidia/_cm.yaml
@@ -119,6 +119,11 @@ deps:
   - enable_if_env:
       CM_MODEL:
       - resnet50
+    skip_if_env:
+      CM_USE_DATASET_FROM_HOST:
+      - 'yes'
+      CM_RUN_STATE_DOCKER:
+      - 'yes'
     names:
       - imagenet-original
     tags: get,dataset,original,imagenet,_full
@@ -218,13 +223,23 @@ deps:
   - enable_if_env:
       CM_MODEL:
       - retinanet
+    skip_if_env:
+      CM_USE_DATASET_FROM_HOST:
+      - 'yes'
+      CM_RUN_STATE_DOCKER:
+      - 'yes'
     names:
       - openimages-original
     tags: get,dataset,original,openimages,_validation,_full,_custom-annotations
 
   - enable_if_env:
       CM_MODEL:
       - retinanet
+    skip_if_env:
+      CM_USE_DATASET_FROM_HOST:
+      - 'yes'
+      CM_RUN_STATE_DOCKER:
+      - 'yes'
     names:
       - openimages-calibration
     tags: get,dataset,original,openimages,_calibration   

diff --git a/script/app-mlperf-inference-nvidia/customize.py b/script/app-mlperf-inference-nvidia/customize.py
@@ -138,10 +138,10 @@ def preprocess(i):
 
     elif env['CM_MODEL'] == "retinanet":
         #print(env)
-        dataset_path = env['CM_DATASET_PATH']
+        dataset_path = env['CM_DATASET_OPENIMAGES_PATH']
         #return {'return': 1, 'error': 'error'}
 
-        annotations_path = env['CM_DATASET_ANNOTATIONS_DIR_PATH']
+        annotations_path = env['CM_DATASET_OPENIMAGES_VALIDATION_ANNOTATIONS_FILE_PATH']
         target_data_path_dir = os.path.join(env['MLPERF_SCRATCH_PATH'], 'data', 'open-images-v6-mlperf')
         if not os.path.exists(target_data_path_dir):
             cmds.append(f"mkdir -p {target_data_path_dir}")
@@ -156,7 +156,7 @@ def preprocess(i):
         if not os.path.exists(target_data_path):
             cmds.append(f"ln -sf {dataset_path} {target_data_path}")
 
-        calibration_dataset_path=env['CM_CALIBRATION_DATASET_PATH']
+        calibration_dataset_path=env['CM_OPENIMAGES_CALIBRATION_DATASET_PATH']
         target_data_path_dir = os.path.join(env['MLPERF_SCRATCH_PATH'], 'data', 'open-images-v6-mlperf','calibration', 'train')
         if not os.path.exists(target_data_path_dir):
             cmds.append(f"mkdir -p {target_data_path_dir}")

diff --git a/script/app-mlperf-inference/_cm.yaml b/script/app-mlperf-inference/_cm.yaml
@@ -63,6 +63,7 @@ input_mapping:
   gpu_name: CM_NVIDIA_GPU_NAME
   nvidia_llama2_dataset_file_path: CM_NVIDIA_LLAMA_DATASET_FILE_PATH
   tp_size: CM_NVIDIA_TP_SIZE
+  use_dataset_from_host: CM_USE_DATASET_FROM_HOST
 
 # Duplicate CM environment variables to the ones used in native apps
 env_key_mappings:
@@ -596,10 +597,12 @@ variations:
       - mlperf-accuracy-script
       - imagenet-accuracy-script
       tags: run,accuracy,mlperf,_imagenet
-
     docker:
       deps:
       - tags: get,dataset,imagenet,validation,original,_full
+        enable_if_env:
+          CM_USE_DATASET_FROM_HOST:
+          - 'yes'
         names:
           - imagenet-original
           - dataset-original
@@ -625,6 +628,22 @@ variations:
       - openimages-accuracy-script
       tags: run,accuracy,mlperf,_openimages
 
+  retinanet,nvidia-original:
+    docker:
+      deps:
+      - names:
+        - openimages-original
+        enable_if_env:
+          CM_USE_DATASET_FROM_HOST:
+          - 'yes'
+        tags: get,dataset,original,openimages,_validation,_full,_custom-annotations
+      - names:
+        - openimages-calibration
+        enable_if_env:
+          CM_USE_DATASET_FROM_HOST:
+          - 'yes'
+        tags: get,dataset,original,openimages,_calibration
+
   3d-unet-99:
     group:
       model
@@ -1636,6 +1655,9 @@ docker:
     - cm pull repo
   mounts:
    - "${{ CM_DATASET_IMAGENET_PATH }}:${{ CM_DATASET_IMAGENET_PATH }}"
+   - "${{ CM_DATASET_OPENIMAGES_PATH }}:${{ CM_DATASET_OPENIMAGES_PATH }}"
+   - "${{ CM_OPENIMAGES_CALIBRATION_DATASET_PATH }}:${{ CM_OPENIMAGES_CALIBRATION_DATASET_PATH }}"
+   - "${{ CM_DATASET_OPENIMAGES_VALIDATION_ANNOTATIONS_FILE_PATH }}:${{ CM_DATASET_OPENIMAGES_VALIDATION_ANNOTATIONS_FILE_PATH }}"
    - "${{ CM_MLPERF_INFERENCE_RESULTS_DIR }}:${{ CM_MLPERF_INFERENCE_RESULTS_DIR }}"
    - "${{ OUTPUT_BASE_DIR }}:${{ OUTPUT_BASE_DIR }}"
    - "${{ CM_MLPERF_INFERENCE_SUBMISSION_DIR }}:${{ CM_MLPERF_INFERENCE_SUBMISSION_DIR }}"

diff --git a/script/get-dataset-openimages/_cm.json b/script/get-dataset-openimages/_cm.json
@@ -69,14 +69,17 @@
   "new_env_keys": [
     "CM_DATASET_PATH",
     "CM_DATASET_PATH_ROOT",
+    "CM_DATASET_OPENIMAGES_PATH",
     "CM_DATASET_OPENIMAGES_DATASET_PATH",
     "CM_DATASET_OPENIMAGES_DATASET_PATH_ROOT",
     "CM_DATASET_ANNOTATIONS_DIR_PATH",
     "CM_DATASET_ANNOTATIONS_FILE_PATH",
     "CM_DATASET_CALIBRATION_ANNOTATIONS_FILE_PATH",
     "CM_DATASET_VALIDATION_ANNOTATIONS_FILE_PATH",
     "CM_CALIBRATION_DATASET_PATH",
-    "CM_CALIBRATION_DATASET_PATH_ROOT"
+    "CM_CALIBRATION_DATASET_PATH_ROOT",
+    "CM_OPENIMAGES_CALIBRATION_DATASET_PATH",
+    "CM_DATASET_OPENIMAGES_VALIDATION_ANNOTATIONS_FILE_PATH"
   ],
   "tags": [
     "get",

diff --git a/script/get-dataset-openimages/customize.py b/script/get-dataset-openimages/customize.py
@@ -69,6 +69,7 @@ def postprocess(i):
         env['CM_DATASET_PATH'] = os.path.join(os.getcwd(), 'install', 'validation', 'data')
         annotations_file_path = os.path.join(env['CM_DATASET_ANNOTATIONS_DIR_PATH'], "openimages-mlperf.json")
         env['CM_DATASET_VALIDATION_ANNOTATIONS_FILE_PATH'] = annotations_file_path
+        env['CM_DATASET_OPENIMAGES_VALIDATION_ANNOTATIONS_FILE_PATH'] = annotations_file_path
         env['CM_DATASET_ANNOTATIONS_FILE_PATH'] = annotations_file_path
         if env.get("CM_DATASET_OPENIMAGES_CUSTOM_ANNOTATIONS",'') == "yes":
             annotations_file_src = env['CM_DATASET_OPENIMAGES_ANNOTATIONS_FILE_PATH']
@@ -77,6 +78,7 @@ def postprocess(i):
         env['CM_DATASET_OPENIMAGES_PATH_ROOT'] = env['CM_DATASET_PATH_ROOT']
     else:
         env['CM_CALIBRATION_DATASET_PATH'] = os.path.join(os.getcwd(), 'install', 'calibration', 'data')
+        env['CM_OPENIMAGES_CALIBRATION_DATASET_PATH'] = os.path.join(os.getcwd(), 'install', 'calibration', 'data')
         env['CM_CALIBRATION_DATASET_PATH_ROOT'] = os.path.join(os.getcwd(), 'install')
         annotations_file_path = os.path.join(env['CM_DATASET_ANNOTATIONS_DIR_PATH'], "openimages-calibration-mlperf.json")
         env['CM_DATASET_CALIBRATION_ANNOTATIONS_FILE_PATH'] = annotations_file_path

diff --git a/script/run-mlperf-inference-app/_cm.yaml b/script/run-mlperf-inference-app/_cm.yaml
@@ -110,6 +110,7 @@ input_mapping:
   max_test_duration: CM_MLPERF_MAX_DURATION_TEST
   all_models: CM_MLPERF_ALL_MODELS
   criteo_day23_raw_data_path: CM_CRITEO_DAY23_RAW_DATA_PATH
+  use_dataset_from_host: CM_USE_DATASET_FROM_HOST
 
 new_state_keys:
 - app_mlperf_inference_*