AlexN
/

xls-r-300m-fr

Automatic Speech Recognition

Generated from Trainer

hf-asr-leaderboard

mozilla-foundation/common_voice_8_0

robust-speech-event

Inference Endpoints

Model card Files Files and versions Community

AlexN commited on Feb 1, 2022

Commit

be3130f

·

1 Parent(s): 7693786

Update run_speech_recognition_ctc.py

Files changed (1) hide show

run_speech_recognition_ctc.py +2 -4

run_speech_recognition_ctc.py CHANGED Viewed

@@ -401,8 +401,7 @@ def main():
             data_args.dataset_name,
             data_args.dataset_config_name,
             split=data_args.train_split_name,
-            use_auth_token=data_args.use_auth_token,
-            cache_dir="../downloaded_data/"
         )
         if data_args.audio_column_name not in raw_datasets["train"].column_names:
@@ -428,7 +427,6 @@ def main():
             data_args.dataset_config_name,
             split=data_args.eval_split_name,
             use_auth_token=data_args.use_auth_token,
-            cache_dir="../downloaded_data/"
         )
         if data_args.max_eval_samples is not None:
@@ -609,7 +607,7 @@ def main():
             prepare_dataset,
             remove_columns=next(iter(raw_datasets.values())).column_names,
             batch_size=-1,
-            desc="preprocess datasets",cache_dir="../data_cache/"
         )
         def is_audio_in_length_range(length):

             data_args.dataset_name,
             data_args.dataset_config_name,
             split=data_args.train_split_name,
+            use_auth_token=data_args.use_auth_token
         )
         if data_args.audio_column_name not in raw_datasets["train"].column_names:
             data_args.dataset_config_name,
             split=data_args.eval_split_name,
             use_auth_token=data_args.use_auth_token,
         )
         if data_args.max_eval_samples is not None:
             prepare_dataset,
             remove_columns=next(iter(raw_datasets.values())).column_names,
             batch_size=-1,
+            desc="preprocess datasets"
         )
         def is_audio_in_length_range(length):