diff --git a/get_batch_dataset_metadata_with_subcollections.py b/get_batch_dataset_metadata_with_subcollections.py index 7c853eeee1be699df1b9364feb1285a9f953e8fe..5c3ac9a088e2b5319f106cc95b37cc5be389e0d5 100644 --- a/get_batch_dataset_metadata_with_subcollections.py +++ b/get_batch_dataset_metadata_with_subcollections.py @@ -171,13 +171,14 @@ complete_list = [] counter = len(pid_list) for pid in pid_list: counter = counter - 1 - dataset_json = api.get_dataset(identifier = f"doi:{pid}").json()["data"]["latestVersion"]["metadataBlocks"]["citation"] - complete_list.append(dataset_json) # ajout de la sortie json pure à une liste + dataset_json = api.get_dataset(identifier = f"doi:{pid}").json()["data"] # export de la référence correspondant à 'pid' + del (dataset_json["latestVersion"]["files"]) # suppression des métadonnées de fichiers + complete_list.append(dataset_json) # ajout de la sortie json à une liste # Ecriture du fichier si l'utilisateur le souhaite if file_wished == True: print("Écriture du fichier JSON en cours...") - formatted_dataset_json = json.dumps(dataset_json, sort_keys=False, indent=8) + formatted_dataset_json = json.dumps(dataset_json, sort_keys=False, indent=4) formatted_dataset_json_string = str (formatted_dataset_json) # Conversion en chaîne de caractères # formatted_dataset_json_string = f'"doi" : "{pid}" , "citation" : [{formatted_dataset_json_string}] ,' if counter > 0 : # Si c'est la dernière référence on ne met pas de virgule pour que le fichier JSON soit valide.