From d13de066e9400b464a3f35d2f7ae6681d66f07f0 Mon Sep 17 00:00:00 2001 From: JOUNEAU Thomas <thomas.jouneau@univ-lorraine.fr> Date: Thu, 6 Jan 2022 14:26:59 +0000 Subject: [PATCH] Replace get_batch_dataset_metadata_with_subcollections.py --- get_batch_dataset_metadata_with_subcollections.py | 7 ++++--- 1 file changed, 4 insertions(+), 3 deletions(-) diff --git a/get_batch_dataset_metadata_with_subcollections.py b/get_batch_dataset_metadata_with_subcollections.py index 7c853ee..5c3ac9a 100644 --- a/get_batch_dataset_metadata_with_subcollections.py +++ b/get_batch_dataset_metadata_with_subcollections.py @@ -171,13 +171,14 @@ complete_list = [] counter = len(pid_list) for pid in pid_list: counter = counter - 1 - dataset_json = api.get_dataset(identifier = f"doi:{pid}").json()["data"]["latestVersion"]["metadataBlocks"]["citation"] - complete_list.append(dataset_json) # ajout de la sortie json pure à une liste + dataset_json = api.get_dataset(identifier = f"doi:{pid}").json()["data"] # export de la référence correspondant à 'pid' + del (dataset_json["latestVersion"]["files"]) # suppression des métadonnées de fichiers + complete_list.append(dataset_json) # ajout de la sortie json à une liste # Ecriture du fichier si l'utilisateur le souhaite if file_wished == True: print("Écriture du fichier JSON en cours...") - formatted_dataset_json = json.dumps(dataset_json, sort_keys=False, indent=8) + formatted_dataset_json = json.dumps(dataset_json, sort_keys=False, indent=4) formatted_dataset_json_string = str (formatted_dataset_json) # Conversion en chaîne de caractères # formatted_dataset_json_string = f'"doi" : "{pid}" , "citation" : [{formatted_dataset_json_string}] ,' if counter > 0 : # Si c'est la dernière référence on ne met pas de virgule pour que le fichier JSON soit valide. -- GitLab