7 hónapja · 52b69d505d
--- a/extracted_data/UNFCCC/Indonesia/IDN_BUR3_2021_IPCC2006.csv
+++ b/extracted_data/UNFCCC/Indonesia/IDN_BUR3_2021_IPCC2006.csv
@@ -1 +1 @@
 
															-../../../.git/annex/objects/Kj/gK/MD5E-s29445--d5d9014c17546176b97efaf31017ba09.csv/MD5E-s29445--d5d9014c17546176b97efaf31017ba09.csv
														
 
															+../../../.git/annex/objects/gK/JW/MD5E-s29694--0cdd30e5c8a14ad206f59eb3fb525822.csv/MD5E-s29694--0cdd30e5c8a14ad206f59eb3fb525822.csv
														
--- a/extracted_data/UNFCCC/Indonesia/IDN_BUR3_2021_IPCC2006.nc
+++ b/extracted_data/UNFCCC/Indonesia/IDN_BUR3_2021_IPCC2006.nc
@@ -1 +1 @@
 
															-../../../.git/annex/objects/F6/kk/MD5E-s123728--8e8fe70abda6320e9f79a9bee9b63f95.nc/MD5E-s123728--8e8fe70abda6320e9f79a9bee9b63f95.nc
														
 
															+../../../.git/annex/objects/Wz/3f/MD5E-s99517--f886eccafd040f37986a43d3336408be.nc/MD5E-s99517--f886eccafd040f37986a43d3336408be.nc
														
--- a/extracted_data/UNFCCC/Indonesia/IDN_BUR3_2021_IPCC2006.yaml
+++ b/extracted_data/UNFCCC/Indonesia/IDN_BUR3_2021_IPCC2006.yaml
@@ -12,11 +12,11 @@ time_format: '%Y'
 
															 dimensions:
														
 
															   '*':
														
 
															   - time
														
 
															-  - source
														
 
															-  - category (IPCC2006)
														
 
															   - area (ISO3)
														
 
															-  - provenance
														
 
															   - scenario (PRIMAP)
														
 
															+  - category (IPCC2006)
														
 
															+  - provenance
														
 
															+  - source
														
 
															   - entity
														
 
															   - unit
														
 
															 additional_coordinates:
														
--- a/src/unfccc_ghg_data/unfccc_reader/Indonesia/read_IDN_BUR3_from_pdf.py
+++ b/src/unfccc_ghg_data/unfccc_reader/Indonesia/read_IDN_BUR3_from_pdf.py
@@ -175,6 +175,18 @@ if __name__ == "__main__":
 
															     aggregate_cats_N2O = {
														
 
															         "3.A.2": {"sources": ["3.A.2.b"], "orig_cat_name": "3A2 Manure Management"},
														
 
															         "3.A": {"sources": ["3.A.2"], "orig_cat_name": "3A Livestock"},
														
 
															+        "3": {
														
 
															+            "sources": ["3.A", "3.B", "3.C", "3.D"],
														
 
															+            "orig_cat_name": "3 AGRICULTURE, FORESTRY AND OTHER LAND USE",
														
 
															+        },
														
 
															+    }
														
 
															+
														
 
															+    aggregate_cats_CH4 = {
														
 
															+        "3.A": {"sources": ["3.A.1", "3.A.2"], "orig_cat_name": "3A Livestock"},
														
 
															+        "3": {
														
 
															+            "sources": ["3.A", "3.B", "3.C", "3.D"],
														
 
															+            "orig_cat_name": "3 AGRICULTURE, FORESTRY AND OTHER LAND USE",
														
 
															+        },
														
 
															     }
														
 
															     aggregate_cats_CO2CH4N2O = {
														
@@ -308,6 +320,7 @@ if __name__ == "__main__":
 
															                 ]
														
 
															             ).sum(min_count=1)
														
 
															+            df_combine = df_combine.drop(columns=[cat_label, "orig_cat_name"])
														
 
															             df_combine.insert(0, cat_label, cat_to_agg)
														
 
															             df_combine.insert(
														
 
															                 1, "orig_cat_name", aggregate_cats[cat_to_agg]["orig_cat_name"]
														
@@ -320,10 +333,11 @@ if __name__ == "__main__":
 
															             print(f"no data to aggregate category {cat_to_agg}")
														
 
															     # delete cat 3 for N2O as it's wrong
														
 
															-    index_3A_N2O = data_if[
														
 
															-        (data_if[cat_label] == "3") & (data_if["entity"] == "N2O")
														
 
															+    index_3_N2O = data_if[
														
 
															+        (data_if[cat_label].isin(["3", "3.A", "3.A.2"]))
														
 
															+        & (data_if["entity"].isin(["N2O"]))
														
 
															     ].index
														
 
															-    data_if = data_if.drop(index_3A_N2O)
														
 
															+    data_if = data_if.drop(index_3_N2O)
														
 
															     # aggregate cat 3 for N2O
														
 
															     for cat_to_agg in aggregate_cats_N2O:
														
@@ -356,6 +370,55 @@ if __name__ == "__main__":
 
															                 ]
														
 
															             ).sum(min_count=1)
														
 
															+            df_combine = df_combine.drop(columns=[cat_label, "orig_cat_name"])
														
 
															+            df_combine.insert(0, cat_label, cat_to_agg)
														
 
															+            df_combine.insert(
														
 
															+                1, "orig_cat_name", aggregate_cats_N2O[cat_to_agg]["orig_cat_name"]
														
 
															+            )
														
 
															+
														
 
															+            df_combine = df_combine.reset_index()
														
 
															+
														
 
															+            data_if = pd.concat([data_if, df_combine])
														
 
															+        else:
														
 
															+            print(f"no data to aggregate category {cat_to_agg}")
														
 
															+
														
 
															+    index_3_CH4 = data_if[
														
 
															+        (data_if[cat_label].isin(["3", "3.A"])) & (data_if["entity"].isin(["CH4"]))
														
 
															+    ].index
														
 
															+    data_if = data_if.drop(index_3_CH4)
														
 
															+
														
 
															+    # aggregate cat 3 for CH4
														
 
															+    for cat_to_agg in aggregate_cats_CH4:
														
 
															+        mask = data_if[cat_label].isin(aggregate_cats_CH4[cat_to_agg]["sources"])
														
 
															+        df_test = data_if[mask]
														
 
															+        df_test = df_test[df_test["entity"] == "CH4"]
														
 
															+
														
 
															+        if len(df_test) > 0:
														
 
															+            print(f"Aggregating category {cat_to_agg}")
														
 
															+            df_combine = df_test.copy(deep=True)
														
 
															+
														
 
															+            time_format = "%Y"
														
 
															+            time_columns = [
														
 
															+                col
														
 
															+                for col in df_combine.columns.to_numpy()
														
 
															+                if matches_time_format(col, time_format)
														
 
															+            ]
														
 
															+
														
 
															+            for col in time_columns:
														
 
															+                df_combine[col] = pd.to_numeric(df_combine[col], errors="coerce")
														
 
															+
														
 
															+            df_combine = df_combine.groupby(
														
 
															+                by=[
														
 
															+                    "source",
														
 
															+                    "scenario (PRIMAP)",
														
 
															+                    "provenance",
														
 
															+                    "area (ISO3)",
														
 
															+                    "entity",
														
 
															+                    "unit",
														
 
															+                ]
														
 
															+            ).sum(min_count=1)
														
 
															+
														
 
															+            df_combine = df_combine.drop(columns=[cat_label, "orig_cat_name"])
														
 
															             df_combine.insert(0, cat_label, cat_to_agg)
														
 
															             df_combine.insert(
														
 
															                 1, "orig_cat_name", aggregate_cats_N2O[cat_to_agg]["orig_cat_name"]
														
@@ -369,11 +432,11 @@ if __name__ == "__main__":
 
															     # delete cat 3.A.2 for CO2CH4N2O as it's wrong
														
 
															     index_3A2_CO2CH4N2O = data_if[
														
 
															-        (data_if[cat_label] == "3.A.2") & (data_if["entity"] == "CH4CO2N2O (SARGWP100)")
														
 
															+        (data_if[cat_label] == "3.A.2") & (data_if["entity"] == "CO2CH4N2O (SARGWP100)")
														
 
															     ].index
														
 
															     data_if = data_if.drop(index_3A2_CO2CH4N2O)
														
 
															-    # aggregate cat 3 for N2O
														
 
															+    # aggregate cat 3 for CO2CH4N2O
														
 
															     for cat_to_agg in aggregate_cats_CO2CH4N2O:
														
 
															         mask = data_if[cat_label].isin(aggregate_cats_CO2CH4N2O[cat_to_agg]["sources"])
														
 
															         df_test = data_if[mask]
														
@@ -404,6 +467,7 @@ if __name__ == "__main__":
 
															                 ]
														
 
															             ).sum(min_count=1)
														
 
															+            df_combine = df_combine.drop(columns=[cat_label, "orig_cat_name"])
														
 
															             df_combine.insert(0, cat_label, cat_to_agg)
														
 
															             df_combine.insert(
														
 
															                 1,
														
@@ -417,6 +481,12 @@ if __name__ == "__main__":
 
															         else:
														
 
															             print(f"no data to aggregate category {cat_to_agg}")
														
 
															+    # Fix 4.B.1 for CH4 as it's  wrong
														
 
															+    index_4B1_CH4 = data_if[
														
 
															+        (data_if[cat_label] == "4.B.1") & (data_if["entity"] == "CH4")
														
 
															+    ].index
														
 
															+    data_if.loc[index_4B1_CH4]["2019"] = data_if.loc[index_4B1_CH4]["2019"] / 100
														
 
															+
														
 
															     data_if.attrs = attrs
														
 
															     data_pm2 = pm2.pm2io.from_interchange_format(data_if)