list_lakehouses

m-kovalsky · m-kovalsky · commit 04a327014bea · 2025-11-11T08:54:59.000+02:00
diff --git a/src/sempy_labs/_list_functions.py b/src/sempy_labs/_list_functions.py
@@ -1,5 +1,6 @@
 import sempy.fabric as fabric
 from sempy_labs._helper_functions import (
+    resolve_workspace_id,
     resolve_workspace_name_and_id,
     create_relationship_name,
     format_dax_object_name,
@@ -616,33 +617,50 @@ def list_lakehouses(workspace: Optional[str | UUID] = None) -> pd.DataFrame:
         "SQL Endpoint Connection String": "string",
         "SQL Endpoint ID": "string",
         "SQL Endpoint Provisioning Status": "string",
+        "Schema Enabled": "bool",
+        "Default Schema": "string",
+        "Sensitivity Label Id": "string",
     }
     df = _create_dataframe(columns=columns)
 
-    (workspace_name, workspace_id) = resolve_workspace_name_and_id(workspace)
+    workspace_id = resolve_workspace_id(workspace)
 
     responses = _base_api(
         request=f"/v1/workspaces/{workspace_id}/lakehouses",
         uses_pagination=True,
         client="fabric_sp",
     )
 
+    rows = []
     for r in responses:
         for v in r.get("value", []):
             prop = v.get("properties", {})
             sqlEPProp = prop.get("sqlEndpointProperties", {})
+            default_schema = prop.get("defaultSchema", None)
 
-            new_data = {
-                "Lakehouse Name": v.get("displayName"),
-                "Lakehouse ID": v.get("id"),
-                "Description": v.get("description"),
-                "OneLake Tables Path": prop.get("oneLakeTablesPath"),
-                "OneLake Files Path": prop.get("oneLakeFilesPath"),
-                "SQL Endpoint Connection String": sqlEPProp.get("connectionString"),
-                "SQL Endpoint ID": sqlEPProp.get("id"),
-                "SQL Endpoint Provisioning Status": sqlEPProp.get("provisioningStatus"),
-            }
-            df = pd.concat([df, pd.DataFrame(new_data, index=[0])], ignore_index=True)
+            rows.append(
+                {
+                    "Lakehouse Name": v.get("displayName"),
+                    "Lakehouse ID": v.get("id"),
+                    "Description": v.get("description"),
+                    "OneLake Tables Path": prop.get("oneLakeTablesPath"),
+                    "OneLake Files Path": prop.get("oneLakeFilesPath"),
+                    "SQL Endpoint Connection String": sqlEPProp.get("connectionString"),
+                    "SQL Endpoint ID": sqlEPProp.get("id"),
+                    "SQL Endpoint Provisioning Status": sqlEPProp.get(
+                        "provisioningStatus"
+                    ),
+                    "Schema Enabled": True if default_schema else False,
+                    "Default Schema": default_schema,
+                    "Sensitivity Label Id": v.get("sensitivityLabel", {}).get(
+                        "sensitivityLabelId"
+                    ),
+                }
+            )
+
+    if rows:
+        df = pd.DataFrame(rows, columns=list(columns.keys()))
+        _update_dataframe_datatypes(dataframe=df, column_map=columns)
 
     return df
 
@@ -672,20 +690,25 @@ def list_datamarts(workspace: Optional[str | UUID] = None) -> pd.DataFrame:
     }
     df = _create_dataframe(columns=columns)
 
-    (workspace_name, workspace_id) = resolve_workspace_name_and_id(workspace)
+    workspace_id = resolve_workspace_id(workspace)
 
     responses = _base_api(
         request=f"/v1/workspaces/{workspace_id}/datamarts", uses_pagination=True
     )
 
+    rows = []
     for r in responses:
         for v in r.get("value", []):
-            new_data = {
-                "Datamart Name": v.get("displayName"),
-                "Datamart ID": v.get("id"),
-                "Description": v.get("description"),
-            }
-            df = pd.concat([df, pd.DataFrame(new_data, index=[0])], ignore_index=True)
+            rows.append(
+                {
+                    "Datamart Name": v.get("displayName"),
+                    "Datamart ID": v.get("id"),
+                    "Description": v.get("description"),
+                }
+            )
+
+    if rows:
+        df = pd.DataFrame(rows, columns=list(columns.keys()))
 
     return df
 
diff --git a/src/sempy_labs/lakehouse/__init__.py b/src/sempy_labs/lakehouse/__init__.py
@@ -9,6 +9,7 @@
     optimize_lakehouse_tables,
     vacuum_lakehouse_tables,
     run_table_maintenance,
+    list_lakehouses,
 )
 from ._shortcuts import (
     # create_shortcut,
@@ -54,4 +55,5 @@
     "update_lakehouse",
     "load_table",
     "refresh_materialized_lake_views",
+    "list_lakehouses",
 ]
diff --git a/src/sempy_labs/lakehouse/_lakehouse.py b/src/sempy_labs/lakehouse/_lakehouse.py
@@ -8,6 +8,9 @@
     resolve_workspace_name_and_id,
     _create_spark_session,
     _pure_python_notebook,
+    _create_dataframe,
+    _update_dataframe_datatypes,
+    resolve_workspace_id,
 )
 import sempy_labs._icons as icons
 import re
@@ -18,6 +21,83 @@
 )
 
 
+@log
+def list_lakehouses(workspace: Optional[str | UUID] = None) -> pd.DataFrame:
+    """
+    Shows the lakehouses within a workspace.
+
+    Service Principal Authentication is supported (see `here <https://github.com/microsoft/semantic-link-labs/blob/main/notebooks/Service%20Principal.ipynb>`_ for examples).
+
+    Parameters
+    ----------
+    workspace : str | uuid.UUID, default=None
+        The Fabric workspace name or ID.
+        Defaults to None which resolves to the workspace of the attached lakehouse
+        or if no lakehouse attached, resolves to the workspace of the notebook.
+
+    Returns
+    -------
+    pandas.DataFrame
+        A pandas dataframe showing the lakehouses within a workspace.
+    """
+
+    columns = {
+        "Lakehouse Name": "string",
+        "Lakehouse ID": "string",
+        "Description": "string",
+        "OneLake Tables Path": "string",
+        "OneLake Files Path": "string",
+        "SQL Endpoint Connection String": "string",
+        "SQL Endpoint ID": "string",
+        "SQL Endpoint Provisioning Status": "string",
+        "Schema Enabled": "bool",
+        "Default Schema": "string",
+        "Sensitivity Label Id": "string",
+    }
+    df = _create_dataframe(columns=columns)
+
+    workspace_id = resolve_workspace_id(workspace)
+
+    responses = _base_api(
+        request=f"/v1/workspaces/{workspace_id}/lakehouses",
+        uses_pagination=True,
+        client="fabric_sp",
+    )
+
+    rows = []
+    for r in responses:
+        for v in r.get("value", []):
+            prop = v.get("properties", {})
+            sqlEPProp = prop.get("sqlEndpointProperties", {})
+            default_schema = prop.get("defaultSchema", None)
+
+            rows.append(
+                {
+                    "Lakehouse Name": v.get("displayName"),
+                    "Lakehouse ID": v.get("id"),
+                    "Description": v.get("description"),
+                    "OneLake Tables Path": prop.get("oneLakeTablesPath"),
+                    "OneLake Files Path": prop.get("oneLakeFilesPath"),
+                    "SQL Endpoint Connection String": sqlEPProp.get("connectionString"),
+                    "SQL Endpoint ID": sqlEPProp.get("id"),
+                    "SQL Endpoint Provisioning Status": sqlEPProp.get(
+                        "provisioningStatus"
+                    ),
+                    "Schema Enabled": True if default_schema else False,
+                    "Default Schema": default_schema,
+                    "Sensitivity Label Id": v.get("sensitivityLabel", {}).get(
+                        "sensitivityLabelId"
+                    ),
+                }
+            )
+
+    if rows:
+        df = pd.DataFrame(rows, columns=list(columns.keys()))
+        _update_dataframe_datatypes(dataframe=df, column_map=columns)
+
+    return df
+
+
 @log
 def lakehouse_attached() -> bool:
     """

Original file line number	Diff line number	Diff line change
`@@ -9,6 +9,7 @@`
`9`	`9`	`optimize_lakehouse_tables,`
`10`	`10`	`vacuum_lakehouse_tables,`
`11`	`11`	`run_table_maintenance,`
	`12`	`+ list_lakehouses,`
`12`	`13`	`)`
`13`	`14`	`from ._shortcuts import (`
`14`	`15`	`# create_shortcut,`
`@@ -54,4 +55,5 @@`
`54`	`55`	`"update_lakehouse",`
`55`	`56`	`"load_table",`
`56`	`57`	`"refresh_materialized_lake_views",`
	`58`	`+ "list_lakehouses",`
`57`	`59`	`]`