Skip to content

Commit

Permalink
Copy Files From Source Repo (2024-06-25 03:34)
Browse files Browse the repository at this point in the history
  • Loading branch information
olprod committed Jun 25, 2024
1 parent 47ea0bf commit e1283ff
Show file tree
Hide file tree
Showing 103 changed files with 1,607 additions and 716 deletions.
Binary file not shown.
Binary file not shown.
11 changes: 11 additions & 0 deletions Allfiles/Labs/00-Setup/VM-Setup.txt
Original file line number Diff line number Diff line change
@@ -0,0 +1,11 @@
## Machine requirements

In order to complete certain labs, you need access to a SQL Server instance to restore the sample database.

- Use SQL Server Management Studio (SSMS) to connect to "localhost"

Restore AdventureWorksDW2022.bak database to SQL Server localhost.

Install the most recent version of Power BI Desktop application.


6 changes: 6 additions & 0 deletions Allfiles/Labs/01/Assets/01-Snippets.txt
Original file line number Diff line number Diff line change
@@ -0,0 +1,6 @@
>> Use SQL to query tables
==================================================
SELECT Item, SUM(Quantity * UnitPrice) AS Revenue
FROM sales
GROUP BY Item
ORDER BY Revenue DESC;
125 changes: 64 additions & 61 deletions Instructions/Labs/01-lakehouse.md

Large diffs are not rendered by default.

140 changes: 70 additions & 70 deletions Instructions/Labs/02-analyze-spark.md

Large diffs are not rendered by default.

96 changes: 48 additions & 48 deletions Instructions/Labs/03-delta-lake.md

Large diffs are not rendered by default.

128 changes: 65 additions & 63 deletions Instructions/Labs/04-ingest-pipeline.md

Large diffs are not rendered by default.

101 changes: 50 additions & 51 deletions Instructions/Labs/05-dataflows-gen2.md

Large diffs are not rendered by default.

2 changes: 1 addition & 1 deletion Instructions/Labs/06-data-warehouse.md
Original file line number Diff line number Diff line change
Expand Up @@ -243,4 +243,4 @@ SQL 코드를 작성하는 대신 그래픽 쿼리 디자이너를 사용하여

1. 왼쪽 막대에서 작업 영역의 아이콘을 선택하여 포함된 모든 항목을 봅니다.
2. 도구 모음의 **...** 메뉴에서 **작업 영역 설정**을 선택합니다.
3. **기타** 섹션에서 **이 작업 영역 제거**를 선택합니다.
3. **일반** 섹션에서 **이 작업 영역 제거**를 선택합니다.
4 changes: 2 additions & 2 deletions Instructions/Labs/06a-data-warehouse-load.md
Original file line number Diff line number Diff line change
Expand Up @@ -29,7 +29,7 @@ Microsoft Fabric에서 데이터 웨어하우스는 대규모 분석을 위한

1. **Synapse Data Engineering** 홈페이지에서 원하는 이름으로 새 **레이크하우스**를 만듭니다.

1분 정도 지나면 빈 레이크하우스가 새로 만들어집니다. 분석을 위해 일부 데이터를 데이터 레이크하우스에 수집해야 합니다. 이를 수행하는 방법은 여러 가지가 있지만 이 연습에서는 CVS 파일을 로컬 컴퓨터(또는 해당하는 경우 랩 VM)에 다운로드한 다음 이를 레이크하우스에 업로드합니다.
1분 정도 지나면 빈 레이크하우스가 새로 만들어집니다. 분석을 위해 일부 데이터를 데이터 레이크하우스에 수집해야 합니다. 이 작업을 수행하는 방법은 여러 가지가 있지만 이 연습에서는 CSV 파일을 로컬 컴퓨터(또는 해당하는 경우 랩 VM)에 다운로드한 후 해당 파일을 레이크하우스에 업로드합니다.

1. `https://github.com/MicrosoftLearning/dp-data/raw/main/sales.csv`에서 이 연습용 파일을 다운로드합니다.

Expand Down Expand Up @@ -249,4 +249,4 @@ Microsoft Fabric에서 데이터 웨어하우스는 대규모 분석을 위한

1. 왼쪽 막대에서 작업 영역의 아이콘을 선택하여 포함된 모든 항목을 봅니다.
2. 도구 모음의 **...** 메뉴에서 **작업 영역 설정**을 선택합니다.
3. **기타** 섹션에서 **이 작업 영역 제거**를 선택합니다.
3. **일반** 섹션에서 **이 작업 영역 제거**를 선택합니다.
56 changes: 28 additions & 28 deletions Instructions/Labs/06b-data-warehouse-query.md
Original file line number Diff line number Diff line change
Expand Up @@ -6,7 +6,7 @@ lab:

# Microsoft Fabric에서 데이터 웨어하우스 쿼리

Microsoft Fabric에서 데이터 웨어하우스는 대규모 분석을 위한 관계형 데이터베이스를 제공합니다. Microsoft Fabric 작업 영역에 기본 제공되는 풍부한 환경 집합을 통해 고객은 DirectLake 모드에서 Power BI와 통합되는 항상 연결된 간편한 의미 체계 모델을 통해 인사이트에 대한 시간을 줄일 수 있습니다.
Microsoft Fabric에서 데이터 웨어하우스는 대규모 분석을 위한 관계형 데이터베이스를 제공합니다. Microsoft Fabric 작업 영역에 기본 제공된 풍부한 환경 집합을 통해 고객은 쉽게 사용할 수 있고 DirectLake 모드에서 Power BI와 통합된 항상 연결된 의미 체계 모델을 통해 인사이트를 얻는 시간을 단축할 수 있습니다.

이 랩을 완료하는 데 약 **30**분이 걸립니다.

Expand All @@ -27,20 +27,20 @@ Microsoft Fabric에서 데이터 웨어하우스는 대규모 분석을 위한

작업 영역이 있으므로 이제 데이터 웨어하우스를 만들어야 합니다.

1. 왼쪽 아래에서 데이터 웨어하우스** 환경이 선택되어 있는지 확인**합니다.
1. 홈페이지에서 **샘플 웨어하우스**를 선택하고 **sample-dw라는 **새 데이터 웨어하우스를 만듭니다**.**
1. 왼쪽 아래에서 **데이터 웨어하우스** 환경이 선택되어 있는지 확인합니다.
1. **** 페이지에서 **샘플 웨어하우스**를 선택하고 **sample-dw**라는 새 데이터 웨어하우스를 만듭니다.

1분 정도 지나면 택시 승차 분석 시나리오에 대한 샘플 데이터로 새 웨어하우스가 만들어지고 채워집니다.

![새 웨어하우스의 스크린샷.](./Images/sample-data-warehouse.png)

## 데이터 웨어하우스 쿼리

SQL 쿼리 편집기에서는 IntelliSense, 코드 완성, 구문 강조 표시, 클라이언트 쪽 구문 분석 및 유효성 검사를 지원합니다. DDL(데이터 정의 언어), DML(데이터 조작 언어) 및 DCL(데이터 제어 언어) 문을 실행할 수 있습니다.
SQL 쿼리 편집기는 IntelliSense, 코드 완료, 구문 강조 표시, 클라이언트 쪽 구문 분석 및 유효성 검사를 지원합니다. DDL(데이터 정의 언어), DML(데이터 조작 언어) 및 DCL(데이터 컨트롤 언어) 문을 실행할 수 있습니다.

1. **sample-dw 데이터 웨어하우스** 페이지의 **새 SQL 쿼리** 드롭다운 목록에서 새 SQL 쿼리**를 선택합니다**.
1. **sample-dw** 데이터 웨어하우스 페이지의 **새 SQL 쿼리** 드롭다운 목록에서 **새 SQL 쿼리**를 선택합니다.

1. 빈 쿼리 창에서 다음 Transact-SQL 코드를 입력합니다.
1. 새로운 빈 쿼리 창에 다음 Transact-SQL 코드를 입력합니다.

```sql
SELECT
Expand All @@ -53,7 +53,7 @@ SQL 쿼리 편집기에서는 IntelliSense, 코드 완성, 구문 강조 표시,
GROUP BY D.MonthName;
```

1. 사용 하 여 **▷ 단추를 실행** 하여 SQL 스크립트를 실행하고 결과를 확인합니다. 그러면 월별여정 수와 총 수익이 표시됩니다.
1. **▷ 실행** 단추를 눌러 SQL 스크립트를 실행하고 결과를 확인합니다. 이 결과에는이동 횟수와 월별 총 수익이 표시됩니다.

1. 다음 Transact-SQL 코드를 입력합니다.

Expand All @@ -68,7 +68,7 @@ SQL 쿼리 편집기에서는 IntelliSense, 코드 완성, 구문 강조 표시,
GROUP BY D.DayName;
```

1. 수정된 쿼리를 실행하고 요일별 평균 이동 기간 및 거리를 보여 주는 결과를 확인합니다.
1. 수정된 쿼리를 실행하고 결과를 확인합니다. 이 결과에는 요일별 평균 이동 시간과 거리가 표시됩니다.

1. 다음 Transact-SQL 코드를 입력합니다.

Expand All @@ -92,54 +92,54 @@ SQL 쿼리 편집기에서는 IntelliSense, 코드 완성, 구문 강조 표시,
ORDER BY TotalTrips DESC;
```

1. 수정된 쿼리를 실행하고 상위 10개의 가장 인기 있는 승차 및 하차 위치를 표시하는 결과를 봅니다.
1. 수정된 쿼리를 실행하고 가장 자주 사용되는 상위 10개의 픽업 및 하차 위치를 보여 주는 결과를 확인합니다.

1. 모든 쿼리 탭을 닫습니다.

## 데이터 일관성 확인

데이터 일관성을 확인하는 것은 분석 및 의사 결정을 위해 데이터가 정확하고 안정적인지 확인하는 데 중요합니다. 데이터가 일관되지 않은 경우 잘못된 분석과 잘못된 결과가 발생할 수 있습니다.
분석 및 의사 결정을 위해 데이터가 정확하고 신뢰할 수 있는지 확인하려면 데이터 일관성을 확인해야 합니다. 일관성 없는 데이터는 부정확한 분석과 잘못된 결과로 이어질 수 있습니다.

일관성을 검사 데이터 웨어하우스를 쿼리해 보겠습니다.
일관성을 확인하기 위해 데이터 웨어하우스를 쿼리하겠습니다.

1. **새 SQL 쿼리** 드롭다운 목록에서 새 SQL 쿼리**를 선택합니다**.
1. **새 SQL 쿼리** 드롭다운 목록에서 **새 SQL 쿼리**를 선택합니다.

1. 빈 쿼리 창에서 다음 Transact-SQL 코드를 입력합니다.
1. 새로운 빈 쿼리 창에 다음 Transact-SQL 코드를 입력합니다.

```sql
-- Check for trips with unusually long duration
SELECT COUNT(*) FROM dbo.Trip WHERE TripDurationSeconds > 86400; -- 24 hours
```

1. 수정된 쿼리를 실행하고 결과를 확인합니다. 이 쿼리는 비정상적으로 긴 기간이 있는 모든 여정의 세부 정보를 표시합니다.
1. 수정된 쿼리를 실행하고 결과를 확인합니다. 이 결과는 기간이 비정상적으로 긴 모든 여행의 세부 정보를 보여 줍니다.

1. **새 SQL 쿼리** 드롭다운 목록에서 새 SQL 쿼리**를 선택하여 **두 번째 쿼리 탭을 추가합니다. 그런 다음 새 빈 쿼리 탭에서 다음 코드를 실행합니다.
1. **새 SQL 쿼리** 드롭다운 목록에서 **새 SQL 쿼리**를 선택하여 두 번째 쿼리 탭을 추가합니다. 그런 다음 새 빈 쿼리 탭에서 다음 코드를 실행합니다.

```sql
-- Check for trips with negative trip duration
SELECT COUNT(*) FROM dbo.Trip WHERE TripDurationSeconds < 0;
```

1. 빈 쿼리 창에서 다음 Transact-SQL 코드를 입력하고 실행합니다.
1. 새로운 빈 쿼리 창에 다음 Transact-SQL 코드를 입력하고 실행합니다.

```sql
-- Remove trips with negative trip duration
DELETE FROM dbo.Trip WHERE TripDurationSeconds < 0;
```

> **참고:** 일관성 없는 데이터를 처리하는 방법에는 여러 가지가 있습니다. 이를 제거하는 대신 평균 또는 중앙값과 같은 다른 값으로 바꾸는 것이 한 가지 대안입니다.
> **참고:** 일관되지 않은 데이터를 처리하는 방법에는 여러 가지가 있습니다. 이를 제거하는 대신 평균이나 중앙값과 같은 다른 값으로 바꾸는 것이 한 가지 대안입니다.

1. 모든 쿼리 탭을 닫습니다.

## 보기로 저장

데이터를 사용하여 보고서를 생성하는 사용자 그룹에 대해 특정 여정을 필터링해야 한다고 가정합니다.
보고서를 생성하기 위해 데이터를 사용할 사용자 그룹에 대해 특정 여행을 필터링해야 한다고 가정해 보겠습니다.

앞에서 사용한 쿼리를 기반으로 보기를 만들고 필터를 추가해 보겠습니다.
이전에 사용한 쿼리를 기반으로 뷰를 만들고 여기에 필터를 추가하겠습니다.

1. **새 SQL 쿼리** 드롭다운 목록에서 새 SQL 쿼리**를 선택합니다**.
1. **새 SQL 쿼리** 드롭다운 목록에서 **새 SQL 쿼리**를 선택합니다.

1. 빈 쿼리 창에서 다음 Transact-SQL 코드를 다시 입력하고 실행합니다.
1. 새로운 빈 쿼리 창에 다음 Transact-SQL 코드를 다시 입력하고 실행합니다.

```sql
SELECT
Expand All @@ -152,7 +152,7 @@ SQL 쿼리 편집기에서는 IntelliSense, 코드 완성, 구문 강조 표시,
GROUP BY D.DayName;
```

1. 추가할 쿼리를 수정합니다 `WHERE D.Month = 1`. 이렇게 하면 1월의 레코드만 포함하도록 데이터가 필터링됩니다. 최종 쿼리는 다음과 같습니다.
1. 쿼리를 수정하여 `WHERE D.Month = 1`을 추가합니다. 그러면 1월의 기록만 포함하도록 데이터가 필터링됩니다. 최종 쿼리는 다음과 같아야 합니다.

```sql
SELECT
Expand All @@ -166,22 +166,22 @@ SQL 쿼리 편집기에서는 IntelliSense, 코드 완성, 구문 강조 표시,
GROUP BY D.DayName
```

1. 쿼리에서 SELECT 문의 텍스트를 선택합니다. 그런 다음 , &#9655;** 실행** 단추를 선택하고 보기**로 저장을 선택합니다**.
1. 쿼리에서 SELECT 문의 텍스트를 선택합니다. 그런 다음 **&#9655; 실행** 단추를 클릭하고 **보기로 저장**을 선택합니다.

1. vw_JanTrip**이라는 **새 뷰를 만듭니다.
1. **vw_JanTrip**이라는 새 보기를 만듭니다.

1. **탐색기**에서 스키마 >> dbo >> 보기**로 이동합니다**. *방금 만든 vw_JanTrip* 보기를 확인합니다.
1. **탐색기**에서 **스키마 >> dbo >> 보기**로 이동합니다. 방금 만든 *vw_JanTrip* 보기를 확인합니다.

1. 모든 쿼리 탭을 닫습니다.

> **추가 정보**: 데이터 웨어하우스 쿼리에 대한 자세한 내용은 Microsoft Fabric 설명서의 SQL 쿼리 편집[기를 사용하여 쿼리를 참조](https://learn.microsoft.com/fabric/data-warehouse/sql-query-editor)하세요.
> **추가 정보**: 데이터 웨어하우스 쿼리에 대한 자세한 내용은 Microsoft Fabric 설명서에서 [SQL 쿼리 편집기를 사용하여 쿼리](https://learn.microsoft.com/fabric/data-warehouse/sql-query-editor)를 참조하세요.

## 리소스 정리

이 연습에서는 쿼리를 사용하여 Microsoft Fabric 데이터 웨어하우스의 데이터를 파악했습니다.
이 연습에서는 쿼리를 사용하여 Microsoft Fabric 데이터 웨어하우스의 데이터에 대한 인사이트를 얻었습니다.

데이터 웨어하우스 탐색을 마쳤으면 이 연습을 위해 만든 작업 영역을 삭제할 수 있습니다.

1. 왼쪽 막대에서 작업 영역의 아이콘을 선택하여 포함된 모든 항목을 봅니다.
2. 도구 모음의 **...** 메뉴에서 **작업 영역 설정**을 선택합니다.
3. **기타** 섹션에서 **이 작업 영역 제거**를 선택합니다.
3. **일반** 섹션에서 **이 작업 영역 제거**를 선택합니다.
Loading

0 comments on commit e1283ff

Please sign in to comment.