ViewTube

Raja's Data Engineering

01. Databricks: Spark Architecture & Internal Working Mechanism

01. Databricks: Spark Architecture & Internal Working Mechanism

0 views

0

Raja's Data Engineering

02. Databricks | PySpark: RDD, Dataframe and Dataset

02. Databricks | PySpark: RDD, Dataframe and Dataset

0 views

0

Raja's Data Engineering

03. Databricks | PySpark: Transformation and Action

03. Databricks | PySpark: Transformation and Action

0 views

0

Raja's Data Engineering

04. On-Heap vs Off-Heap| Databricks | Spark | Interview Question | Performance Tuning

04. On-Heap vs Off-Heap| Databricks | Spark | Interview Question | Performance Tuning

0 views

0

Raja's Data Engineering

05. Databricks | Pyspark: Cluster Deployment

05. Databricks | Pyspark: Cluster Deployment

0 views

0

Raja's Data Engineering

06. Databricks | Pyspark| Spark Reader: Read CSV File

06. Databricks | Pyspark| Spark Reader: Read CSV File

0 views

0

Raja's Data Engineering

07. Databricks | Pyspark: Filter Condition

07. Databricks | Pyspark: Filter Condition

0 views

0

Raja's Data Engineering

08. Databricks | Pyspark: Add, Rename and Drop Columns

08. Databricks | Pyspark: Add, Rename and Drop Columns

0 views

0

Raja's Data Engineering

09. Databricks | PySpark Join Types

09. Databricks | PySpark Join Types

0 views

0

Raja's Data Engineering

10. Databricks | Pyspark: Utility Commands - DBUtils

10. Databricks | Pyspark: Utility Commands - DBUtils

0 views

0

Raja's Data Engineering

11. Databricks | Pyspark: Explode Function

11. Databricks | Pyspark: Explode Function

0 views

0

Raja's Data Engineering

12. Databricks | Pyspark: Case Function (When.Otherwise )

12. Databricks | Pyspark: Case Function (When.Otherwise )

0 views

0

Raja's Data Engineering

13. Databricks | Pyspark: Union & UnionAll

13. Databricks | Pyspark: Union & UnionAll

0 views

0

Raja's Data Engineering

14. Databricks | Pyspark: Pivot & Unpivot

14. Databricks | Pyspark: Pivot & Unpivot

0 views

0

Raja's Data Engineering

15. Databricks| Spark | Pyspark | Read Json| Flatten Json

15. Databricks| Spark | Pyspark | Read Json| Flatten Json

0 views

0

Raja's Data Engineering

16. Databricks | Spark | Pyspark | Bad Records Handling | Permissive;DropMalformed;FailFast

16. Databricks | Spark | Pyspark | Bad Records Handling | Permissive;DropMalformed;FailFast

0 views

0

Raja's Data Engineering

17. Databricks & Pyspark: Azure Data Lake Storage Integration with Databricks

17. Databricks & Pyspark: Azure Data Lake Storage Integration with Databricks

0 views

0

Raja's Data Engineering

18. Databricks & Pyspark: Ingest Data from Azure SQL Database

18. Databricks & Pyspark: Ingest Data from Azure SQL Database

0 views

0

Raja's Data Engineering

19. Databricks & Pyspark: Real Time ETL Pipeline Azure SQL to ADLS

19. Databricks & Pyspark: Real Time ETL Pipeline Azure SQL to ADLS

0 views

0

Raja's Data Engineering

20. Databricks & Pyspark: Azure Key Vault Integration

20. Databricks & Pyspark: Azure Key Vault Integration

0 views

0

Raja's Data Engineering

21. Databricks| Spark Streaming

21. Databricks| Spark Streaming

0 views

0

Raja's Data Engineering

22. Databricks| Spark | Performance Optimization | Repartition vs Coalesce

22. Databricks| Spark | Performance Optimization | Repartition vs Coalesce

0 views

0

Raja's Data Engineering

23. Databricks | Spark | Cache vs Persist | Interview Question | Performance Tuning

23. Databricks | Spark | Cache vs Persist | Interview Question | Performance Tuning

0 views

0

Raja's Data Engineering

24. Databricks| Spark | Interview Questions| Catalyst Optimizer

24. Databricks| Spark | Interview Questions| Catalyst Optimizer

0 views

0

Raja's Data Engineering

25. Databricks | Spark | Broadcast Variable| Interview Question | Performance Tuning

25. Databricks | Spark | Broadcast Variable| Interview Question | Performance Tuning

0 views

0

Raja's Data Engineering

26. Databricks | Spark | Adaptive Query Execution| Interview Question | Performance Tuning

26. Databricks | Spark | Adaptive Query Execution| Interview Question | Performance Tuning

0 views

0

Raja's Data Engineering

31. Databricks Pyspark: Handling Null - Part1

31. Databricks Pyspark: Handling Null - Part1

0 views

0

Raja's Data Engineering

32. Databricks| Pyspark| Handling Null Part 2

32. Databricks| Pyspark| Handling Null Part 2

0 views

0

Raja's Data Engineering

33. Databricks | Spark | Pyspark | UDF

33. Databricks | Spark | Pyspark | UDF

0 views

0

Raja's Data Engineering

34. Databricks - Spark: Data Skew Optimization

34. Databricks - Spark: Data Skew Optimization

0 views

0

Raja's Data Engineering

35. Databricks & Spark: Interview Question - Shuffle Partition

35. Databricks & Spark: Interview Question - Shuffle Partition

0 views

0

Raja's Data Engineering

36. Databricks: Autoscaling | Optimized Autoscaling

36. Databricks: Autoscaling | Optimized Autoscaling

0 views

0

Raja's Data Engineering

37. Databricks | Pyspark: Dataframe Checkpoint

37. Databricks | Pyspark: Dataframe Checkpoint

0 views

0

Raja's Data Engineering

38. Databricks | Pyspark | Interview Question | Compression Methods: Snappy vs Gzip

38. Databricks | Pyspark | Interview Question | Compression Methods: Snappy vs Gzip

0 views

0

Raja's Data Engineering

39. Databricks | Spark | Pyspark Functions| Split

39. Databricks | Spark | Pyspark Functions| Split

0 views

0

Raja's Data Engineering

40. Databricks | Spark | Pyspark Functions| Arrays_zip

40. Databricks | Spark | Pyspark Functions| Arrays_zip

0 views

0

Raja's Data Engineering

41. Databricks | Spark | Pyspark Functions| Part 2 : Array_Intersect

41. Databricks | Spark | Pyspark Functions| Part 2 : Array_Intersect

0 views

0

Raja's Data Engineering

42. Databricks | Spark | Pyspark Functions| Part 3 : Array_Except

42. Databricks | Spark | Pyspark Functions| Part 3 : Array_Except

0 views

0

Raja's Data Engineering

43. Databricks | Spark | Pyspark Functions| Part 4 : Array_Sort

43. Databricks | Spark | Pyspark Functions| Part 4 : Array_Sort

0 views

0

Raja's Data Engineering

44. Databricks | Spark | Python Functions| Join

44. Databricks | Spark | Python Functions| Join

0 views

0

Raja's Data Engineering

45. Databricks | Spark | Pyspark | PartitionBy

45. Databricks | Spark | Pyspark | PartitionBy

0 views

0

Raja's Data Engineering

46. Databricks | Spark | Pyspark | Number of Records per Partition in Dataframe

46. Databricks | Spark | Pyspark | Number of Records per Partition in Dataframe

0 views

0

Raja's Data Engineering

47. Databricks | Spark | Pyspark | Null Count of Each Column in Dataframe

47. Databricks | Spark | Pyspark | Null Count of Each Column in Dataframe

0 views

0

Raja's Data Engineering

48. Databricks - Pyspark: Find Top or Bottom N Rows per Group

48. Databricks - Pyspark: Find Top or Bottom N Rows per Group

0 views

0

Raja's Data Engineering

49. Databricks & Spark: Interview Question(Scenario Based) - How many spark jobs get created?

49. Databricks & Spark: Interview Question(Scenario Based) - How many spark jobs get created?

0 views

0

Raja's Data Engineering

50. Databricks | Pyspark: Greatest vs Least vs Max vs Min

50. Databricks | Pyspark: Greatest vs Least vs Max vs Min

0 views

0

Raja's Data Engineering

51. Databricks | Pyspark | Delta Lake: Introduction to Delta Lake

51. Databricks | Pyspark | Delta Lake: Introduction to Delta Lake

0 views

0

Raja's Data Engineering

52. Databricks| Pyspark| Delta Lake Architecture: Internal Working Mechanism

52. Databricks| Pyspark| Delta Lake Architecture: Internal Working Mechanism

0 views

0

Raja's Data Engineering

53. Databricks| Pyspark| Delta Lake: Solution Architecture

53. Databricks| Pyspark| Delta Lake: Solution Architecture

0 views

0

Raja's Data Engineering

54. Databricks | Delta Lake| Pyspark: Create Delta Table Using Various Methods

54. Databricks | Delta Lake| Pyspark: Create Delta Table Using Various Methods

0 views

0

Raja's Data Engineering

55. Databricks| Pyspark| Delta Lake: Delta Table Instance

55. Databricks| Pyspark| Delta Lake: Delta Table Instance

0 views

0

Raja's Data Engineering

56. Databricks| Pyspark | Delta Lake: Different Approaches to Insert Data Into Delta Table

56. Databricks| Pyspark | Delta Lake: Different Approaches to Insert Data Into Delta Table

0 views

0

Raja's Data Engineering

57. Databricks| Pyspark| Delta Lake: Different Approaches to Delete Data from Delta Table

57. Databricks| Pyspark| Delta Lake: Different Approaches to Delete Data from Delta Table

0 views

0

Raja's Data Engineering

58. Databricks | Pyspark | Delta Lake : Update Delta Table

58. Databricks | Pyspark | Delta Lake : Update Delta Table

0 views

0

Raja's Data Engineering

59. Databricks Pyspark:Slowly Changing Dimension|SCD Type1| Merge using Pyspark and Spark SQL

59. Databricks Pyspark:Slowly Changing Dimension|SCD Type1| Merge using Pyspark and Spark SQL

0 views

0

Raja's Data Engineering

60. Databricks & Pyspark: Delta Lake Audit Log Table with Operation Metrics

60. Databricks & Pyspark: Delta Lake Audit Log Table with Operation Metrics

0 views

0

Raja's Data Engineering

61. Databricks | Pyspark | Delta Lake : Slowly Changing Dimension (SCD Type2)

61. Databricks | Pyspark | Delta Lake : Slowly Changing Dimension (SCD Type2)

0 views

0

Raja's Data Engineering

62. Databricks | Pyspark | Delta Lake: Time Travel

62. Databricks | Pyspark | Delta Lake: Time Travel

0 views

0

Raja's Data Engineering

63. Databricks | Pyspark| Delta Lake: Restore Command

63. Databricks | Pyspark| Delta Lake: Restore Command

0 views

0

Raja's Data Engineering

64. Databricks | Pyspark | Delta Lake: Optimize Command - File Compaction

64. Databricks | Pyspark | Delta Lake: Optimize Command - File Compaction

0 views

0

Raja's Data Engineering

65. Databricks | Pyspark | Delta Lake: Vacuum Command

65. Databricks | Pyspark | Delta Lake: Vacuum Command

0 views

0

Raja's Data Engineering

66. Databricks | Pyspark | Delta: Z-Order Command

66. Databricks | Pyspark | Delta: Z-Order Command

0 views

0

Raja's Data Engineering

67. Databricks | Pypark | Delta: Schema Evolution - MergeSchema

67. Databricks | Pypark | Delta: Schema Evolution - MergeSchema

0 views

0

Raja's Data Engineering

68. Databricks | Pyspark | Dataframe InsertInto Delta Table

68. Databricks | Pyspark | Dataframe InsertInto Delta Table

0 views

0

Raja's Data Engineering

69. Databricks | Spark | Pyspark | Data Skewness| Interview Question: SPARK_PARTITION_ID

69. Databricks | Spark | Pyspark | Data Skewness| Interview Question: SPARK_PARTITION_ID

0 views

0

Raja's Data Engineering

70. Databricks| Pyspark| Input_File_Name: Identify Input File Name of Corrupt Record

70. Databricks| Pyspark| Input_File_Name: Identify Input File Name of Corrupt Record

0 views

0

Raja's Data Engineering

71. Databricks | Pyspark | Window Functions: Lead and Lag

71. Databricks | Pyspark | Window Functions: Lead and Lag

0 views

0

Raja's Data Engineering

72. Databricks | Pyspark | Interview Question: Explain Plan

72. Databricks | Pyspark | Interview Question: Explain Plan

0 views

0

Raja's Data Engineering

73. Databricks | Pyspark | UDF to Check if Folder Exists

73. Databricks | Pyspark | UDF to Check if Folder Exists

0 views

0

Raja's Data Engineering

74. Databricks | Pyspark | Interview Question: Sort-Merge Join (SMJ)

74. Databricks | Pyspark | Interview Question: Sort-Merge Join (SMJ)

0 views

0

Raja's Data Engineering

75. Databricks | Pyspark | Performance Optimization - Bucketing

75. Databricks | Pyspark | Performance Optimization - Bucketing

0 views

0

Raja's Data Engineering

76. Databricks|Pyspark:Interview Question|Scenario Based|Max Over () Get Max value of Duplicate Data

76. Databricks|Pyspark:Interview Question|Scenario Based|Max Over () Get Max value of Duplicate Data

0 views

0

Raja's Data Engineering

77. Databricks | Pyspark | Create_map(): Convert Dataframe Columns to Dictionary (Map Type)

77. Databricks | Pyspark | Create_map(): Convert Dataframe Columns to Dictionary (Map Type)

0 views

0

Raja's Data Engineering

78. Databricks | Pyspark | Performance Optimization: Delta Cache

78. Databricks | Pyspark | Performance Optimization: Delta Cache

0 views

0

Raja's Data Engineering

79. Databricks | Pyspark | Split Array Elements into Separate Columns

79. Databricks | Pyspark | Split Array Elements into Separate Columns

0 views

0

Raja's Data Engineering

80. Databricks | Pyspark | Tips: Write Dataframe into Single File with Specific File Name

80. Databricks | Pyspark | Tips: Write Dataframe into Single File with Specific File Name

0 views

0

Raja's Data Engineering

81. Databricks | Pyspark | Workspace Object Access Control

81. Databricks | Pyspark | Workspace Object Access Control

0 views

0

Raja's Data Engineering

82. Databricks | Pyspark | Databricks Secret Scopes: Azure Key Vault Backed Secrets

82. Databricks | Pyspark | Databricks Secret Scopes: Azure Key Vault Backed Secrets

0 views

0

Raja's Data Engineering

83. Databricks | Pyspark | Databricks Workflows: Job Scheduling

83. Databricks | Pyspark | Databricks Workflows: Job Scheduling

0 views

0

Raja's Data Engineering

84. Databricks | Pyspark | Azure Data Factory + Azure Databricks: Execute Notebook Via ADF

84. Databricks | Pyspark | Azure Data Factory + Azure Databricks: Execute Notebook Via ADF

0 views

0

Raja's Data Engineering

85. Databricks | Pyspark | Notebook Activity in Azure Data Factory with Input Parameter

85. Databricks | Pyspark | Notebook Activity in Azure Data Factory with Input Parameter

0 views

0

Raja's Data Engineering

86. Databricks | Pyspark | Notebook Activity in Azure Data Factory with Output Parameter

86. Databricks | Pyspark | Notebook Activity in Azure Data Factory with Output Parameter

0 views

0

Raja's Data Engineering

87. Databricks | Pyspark | Real Time Project: ETL Pipeline Integrating ADF, ASQL, ADLS, Key Vault

87. Databricks | Pyspark | Real Time Project: ETL Pipeline Integrating ADF, ASQL, ADLS, Key Vault

0 views

0

Raja's Data Engineering

88. Databricks |Pyspark |Notebook Scheduling through Schedule Based Trigger using Azure Data Factory

88. Databricks |Pyspark |Notebook Scheduling through Schedule Based Trigger using Azure Data Factory

0 views

0

Raja's Data Engineering

89. Databricks | Pyspark | Notebook Scheduling through Event Based Trigger using Azure Data Factory

89. Databricks | Pyspark | Notebook Scheduling through Event Based Trigger using Azure Data Factory

0 views

0

Raja's Data Engineering

90. Databricks | Pyspark | Interview Question: Read Excel File with Multiple Sheets

90. Databricks | Pyspark | Interview Question: Read Excel File with Multiple Sheets

0 views

0

Raja's Data Engineering

91. Databricks | Pyspark | Interview Question |Handlining Duplicate Data: DropDuplicates vs Distinct

91. Databricks | Pyspark | Interview Question |Handlining Duplicate Data: DropDuplicates vs Distinct

0 views

0

Raja's Data Engineering

92. Databricks | Pyspark | Interview Question | Performance Optimization: Select vs WithColumn

92. Databricks | Pyspark | Interview Question | Performance Optimization: Select vs WithColumn

0 views

0

Raja's Data Engineering

93. Databricks | Pyspark | Interview Question | Schema Definition: Struct Type vs Struct Field

93. Databricks | Pyspark | Interview Question | Schema Definition: Struct Type vs Struct Field

0 views

0

Raja's Data Engineering

94. Databricks | Pyspark | Interview Question | Schema Definition: Struct Type vs Map Type

94. Databricks | Pyspark | Interview Question | Schema Definition: Struct Type vs Map Type

0 views

0

Raja's Data Engineering

95. Databricks | Pyspark | Schema | Different Methods of Schema Definition

95. Databricks | Pyspark | Schema | Different Methods of Schema Definition

0 views

0

Raja's Data Engineering

96. Databricks | Pyspark | Real Time Scenario | Schema Comparison

96. Databricks | Pyspark | Real Time Scenario | Schema Comparison

0 views

0

Raja's Data Engineering

97. Databricks | Pyspark | Data Security: Enforcing Column Level Encryption

97. Databricks | Pyspark | Data Security: Enforcing Column Level Encryption

0 views

0

Raja's Data Engineering

98. Databricks | Pyspark | Interview Question: Pyspark VS Pandas

98. Databricks | Pyspark | Interview Question: Pyspark VS Pandas

0 views

0

Raja's Data Engineering

99. Databricks | Pyspark | Real Time Use Case: Generate Test Data - Array_Repeat()

99. Databricks | Pyspark | Real Time Use Case: Generate Test Data - Array_Repeat()

0 views

0

Raja's Data Engineering

100. Databricks | Pyspark | Spark Architecture: Internals of Partition Creation Demystified

100. Databricks | Pyspark | Spark Architecture: Internals of Partition Creation Demystified

0 views

0

Raja's Data Engineering

106.Databricks|Pyspark|Automation|Real Time Project:DataType Issue When Writing to Azure Synapse/SQL

106.Databricks|Pyspark|Automation|Real Time Project:DataType Issue When Writing to Azure Synapse/SQL

0 views

0

Raja's Data Engineering

107. Databricks | Pyspark| Transformation: Subtract vs ExceptAll

107. Databricks | Pyspark| Transformation: Subtract vs ExceptAll

0 views

0

Raja's Data Engineering

108. Databricks | Pyspark| Window Function: First and Last

108. Databricks | Pyspark| Window Function: First and Last

0 views

0

Raja's Data Engineering

112. Databricks | Pyspark| Spark Reader: Skip First N Records While Reading CSV File

112. Databricks | Pyspark| Spark Reader: Skip First N Records While Reading CSV File

0 views

0