dbt Labs ra mắt hỗ trợ Python để mở rộng những gì người thực hành dữ liệu có thể thực hiện với dbt
Với bản cập nhật này, 16.000 tổ chức sử dụng dbt, đã trở thành tiêu chuẩn ngành để chuyển đổi dữ liệu trên đám mây, có thể tận dụng các khả năng của Python được cung cấp bởi các nền tảng dữ liệu đám mây chính. Vị trí của Python trong ngăn xếp dữ liệu hiện đại đã được nâng lên nhờ Snowflake's Snowpark for Python, Serverless Spark của BigQuery và mục nhập của Databricks vào quy trình phân tích dữ liệu với Databricks SQL. Người dùng dbt sẽ có tùy chọn chọn ngôn ngữ tốt nhất — SQL hoặc Python — cho nhiệm vụ hiện tại Với việc giới thiệu các mô hình Python của dbt Labs và Snowflake's Snowpark cho Python, các khách hàng chung giờ đây có thể dễ dàng kết hợp sức mạnh của SQL và Python để phân tích hiện đại và hưởng lợi từ sự phong phú của đổi mới xử lý dữ liệu. Torsten Grabs, Giám đốc quản lý sản phẩm của Snowflake cho biết: "Mối quan hệ đối tác của Snowflake với dbt Labs là công cụ cho các phân tích hiện đại khi chúng tôi nỗ lực hướng tới việc cho phép các nhóm dữ liệu bảo mật và hợp tác triển khai mã SQL vào sản xuất". Điều này sẽ giúp làm việc và cộng tác trong Đám mây dữ liệu cho các nhóm phân tích, kỹ thuật dữ liệu và khoa học dữ liệu thậm chí còn đơn giản hơn Sáu năm trước, điều đó có nghĩa là chỉ hoạt động bằng SQL, ngôn ngữ gốc của kho, Tristan Handy, Người sáng lập và Giám đốc điều hành của dbt Labs cho biết, "Chúng tôi đã tạo dbt để khai thác sức mạnh của nền tảng dữ liệu đám mây hiện đại và trao quyền cho . ""Chúng tôi rất vui mừng được mang sức mạnh và khả năng truy cập của dbt vào một tập hợp khối lượng công việc dữ liệu mới ngày hôm nay với những tiến bộ trên các nền tảng dữ liệu. " Tristan Handy , Người sáng lập và Giám đốc điều hành của dbt Labs. "Ngày nay, với những tiến bộ trên các nền tảng dữ liệu, chúng tôi rất vui mừng được mang sức mạnh và khả năng truy cập của dbt vào một tập hợp khối lượng công việc dữ liệu mới. " Theo Sudhir Hasbe, Sr. Giám đốc quản lý sản phẩm tại Google Cloud, "dbt đã được chứng minh là một quy trình làm việc linh hoạt để khách hàng BigQuery quản lý và giúp thúc đẩy quá trình chuyển đổi dữ liệu của họ. "Chúng tôi rất vui khi được cộng tác với dbt Labs và cung cấp hỗ trợ xử lý Python trong BigQuery để người dùng và cộng đồng dữ liệu có thêm tùy chọn sử dụng dữ liệu nhằm giải quyết các thách thức kinh doanh Theo Adam Conway, SVP phụ trách Sản phẩm tại Databricks, "các nhóm dữ liệu đang áp dụng kho dữ liệu cho tất cả các trường hợp sử dụng AI và phân tích của họ, tận dụng nhiều ngôn ngữ lập trình để giải quyết các thách thức về dữ liệu của họ. " Do đó, chúng tôi rất vui mừng được xây dựng mối quan hệ đối tác với dbt Labs để mang các khả năng của Python đến với các khách hàng chung, cho phép người dùng dbt truy cập không chỉ các phép biến đổi SQL mà còn toàn bộ hệ sinh thái lakehouse, bao gồm cả ML. Adam Conway , SVP phụ trách Sản phẩm tại Databricks. "Đó là lý do tại sao chúng tôi rất vui mừng được xây dựng mối quan hệ đối tác với dbt Labs để mang các khả năng của Python đến với các khách hàng chung, cung cấp cho người dùng dbt quyền truy cập không chỉ vào các phép biến đổi SQL mà còn toàn bộ hệ sinh thái lakehouse bao gồm ML. " Việc bổ sung hỗ trợ Python mở ra các khả năng mới quan trọng cho các nhóm hiện đang làm việc về phân tích trong SQL, cho phép họ
Bởi vì các nhóm phân tích dữ liệu và nhóm khoa học dữ liệu sử dụng các công cụ khác nhau và thường đưa ra các giả định khác nhau, nên hiện tại có một khoảng cách đáng kể giữa họ và tác động tiềm tàng của việc hỗ trợ Python trong dbt vượt xa giá trị tức thời của họ đối với các nhóm phân tích dữ liệu. Về lâu dài, việc hỗ trợ Python trong dbt sẽ mở ra cơ hội cho nhiều nhà khoa học dữ liệu cộng tác trong cùng một công cụ với các đối tác phân tích của họ, thu hẹp khoảng cách đó, giống như việc dbt đã giảm bớt khoảng cách giữa các nhà phân tích và kỹ sư dữ liệu trong vài năm qua bởi Xem bài đăng trên blog từ hôm nay để biết thêm chi tiết Giới thiệu về phòng thí nghiệm dbt dbt đã nổi lên như một tiêu chuẩn công nghiệp để chuyển đổi dữ liệu trên đám mây. Với bản phát hành này, 16.000 tổ chức sử dụng dbt ngày nay có thể tận dụng các khả năng của Python có sẵn trên các nền tảng dữ liệu đám mây lớn. Snowflake's Snowpark cho Python và Serverless Spark của BigQuery, cũng như việc Databricks mở rộng sang quy trình phân tích dữ liệu với Databricks SQL, đã nâng cao vai trò của Python trong ngăn xếp dữ liệu hiện đại. Người dùng dbt sẽ có tùy chọn chọn ngôn ngữ tốt nhất — SQL hoặc Python — cho nhiệm vụ sắp tới Torsten Grabs, Giám đốc quản lý sản phẩm của Snowflake cho biết: "Mối quan hệ đối tác của Snowflake với dbt Labs đã trở thành công cụ cho các phân tích hiện đại khi chúng tôi nỗ lực hướng tới việc cho phép các nhóm dữ liệu triển khai mã SQL một cách an toàn và hợp tác vào sản xuất". "Với việc giới thiệu các mô hình Python của dbt Labs và Snowflake's Snowpark cho Python, các khách hàng chung giờ đây có thể dễ dàng kết hợp sức mạnh của SQL và Python để phân tích hiện đại và hưởng lợi từ sự đổi mới xử lý dữ liệu phong phú trong cộng đồng Python. Điều này sẽ giúp các nhóm phân tích, kỹ thuật dữ liệu và khoa học dữ liệu dễ dàng làm việc hiệu quả và hợp tác hơn trong Đám mây dữ liệu. " "Chúng tôi đã tạo dbt để khai thác sức mạnh của nền tảng dữ liệu đám mây hiện đại và trao quyền cho tất cả những người hành nghề dữ liệu tham gia vào quá trình chuyển đổi dữ liệu. Sáu năm trước, điều đó có nghĩa là chỉ làm việc bằng SQL, ngôn ngữ mẹ đẻ của kho," Tristan Handy , Người sáng lập và Giám đốc điều hành của dbt Labs cho biết. "Ngày nay, với những tiến bộ trên các nền tảng dữ liệu, chúng tôi rất vui mừng được mang sức mạnh và khả năng truy cập của dbt vào một tập hợp khối lượng công việc dữ liệu mới. " Câu chuyện tiếp tục Sudhir Hasbe, Sr, cho biết: "dbt đã được chứng minh là một quy trình làm việc linh hoạt để khách hàng của BigQuery quản lý và giúp thúc đẩy quá trình chuyển đổi dữ liệu của họ". Giám đốc quản lý sản phẩm từ Google Cloud. "Chúng tôi tự hào được hợp tác với dbt Labs và cung cấp hỗ trợ xử lý Python trong BigQuery để khách hàng và cộng đồng dữ liệu thậm chí có nhiều cách hơn để giải quyết các thách thức kinh doanh với dữ liệu. " "Các nhóm dữ liệu đang áp dụng kho dữ liệu cho tất cả các trường hợp sử dụng AI và phân tích của họ, tận dụng nhiều ngôn ngữ lập trình để giải quyết các thách thức về dữ liệu của họ", Adam Conway, SVP of Products at Databricks. "That's why we're excited to build on our partnership with dbt Labs to bring Python capabilities to joint customers, offering dbt users access to not only SQL transformations but also the entire lakehouse ecosystem including ML." Đối với các nhóm hiện đang thực hiện công việc phân tích bằng SQL, việc bao gồm hỗ trợ cho Python sẽ mở ra các khả năng mới quan trọng, mang lại cho họ khả năng
Tác động tiềm tàng của việc hỗ trợ Python trong dbt vượt xa giá trị tức thời của nó đối với các nhóm phân tích dữ liệu. Ngày nay, có một khoảng cách đáng kể giữa các nhóm phân tích và nhóm khoa học dữ liệu, do họ sử dụng các công cụ khác nhau thường dẫn đến các giả định khác nhau. Về lâu dài, hỗ trợ Python trong dbt sẽ mở ra cơ hội cho nhiều nhà khoa học dữ liệu cộng tác trong cùng một công cụ với các đối tác phân tích của họ, thu hẹp khoảng cách đó. Điều này sẽ phản ánh cách mà dbt đã giảm bớt khoảng cách giữa các nhà phân tích và kỹ sư dữ liệu trong vài năm qua bằng cách cung cấp cho họ một khuôn khổ chung để cộng tác Để biết thêm thông tin, hãy xem bài đăng trên blog hôm nay tại đây Giới thiệu về phòng thí nghiệm dbt
Cision Xem nội dung gốc để tải xuống đa phương tiện. https. //www. prnewswire. com/news-releases/dbt-labs-launches-python-support-to-expand-what-data-practitioners-can-accomplete-with-dbt-301652065. html DBT có hỗ trợ Python không?Tuần này chúng tôi đã ra mắt phiên bản v1. 3 của dbt Core, bao gồm hỗ trợ cho các mô hình Python trong dbt . Tính năng này hiện khả dụng trong cả dbt Core và dbt Cloud cho người dùng trên các nền tảng dữ liệu được hỗ trợ. BigQuery, Databricks và Snowflake.
Dữ liệu DBT hoạt động như thế nào?dbt (công cụ xây dựng dữ liệu) tự động tạo tài liệu về mô tả, phụ thuộc mô hình, SQL mô hình, nguồn và kiểm tra . dbt tạo các biểu đồ dòng của đường dẫn dữ liệu, cung cấp tính minh bạch và khả năng hiển thị về những gì dữ liệu đang mô tả, cách dữ liệu được tạo ra cũng như cách dữ liệu ánh xạ tới logic nghiệp vụ.
|