Theo kịp dữ liệu # 77

Apr 08 2022
5 phút để đọc 5 giờ
Thế giới dữ liệu phức tạp và khó khăn không chỉ đối với những người ngoài cuộc và cả những người mới. Rất nhiều công nghệ, thuật ngữ, khái niệm, kiến ​​trúc, cách tiếp cận, công cụ, phương pháp và từ thông dụng.
Nguồn: https://future.a16z.com/emerging-architectures-modern-data-infraosystem/

Thế giới dữ liệu phức tạp và khó khăn không chỉ đối với những người ngoài cuộc và cả những người mới. Rất nhiều công nghệ, thuật ngữ, khái niệm, kiến ​​trúc, cách tiếp cận, công cụ, phương pháp và từ thông dụng. Đôi khi tôi thích sự đa dạng, đôi khi nó rất mất tập trung. Tôi tiếp tục thấy mình đang chuyển đổi giữa hai cách tiếp cận - đi rộng và cố gắng có được cái nhìn tổng quan cấp cao về nhiều chủ đề và thường xuyên đào sâu vào một số thứ tôi thực sự cần.

Danh sách của tuần này là nhiều hơn về danh sách trước đây.

  • Kiến trúc mới nổi cho cơ sở hạ tầng dữ liệu hiện đại:Nhóm từ a16z đã cập nhật bài đăng của họ về kiến ​​trúc của cơ sở hạ tầng dữ liệu hiện đại và bản thiết kế cho cơ sở hạ tầng dữ liệu ML, BI và đa phương thức. Tôi thường xuyên quay lại bài viết gốc từ năm 2020 vì nó cung cấp một cái nhìn tổng quan tốt đẹp về các thành phần của các cơ sở hạ tầng dữ liệu & phân tích khác nhau và nó cũng là nguồn cảm hứng tuyệt vời cho các lựa chọn công nghệ cho các thành phần riêng lẻ. Cốt lõi không thay đổi nhiều (tốt, trong vòng chưa đầy hai năm). Những gì đã thay đổi là các công cụ và ứng dụng xung quanh cốt lõi. Điều này phản ánh sự bùng nổ của rất nhiều danh mục mới trong ngăn xếp dữ liệu hiện đại (hay còn gọi là sự bùng nổ kỷ Cambri). Chỉ có thời gian mới trả lời được liệu những thứ này sẽ ở lại, phát triển hay ra đi. Dù sao, thật tuyệt khi ai đó để mắt đến tất cả những điều này và liên tục cập nhật bài viết. ( Tương lai )
  • Những bóng ma trong ngăn xếp dữ liệu: “Các nhóm, tổ chức và ngành công nghiệp phân tích nói chung bị ám ảnh bởi kiến ​​thức ngầm - kiến ​​thức 'tồn tại trong các cộng đồng chuyên gia nhưng không bao giờ được viết ra' ”. Hình khối OLAP là một trong những bóng ma đầy ám ảnh này. Vậy, khối OLAP là gì? Nó chỉ ra rằng “Khối lập phương OLAP chỉ là bảng, nhưng bảng được cấu trúc theo một cách rất cụ thể. Thay vì danh sách các đối tượng, khối OLAP là một bảng số liệu hoặc 'thước đo', được tổng hợp trước trên các lớp lồng nhau của nhóm hoặc 'thứ nguyên.' ”Điều đó làm cho việc làm việc với khối OLAP khó hơn làm việc với các bảng gốc, nhưng nó nhanh hơn nhiều. Mặt khác, sự tổng hợp rõ ràng dẫn đến một số thông tin bị mất. Cơ sở dữ liệu hiện đại mạnh mẽ dường như làm cho các khối OLAP trở nên thừa. “Nhưng, giống như bất kỳ con ma tốt nào, mặc dù chúng có thể không tồn tại ở dạng vật chất, Các hình khối OLAP rất sống động về mặt tinh thần. ” Trong các công cụ BI. (benn.substack )
  • Về Tự phục vụ, Dân chủ hóa Dữ liệu và Ngôn ngữ: Các bài báo của JP đã được dán nhãn là “thiết thực như blockchain”. Nhưng tôi vẫn thích chúng. Đây là chủ đề về tự phục vụ (được định nghĩa là "khi mọi người không cần người khác trả lời các câu hỏi liên quan đến doanh nghiệp của họ"), dân chủ hóa dữ liệu ("là về việc tạo ra một tổ chức không đánh thuế sự tò mò, nhưng khuyến khích nó . ”). Một cách để đạt được điều đó có thể là thông qua NLQ - ý tưởng về dữ liệu 'googling' thực sự rất hấp dẫn. ( Dân chủ Dữ liệu Hiện đại )

Trong trường hợp bạn bỏ lỡ vấn đề Cập nhật dữ liệu tuần trước

Cập nhật dữ liệu # 76

Cảm ơn vì đã đọc!

Vui lòng chia sẻ suy nghĩ của bạn hoặc đọc các mẹo trong phần bình luận.

Theo dõi tôi trên Medium , LinkedInTwitter .

© Copyright 2021 - 2023 | vngogo.com | All Rights Reserved