<?xml version="1.0" encoding="UTF-8" ?>
<rss
    version="2.0"
    xmlns:atom="http://www.w3.org/2005/Atom"
    xmlns:content="http://purl.org/rss/1.0/modules/content/"
    xmlns:webfeeds="http://webfeeds.org/rss/1.0"
    xmlns:media="http://search.yahoo.com/mrss/"
    >
    <channel>
        <title>Data-engineer Tag - Viblo</title>
        <link>https://viblo.asia/rss</link>
        <description><![CDATA[Free service for technical knowledge sharing]]></description>
        <atom:link href="https://viblo.asia/rss/tags/data-engineer.rss" rel="self"></atom:link>
                <copyright>Sun* Inc.</copyright>
                                                <webfeeds:logo>https://viblo.asia/logo_full.svg</webfeeds:logo>
        <image>
            <url>https://viblo.asia/logo_full.svg</url>
            <title>Data-engineer Tag - Viblo</title>
            <link>https://viblo.asia/rss</link>
        </image>
                                <language>vi-vn</language>
        <lastBuildDate>2026-04-21T22:21:44+07:00</lastBuildDate>
                <item>
            <title><![CDATA[Tìm hiểu Apache Flink – Processing Engine mạnh mẽ ứng dụng Real Time]]></title>
                        <link>https://viblo.asia/p/tim-hieu-apache-flink-processing-engine-manh-me-ung-dung-real-time-pPLkN1eZJRZ</link>
            <guid isPermaLink="true">https://viblo.asia/p/tim-hieu-apache-flink-processing-engine-manh-me-ung-dung-real-time-pPLkN1eZJRZ</guid>
            <description><![CDATA[

Dữ liệu hiện tại đang có sự phát triển rất nhanh và nhiều đáp ứng với nhu cầu đó chúng ta cùng tìm hiểu một công cụ mạnh mẽ làm việc với dữ liệu.
Ap...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">TruongItt</dc:creator>
            <pubDate>2026-03-25 00:08:35</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[DATA Engineering Blog 1: ETL Dữ Liệu Từ URL]]></title>
                        <link>https://viblo.asia/p/data-engineering-blog-1-etl-du-lieu-tu-url-Nj4vg6poJ6r</link>
            <guid isPermaLink="true">https://viblo.asia/p/data-engineering-blog-1-etl-du-lieu-tu-url-Nj4vg6poJ6r</guid>
            <description><![CDATA[Trong thế giới của hệ thống phân tán, ranh giới giữa một 'thuật toán thông minh' và một 'thảm họa vận hành' thường chỉ cách nhau đúng một lần deploy. ...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Kiên Lý</dc:creator>
            <pubDate>2026-03-08 19:26:57</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Tôi đã dùng Local AI để clean data như thế nào?]]></title>
                        <link>https://viblo.asia/p/toi-da-dung-local-ai-de-clean-data-nhu-the-nao-7Z4DE0pnJnX</link>
            <guid isPermaLink="true">https://viblo.asia/p/toi-da-dung-local-ai-de-clean-data-nhu-the-nao-7Z4DE0pnJnX</guid>
            <description><![CDATA[![](https://images.viblo.asia/561dc89e-1f5f-45d3-9954-c62f499ed698.gif)



Xin chào,

Chắc hẳn anh em nào từng xử lí data cũng đã từng có giai đoạn "t...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">An</dc:creator>
            <pubDate>2026-01-25 12:35:37</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Tối ưu luồng dữ liệu OLTP sang OLAP bằng AWS Zero‑ETL]]></title>
                        <link>https://viblo.asia/p/toi-uu-luong-du-lieu-oltp-sang-olap-bang-aws-zeroetl-ZjJYWlyMVOE</link>
            <guid isPermaLink="true">https://viblo.asia/p/toi-uu-luong-du-lieu-oltp-sang-olap-bang-aws-zeroetl-ZjJYWlyMVOE</guid>
            <description><![CDATA[Hướng dẫn này trình bày cách xây dựng một pipeline serverless để nhân bản dữ liệu giao dịch từ Amazon Aurora (MySQL) sang Amazon Redshift bằng tích hợ...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Kiên Lý</dc:creator>
            <pubDate>2026-01-16 11:53:34</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Vì Sao Học Data 6-12 Tháng Vẫn Khó Xin Việc – Góc Nhìn Của Một Mentor Đã Gặp Rất Nhiều Người Giống Bạn]]></title>
                        <link>https://viblo.asia/p/vi-sao-hoc-data-6-12-thang-van-kho-xin-viec-goc-nhin-cua-mot-mentor-da-gap-rat-nhieu-nguoi-giong-ban-kY4gD8kRJAe</link>
            <guid isPermaLink="true">https://viblo.asia/p/vi-sao-hoc-data-6-12-thang-van-kho-xin-viec-goc-nhin-cua-mot-mentor-da-gap-rat-nhieu-nguoi-giong-ban-kY4gD8kRJAe</guid>
            <description><![CDATA[Tôi còn nhớ rất rõ một buổi mentoring cách đây không lâu.

Bạn ấy mở laptop, cho tôi xem một folder project khá đầy đủ: SQL, Power BI, vài notebook Py...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Chuyện Data Engineer</dc:creator>
            <pubDate>2026-01-12 11:51:59</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Data Engineer và Data Analyst Khác Nhau Thế Nào? So Sánh Dễ Hiểu Cho Sinh Viên Năm 3–4]]></title>
                        <link>https://viblo.asia/p/data-engineer-va-data-analyst-khac-nhau-the-nao-so-sanh-de-hieu-cho-sinh-vien-nam-34-2vJPdEMnJeK</link>
            <guid isPermaLink="true">https://viblo.asia/p/data-engineer-va-data-analyst-khac-nhau-the-nao-so-sanh-de-hieu-cho-sinh-vien-nam-34-2vJPdEMnJeK</guid>
            <description><![CDATA[Data Engineer và Data Analyst khác nhau thế nào? Câu hỏi “then chốt” trước khi chọn hướng học Data

Với sinh viên năm 3–4 hoặc người đang tìm hiểu để ...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Chuyện Data Engineer</dc:creator>
            <pubDate>2026-01-12 10:56:10</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[[dbt basic] [P1] dbt là gì?]]></title>
                        <link>https://viblo.asia/p/dbt-basic-p1-dbt-la-gi-vlZL9dweJQK</link>
            <guid isPermaLink="true">https://viblo.asia/p/dbt-basic-p1-dbt-la-gi-vlZL9dweJQK</guid>
            <description><![CDATA[Lời mở đầu
Trong những năm gần đây, dbt trở nên khá phổ biến trong domain data engineering. Trong quá trình làm việc mình cũng có chút kiến thức và tr...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Minh Tuan</dc:creator>
            <pubDate>2025-05-02 01:31:18</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[5 dự án Data Engineer thực tế cho người mới bắt đầu (2025)]]></title>
                        <link>https://viblo.asia/p/5-du-an-data-engineer-thuc-te-cho-nguoi-moi-bat-dau-2025-vlZL9A2MLQK</link>
            <guid isPermaLink="true">https://viblo.asia/p/5-du-an-data-engineer-thuc-te-cho-nguoi-moi-bat-dau-2025-vlZL9A2MLQK</guid>
            <description><![CDATA[![](https://images.viblo.asia/d109ef01-3984-4dfb-b309-6cffefa9b724.png)



Bước chân vào lĩnh vực Data Engineer, bạn sẽ nhận ra rằng tham gia các dự á...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Chuyện Data Engineer</dc:creator>
            <pubDate>2024-12-24 17:51:33</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Top 5 kỹ năng Data Engineer cần biết trong 2025]]></title>
                        <link>https://viblo.asia/p/top-5-ky-nang-data-engineer-can-biet-trong-2025-PAoJenprL1j</link>
            <guid isPermaLink="true">https://viblo.asia/p/top-5-ky-nang-data-engineer-can-biet-trong-2025-PAoJenprL1j</guid>
            <description><![CDATA[Muốn trở thành một Data Engineer trong năm 2025 tới, bạn phải nắm rõ bộ kỹ năng cần thiết của vị trí này. Từ khả năng lập trình SQL, Python đến việc n...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Chuyện Data Engineer</dc:creator>
            <pubDate>2024-11-27 19:39:17</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Analytics Engineer là gì? Lộ trình Data Analyst chuyển nghề làm Analytics Engineer]]></title>
                        <link>https://viblo.asia/p/analytics-engineer-la-gi-lo-trinh-data-analyst-chuyen-nghe-lam-analytics-engineer-E1XVOjYELMz</link>
            <guid isPermaLink="true">https://viblo.asia/p/analytics-engineer-la-gi-lo-trinh-data-analyst-chuyen-nghe-lam-analytics-engineer-E1XVOjYELMz</guid>
            <description><![CDATA[![](https://images.viblo.asia/f9d74ed3-76a5-450b-87bf-b20c3272c95c.png)



Trong thị trường việc làm hiện nay, sự chuyển mình từ Data Analyst/DA sang ...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Chuyện Data Engineer</dc:creator>
            <pubDate>2024-11-26 09:12:18</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[So sánh điểm khác nhau giữa ETL và ELT]]></title>
                        <link>https://viblo.asia/p/so-sanh-diem-khac-nhau-giua-etl-va-elt-Ny0VGZOzLPA</link>
            <guid isPermaLink="true">https://viblo.asia/p/so-sanh-diem-khac-nhau-giua-etl-va-elt-Ny0VGZOzLPA</guid>
            <description><![CDATA[Trong một thế giới bùng nổ của dữ liệu, các tổ chức đang đối mặt với một lượng thông tin khổng lồ và nhu cầu quản lý những thông tin giá trị từ dữ liệ...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">GAP SOFT</dc:creator>
            <pubDate>2024-11-15 14:52:04</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[SQL Và Một Số Câu Hỏi Thường Gặp]]></title>
                        <link>https://viblo.asia/p/sql-va-mot-so-cau-hoi-thuong-gap-EoW4oaGzLml</link>
            <guid isPermaLink="true">https://viblo.asia/p/sql-va-mot-so-cau-hoi-thuong-gap-EoW4oaGzLml</guid>
            <description><![CDATA[1. INNER JOIN, LEFT JOIN, RIGHT JOIN, and FULL OUTER JOIN in SQL

- INNER JOIN: Returns records that have matching values in both tables.
  - Use case...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Hà Thanh Bình</dc:creator>
            <pubDate>2024-10-05 07:13:47</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Triển vọng và mức lương của Data Engineer]]></title>
                        <link>https://viblo.asia/p/trien-vong-va-muc-luong-cua-data-engineer-qPoL7RkeJvk</link>
            <guid isPermaLink="true">https://viblo.asia/p/trien-vong-va-muc-luong-cua-data-engineer-qPoL7RkeJvk</guid>
            <description><![CDATA[![](https://images.viblo.asia/acede56c-a2d9-487b-b092-9c6bf265ed74.jpg)



Trong thời đại mà dữ liệu thúc đẩy sự đổi mới và đưa ra quyết định mang tín...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Chuyện Data Engineer</dc:creator>
            <pubDate>2024-08-28 09:00:13</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Những điều cần biết về Analytics Engineer]]></title>
                        <link>https://viblo.asia/p/nhung-dieu-can-biet-ve-analytics-engineer-n1j4l6OGLwl</link>
            <guid isPermaLink="true">https://viblo.asia/p/nhung-dieu-can-biet-ve-analytics-engineer-n1j4l6OGLwl</guid>
            <description><![CDATA[Chúng ta đều biết rằng ngành khoa học dữ liệu liên tục phát triển kéo theo các chức danh và vai trò công việc liên tục được tăng thêm. Trong những ngà...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Chuyện Data Engineer</dc:creator>
            <pubDate>2024-08-09 10:00:00</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Sử Dụng AWS Glue Data Catalog và Athena Để Đơn Giản Hóa Quản Lý và Truy Vấn Dữ Liệu]]></title>
                        <link>https://viblo.asia/p/su-dung-aws-glue-data-catalog-va-athena-de-don-gian-hoa-quan-ly-va-truy-van-du-lieu-vlZL9887JQK</link>
            <guid isPermaLink="true">https://viblo.asia/p/su-dung-aws-glue-data-catalog-va-athena-de-don-gian-hoa-quan-ly-va-truy-van-du-lieu-vlZL9887JQK</guid>
            <description><![CDATA[Giới Thiệu Về AWS Glue Data Catalog và AWS Athena

Trong lĩnh vực phân tích dữ liệu hiện đại, khả năng tổ chức và truy vấn dữ liệu một cách hiệu quả l...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Lên Cloud cùng Lam</dc:creator>
            <pubDate>2024-08-05 23:56:00</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Dựng Apache Airflow phiên bản cực nhẹ LocalExecutor với Docker Compose]]></title>
                        <link>https://viblo.asia/p/dung-apache-airflow-phien-ban-cuc-nhe-localexecutor-voi-docker-compose-x7Z4DAjPJnX</link>
            <guid isPermaLink="true">https://viblo.asia/p/dung-apache-airflow-phien-ban-cuc-nhe-localexecutor-voi-docker-compose-x7Z4DAjPJnX</guid>
            <description><![CDATA[Đã có bao giờ bạn tự hỏi rằng khi dựng Airflow ở local hay home server cho mục đích học tập và testing DAG, vậy thì làm gì mà lại ngốn nhiều RAM và CP...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Thang Bui</dc:creator>
            <pubDate>2024-07-25 15:17:04</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Vai Trò và Tầm Quan Trọng của &quot;Indexes&quot; Trong Tối Ưu Hóa Truy vấn Cơ Sở Dữ Liệu]]></title>
                        <link>https://viblo.asia/p/vai-tro-va-tam-quan-trong-cua-indexes-trong-toi-uu-hoa-truy-van-co-so-du-lieu-2oKLnn6XLQO</link>
            <guid isPermaLink="true">https://viblo.asia/p/vai-tro-va-tam-quan-trong-cua-indexes-trong-toi-uu-hoa-truy-van-co-so-du-lieu-2oKLnn6XLQO</guid>
            <description><![CDATA[1 Khái quát về Index
Các Index rất quan trọng trong các hệ thống cơ sở dữ liệu vì chúng nâng cao đáng kể hiệu quả xử lý truy vấn. Dưới dây là những lý...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Hà Thanh Bình</dc:creator>
            <pubDate>2024-06-16 00:00:00</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Hash-Distributed Table, Round-Robin Table, Replicated Table - Azure Synapse Service]]></title>
                        <link>https://viblo.asia/p/hash-distributed-table-round-robin-table-replicated-table-azure-synapse-service-PAoJeQrkJ1j</link>
            <guid isPermaLink="true">https://viblo.asia/p/hash-distributed-table-round-robin-table-replicated-table-azure-synapse-service-PAoJeQrkJ1j</guid>
            <description><![CDATA[1. Has-Distributed Tables
1.1 Định nghĩa
- Các bảng phân phối hàm băm sử dụng hàm băm (hash function) để phân phối các hàng trên các bản phân phối khá...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Hà Thanh Bình</dc:creator>
            <pubDate>2024-06-13 22:42:57</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Khái Quát về Severless SQL Pools]]></title>
                        <link>https://viblo.asia/p/khai-quat-ve-severless-sql-pools-obA46d7gLKv</link>
            <guid isPermaLink="true">https://viblo.asia/p/khai-quat-ve-severless-sql-pools-obA46d7gLKv</guid>
            <description><![CDATA[Giới Thiệu
- Serverless SQL Pools, còn được gọi là serverless SQL databases hoặc serverless SQL Querying, là một loại dịch vụ cơ sở dữ liệu dựa trên đ...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Hà Thanh Bình</dc:creator>
            <pubDate>2024-06-10 20:00:19</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Setting Up and Using Spark Operator with Kubernetes]]></title>
                        <link>https://viblo.asia/p/setting-up-and-using-spark-operator-with-kubernetes-gwd43jnKVX9</link>
            <guid isPermaLink="true">https://viblo.asia/p/setting-up-and-using-spark-operator-with-kubernetes-gwd43jnKVX9</guid>
            <description><![CDATA[![](https://images.viblo.asia/a1645238-bd1d-449c-8364-ca4ccaf169c1.png)



Spark Operator is a Kubernetes Operator designed for Spark. It aims to defi...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Duy Nguyen</dc:creator>
            <pubDate>2024-06-07 20:50:39</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Sơ Lược Về Azure Synapse Service]]></title>
                        <link>https://viblo.asia/p/so-luoc-ve-azure-synapse-service-n1j4l6EKLwl</link>
            <guid isPermaLink="true">https://viblo.asia/p/so-luoc-ve-azure-synapse-service-n1j4l6EKLwl</guid>
            <description><![CDATA[Giới thiệu
Azure Synapse Service, trước đây được gọi là kho dữ liệu Azure SQL (Azure SQL Data Warehouse), là một dịch vụ phân tích tích hợp, toàn diện...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Hà Thanh Bình</dc:creator>
            <pubDate>2024-06-08 11:52:55</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[APACHE BEAM - Tóm tắt về Apache Beam]]></title>
                        <link>https://viblo.asia/p/apache-beam-tom-tat-ve-apache-beam-GAWVpMko405</link>
            <guid isPermaLink="true">https://viblo.asia/p/apache-beam-tom-tat-ve-apache-beam-GAWVpMko405</guid>
            <description><![CDATA[APACHE BEAM LÀ GÌ?
Định nghĩa
* Là open-source
* Là một mô hình lập trình thống nhất để xác định và thực thi các luồng xử lý dữ liệu (data processing ...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Myzu</dc:creator>
            <pubDate>2024-06-07 15:11:36</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Hadoop Architecture, Data Lake, and Apache Spark]]></title>
                        <link>https://viblo.asia/p/hadoop-architecture-data-lake-and-apache-spark-aNj4vbKx46r</link>
            <guid isPermaLink="true">https://viblo.asia/p/hadoop-architecture-data-lake-and-apache-spark-aNj4vbKx46r</guid>
            <description><![CDATA[Hadoop là gì và nó hoạt động như thế nào?
Hadoop là một nền tảng xử lý dữ liệu phân tán cung cấp các khả năng cốt lõi sau.

* YARN - Cluster Resource ...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Hà Thanh Bình</dc:creator>
            <pubDate>2024-06-04 22:24:25</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Hướng dẫn cài đặt sử dụng databricks]]></title>
                        <link>https://viblo.asia/p/huong-dan-cai-dat-su-dung-databricks-obA46yngVKv</link>
            <guid isPermaLink="true">https://viblo.asia/p/huong-dan-cai-dat-su-dung-databricks-obA46yngVKv</guid>
            <description><![CDATA[
Databricks là một nền tảng mạnh mẽ và linh hoạt cho phân tích dữ liệu và máy học, và nó đã trở thành một công cụ quan trọng trong lĩnh vực khoa học d...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Chuyện Data Engineer</dc:creator>
            <pubDate>2023-12-08 20:00:00</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Cái nhìn tổng thể về các công nghệ và công cụ hàng đầu trong Data Engineering]]></title>
                        <link>https://viblo.asia/p/cai-nhin-tong-the-ve-cac-cong-nghe-va-cong-cu-hang-dau-trong-data-engineering-2oKLndPZ4QO</link>
            <guid isPermaLink="true">https://viblo.asia/p/cai-nhin-tong-the-ve-cac-cong-nghe-va-cong-cu-hang-dau-trong-data-engineering-2oKLndPZ4QO</guid>
            <description><![CDATA[Trong thế giới số hóa hiện đại ngày nay, không có gì quan trọng hơn việc hiểu và khai thác dữ liệu. Data Engineering, một lĩnh vực nổi bật trong ngành...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Michelle Nguyen</dc:creator>
            <pubDate>2023-06-27 23:04:14</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Cứ thực hành Airflow dễ hiểu và đơn giản đã, chưa làm gì phức tạp cả]]></title>
                        <link>https://viblo.asia/p/cu-thuc-hanh-airflow-de-hieu-va-don-gian-da-chua-lam-gi-phuc-tap-ca-2oKLnxog4QO</link>
            <guid isPermaLink="true">https://viblo.asia/p/cu-thuc-hanh-airflow-de-hieu-va-don-gian-da-chua-lam-gi-phuc-tap-ca-2oKLnxog4QO</guid>
            <description><![CDATA[Mở đầu
Tiếp nối bài viết chỉ toàn lý thuyết Bài viết về Airflow cho người mới như mình thì chúng ta đi ngay tới bài thực hành này thôi

Chú ý là mình ...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Trung Đức</dc:creator>
            <pubDate>2023-06-13 17:42:55</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Bài viết về Airflow cho người mới như mình]]></title>
                        <link>https://viblo.asia/p/bai-viet-ve-airflow-cho-nguoi-moi-nhu-minh-Ny0VGdaE4PA</link>
            <guid isPermaLink="true">https://viblo.asia/p/bai-viet-ve-airflow-cho-nguoi-moi-nhu-minh-Ny0VGdaE4PA</guid>
            <description><![CDATA[Mở đầu
Lướt dạo một vòng thì bài viết Airflow trên Viblo cũng có một số bài tương đối chi tiết như Tất tần tật về Airflow (P1) của anh Hoàng hay Một s...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Trung Đức</dc:creator>
            <pubDate>2023-06-13 17:42:31</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[ETL vs ELT không đơn giản chỉ là LT và TL?]]></title>
                        <link>https://viblo.asia/p/etl-vs-elt-khong-don-gian-chi-la-lt-va-tl-MkNLrkQlVgA</link>
            <guid isPermaLink="true">https://viblo.asia/p/etl-vs-elt-khong-don-gian-chi-la-lt-va-tl-MkNLrkQlVgA</guid>
            <description><![CDATA[Giới thiệu
Một trong những việc mà những người làm việc với Data cần làm, đặc biệt là Data Engineering, cần quan tâm đó là việc trích xuất dữ liệu từ ...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Trung Đức</dc:creator>
            <pubDate>2023-06-05 14:39:09</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Cùng thiết lập Multi Node Cluster trong Hadoop 2.x nào!]]></title>
                        <link>https://viblo.asia/p/cung-thiet-lap-multi-node-cluster-trong-hadoop-2x-nao-5pPLkxXdVRZ</link>
            <guid isPermaLink="true">https://viblo.asia/p/cung-thiet-lap-multi-node-cluster-trong-hadoop-2x-nao-5pPLkxXdVRZ</guid>
            <description><![CDATA[Trong bài viết trước của mình, mình đã giới thiệu về Hadoop và các thành phần của Hadoop. Hadoop là một hệ sinh thái mã nguồn mở được sử dụng để lưu t...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Trung Đức</dc:creator>
            <pubDate>2023-05-04 15:13:52</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Thảo luận về performance của Pandas: Pandas 2.0 liệu có đột phá?]]></title>
                        <link>https://viblo.asia/p/thao-luan-ve-performance-cua-pandas-pandas-20-lieu-co-dot-pha-zXRJ8nrZVGq</link>
            <guid isPermaLink="true">https://viblo.asia/p/thao-luan-ve-performance-cua-pandas-pandas-20-lieu-co-dot-pha-zXRJ8nrZVGq</guid>
            <description><![CDATA[Đây là bài viết tản mạn.

Bối cảnh mở bài là, hầu hết từ trước đến nay mình đều làm deep learning. Xử lý dữ liệu với Pandas và Numpy là một trong nhữn...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Nguyen Thanh Huyen</dc:creator>
            <pubDate>2023-05-31 23:32:34</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Top các công cụ dành cho Data Analyst]]></title>
                        <link>https://viblo.asia/p/top-cac-cong-cu-danh-cho-data-analyst-m2vJPOPn4eK</link>
            <guid isPermaLink="true">https://viblo.asia/p/top-cac-cong-cu-danh-cho-data-analyst-m2vJPOPn4eK</guid>
            <description><![CDATA[
Ngành Phân tích Dữ liệu đang là một trong những nghề Hot nhất và đang phát triển nhanh trên toàn thế giới. Theo phát triển, đang có rất nhiều công cụ...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Chuyện Data Engineer</dc:creator>
            <pubDate>2023-01-13 14:52:44</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[TOP CÁC CÔNG CỤ DATA ENGINEER CẦN HỌC]]></title>
                        <link>https://viblo.asia/p/top-cac-cong-cu-data-engineer-can-hoc-2oKLnNRyLQO</link>
            <guid isPermaLink="true">https://viblo.asia/p/top-cac-cong-cu-data-engineer-can-hoc-2oKLnNRyLQO</guid>
            <description><![CDATA[
Data Engineering là một trong những công việc hấp dẫn nhất thế kỷ 21 bởi mức lương tốt và cơ hội việc làm rộng mở. Trong doanh nghiệp, Data Engineer ...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Chuyện Data Engineer</dc:creator>
            <pubDate>2023-01-12 14:15:09</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Hướng dẫn cài đặt Pentaho]]></title>
                        <link>https://viblo.asia/p/huong-dan-cai-dat-pentaho-MkNLrOAoVgA</link>
            <guid isPermaLink="true">https://viblo.asia/p/huong-dan-cai-dat-pentaho-MkNLrOAoVgA</guid>
            <description><![CDATA[

PENTAHO là gì?

Là công cụ Open Source, thành lập 2001 và sử dụng công cụ GUI để bạn xây dựng và vận hành ETL dữ liệu của mình - họ có phiên bản Com...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Chuyện Data Engineer</dc:creator>
            <pubDate>2023-01-12 11:41:41</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Data Modeling là gì? Lợi ích mà data modeling?]]></title>
                        <link>https://viblo.asia/p/data-modeling-la-gi-loi-ich-ma-data-modeling-5pPLkPzZVRZ</link>
            <guid isPermaLink="true">https://viblo.asia/p/data-modeling-la-gi-loi-ich-ma-data-modeling-5pPLkPzZVRZ</guid>
            <description><![CDATA[
1. Data modeling là gì?
Data model (mô hình dữ liệu) là sơ đồ về cách thức tổ chức, lưu trữ dữ liệu trong doanh nghiệp và các mối liên kết giữa các t...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Chuyện Data Engineer</dc:creator>
            <pubDate>2023-01-09 11:45:42</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[11 quy tắc quan trọng trong thiết kế Cơ sở dữ liệu]]></title>
                        <link>https://viblo.asia/p/11-quy-tac-quan-trong-trong-thiet-ke-co-so-du-lieu-2oKLnNaXLQO</link>
            <guid isPermaLink="true">https://viblo.asia/p/11-quy-tac-quan-trong-trong-thiet-ke-co-so-du-lieu-2oKLnNaXLQO</guid>
            <description><![CDATA[
Quy tắc 1: Bản chất của ứng dụng (OLTP hoặc OLAP) là gì?
Khi bạn bắt đầu thiết kế cơ sở dữ liệu của mình, điều đầu tiên cần phân tích là bản chất của...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Chuyện Data Engineer</dc:creator>
            <pubDate>2023-01-06 16:29:21</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Tổng quát về công cụ tích hợp dữ liệu Oracle Data Integrator (ODI)]]></title>
                        <link>https://viblo.asia/p/tong-quat-ve-cong-cu-tich-hop-du-lieu-oracle-data-integrator-odi-0gdJzQZk4z5</link>
            <guid isPermaLink="true">https://viblo.asia/p/tong-quat-ve-cong-cu-tich-hop-du-lieu-oracle-data-integrator-odi-0gdJzQZk4z5</guid>
            <description><![CDATA[Bắt đầu chúng Oracle Data Integrator (ODI) là một giải pháp độc đáo đáp ứng tất cả các nhu cầu tích hợp của người dùng. Năm 2018, Oracle Data Integrat...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Chuyện Data Engineer</dc:creator>
            <pubDate>2023-01-06 14:39:30</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Khái niệm cơ bản: Lakehouse là gì? So sánh giữa Lakehouse, Data Lake và Data Warehouse?]]></title>
                        <link>https://viblo.asia/p/khai-niem-co-ban-lakehouse-la-gi-so-sanh-giua-lakehouse-data-lake-va-data-warehouse-AZoJjYQE4Y7</link>
            <guid isPermaLink="true">https://viblo.asia/p/khai-niem-co-ban-lakehouse-la-gi-so-sanh-giua-lakehouse-data-lake-va-data-warehouse-AZoJjYQE4Y7</guid>
            <description><![CDATA[
1. Data Lakehouse là gì?
Data Lakehouse là một kiến trúc quản lý dữ liệu mở, mới, kết hợp tính linh hoạt, hiệu quả về chi phí và quy mô của các Data ...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Chuyện Data Engineer</dc:creator>
            <pubDate>2022-12-30 16:41:45</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[11 bước để Triển khai kho dữ liệu (DWH)]]></title>
                        <link>https://viblo.asia/p/11-buoc-de-trien-khai-kho-du-lieu-dwh-2oKLnNXgLQO</link>
            <guid isPermaLink="true">https://viblo.asia/p/11-buoc-de-trien-khai-kho-du-lieu-dwh-2oKLnNXgLQO</guid>
            <description><![CDATA[
Để triển khai kho dữ liệu (Data warehouse) thành công thì chúng ta có thể tham khảo các bước làm dưới đây:
Quy trình triển khai kho dữ liệu

>> Đọc t...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Chuyện Data Engineer</dc:creator>
            <pubDate>2022-12-28 16:58:22</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Kho dữ liệu (Data Warehouse) là gì? Phân biệt kho dữ liệu và cơ sở dữ liệu]]></title>
                        <link>https://viblo.asia/p/kho-du-lieu-data-warehouse-la-gi-phan-biet-kho-du-lieu-va-co-so-du-lieu-obA466mX4Kv</link>
            <guid isPermaLink="true">https://viblo.asia/p/kho-du-lieu-data-warehouse-la-gi-phan-biet-kho-du-lieu-va-co-so-du-lieu-obA466mX4Kv</guid>
            <description><![CDATA[
Kho dữ liệu (tiếng Anh: Data Warehouse) là kho lưu trữ điện tử của một lượng lớn thông tin của một doanh nghiệp hoặc tổ chức
Khái niệm
Kho dữ liệu là...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Chuyện Data Engineer</dc:creator>
            <pubDate>2022-12-28 16:37:38</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Mô hình hoá dữ liệu: Data Warehouse Modeling]]></title>
                        <link>https://viblo.asia/p/mo-hinh-hoa-du-lieu-data-warehouse-modeling-W13VMgxGJY7</link>
            <guid isPermaLink="true">https://viblo.asia/p/mo-hinh-hoa-du-lieu-data-warehouse-modeling-W13VMgxGJY7</guid>
            <description><![CDATA[
Data Warehouse Modeling là quá trình thiết kế các lược đồ thông tin chi tiết và tóm tắt của kho dữ liệu. Mục tiêu của Data Warehouse Modeling là phát...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Chuyện Data Engineer</dc:creator>
            <pubDate>2022-12-23 11:31:19</pubDate>
                                                                                                        </item>
            </channel>
</rss>
