Ủng hộ giúp duy trì hoạt động của diễn đàn
vào số MOMO 0901235709 - Thanh Phong

Cấu trúc và thành phần của công nghệ Hadoop là gì, bạn có biết?

Shop Giày Jean

doanmar59

Well-known member
#1
Ở bài viết trước, chúng ta đã tìm hiểu về Big Data, kho dữ liệu khổng lồ đang được ứng dụng vào rất nhiều lĩnh vực trong cuộc sống. Và trong bài viết này, chúng ta sẽ đi phân tích về Hadoop là gì – một trong những công nghệ có liên quan mật thiết và chặt chẽ với Big Data. Vậy lịch sử hình thành của Hadoop như thế nào? Các vấn đề và hướng giải quyết của Hadoop là gì? Các điểm thuận lợi và cấu trúc thành phần của Hadoop bao gồm những gì? Tất cả đều sẽ được giải đáp trong phần tiếp theo của bài viết này, cùng giành chút thời gian nghiên cứu các bạn nhé!

Tổng quan về Hadoop?
hadoop-la-giHadoop là gì? Lịch sử hình thành Hadoop?
Hadoop là một sản phẩm được tập đoàn Apache Software Foundation phát hành chính thức năm 2005. Đây là tổ chức phi lợi nhuận chuyên sản xuất các phần mềm mã nguồn mở để hỗ trợ các nền tảng trên internet. Với hơn 15 năm phát triển của mình, Hadoop đã dần khẳng định được tầm quan trọng và sức mạnh trong việc lưu trữ và xử lý các kho dữ liệu.

Và có một điều thú vị mà tôi tin chắc rằng, các bạn sẽ chưa nghe qua bao giờ, đó chính là cái tên Hadoop (nghe thật vui tai phải không) bắt nguồn từ đâu? Và xin bật mí rằng, Hadoop là tên của một chú voi đồ chơi thuộc về bé trai của một trong những người sáng lập viên ban đầu tạo ra Hadoop!

Hadoop chính là một framework mã nguồn mở được viết bằng ngôn ngữ lập trình Java, cho phép phát triển các ứng dụng phân tán có nguồn dữ liệu cực lớn hoàn toàn miễn phí. Các ứng dụng có thể làm việc với hàng trăm ngàn node khác nhau với hàng ngàn petabyte dữ liệu. Hadoop được phát triển dựa trên ý tưởng của google, về mô hình MapReduce và GFS (Google File System). Bên cạnh đó, nhờ cơ chế streaming, nên ngoài việc được viết bằng ngôn ngữ Java, Hadoop còn cho phép phát triển các ứng dụng phân tán dựa trên các ngôn ngữ lập trình khác nhau như: C++, Python, Pearl…