Data Cleansing

Định nghĩa Data Cleansing là gì?

Data CleansingDọn dẹp dữ liệu. Đây là nghĩa tiếng Việt của thuật ngữ Data Cleansing - một thuật ngữ thuộc nhóm Technology Terms - Công nghệ thông tin.

Độ phổ biến(Factor rating): 5/10

Làm sạch dữ liệu là quá trình làm thay đổi dữ liệu trong một tài nguyên lưu trữ cho chắc chắn rằng nó là chính xác và đúng đắn. Có rất nhiều cách để theo đuổi dữ liệu làm sạch trong phần mềm và lưu trữ dữ liệu khác nhau kiến ​​trúc; hầu hết trong số họ tập trung vào việc xem xét cẩn thận các bộ dữ liệu và các giao thức liên quan đến bất kỳ công nghệ lưu trữ dữ liệu cụ thể.

Xem thêm: Thuật ngữ công nghệ A-Z

Giải thích ý nghĩa

Làm sạch dữ liệu đôi khi được so sánh với tẩy dữ liệu, nơi dữ liệu cũ hoặc vô dụng sẽ bị xóa khỏi một tập dữ liệu. Mặc dù dữ liệu sạch có thể liên quan đến việc xóa cũ, dữ liệu không đầy đủ hoặc trùng lặp, làm sạch dữ liệu là khác nhau từ dữ liệu tẩy trong đó dữ liệu tẩy thường tập trung vào không gian thanh toán bù trừ cho các dữ liệu mới, trong khi dữ liệu làm sạch tập trung vào những việc tối đa hóa tính chính xác của dữ liệu trong một hệ thống. Một phương pháp làm sạch dữ liệu có thể sử dụng phân tích cú pháp hoặc các phương pháp khác để thoát khỏi các lỗi cú pháp, lỗi đánh máy hoặc mảnh vỡ của hồ sơ. phân tích cẩn thận của một tập dữ liệu có thể hiển thị như thế nào sáp nhập nhiều bộ dẫn đến sự trùng lặp, trong trường hợp làm sạch dữ liệu có thể được sử dụng để sửa chữa vấn đề.

What is the Data Cleansing? - Definition

Data cleansing is the process of altering data in a given storage resource to make sure that it is accurate and correct. There are many ways to pursue data cleansing in various software and data storage architectures; most of them center on the careful review of data sets and the protocols associated with any particular data storage technology.

Understanding the Data Cleansing

Data cleansing is sometimes compared to data purging, where old or useless data will be deleted from a data set. Although data cleansing can involve deleting old, incomplete or duplicated data, data cleansing is different from data purging in that data purging usually focuses on clearing space for new data, whereas data cleansing focuses on maximizing the accuracy of data in a system. A data cleansing method may use parsing or other methods to get rid of syntax errors, typographical errors or fragments of records. Careful analysis of a data set can show how merging multiple sets led to duplication, in which case data cleansing may be used to fix the problem.

Thuật ngữ liên quan

  • Anonymization
  • Customer Data Management (CDM)
  • Database (DB)
  • Extract Transform Load (ETL)
  • Data Purging
  • QualityStage
  • Demand Signal Repository (DSR)
  • Data Blending
  • Data Janitor
  • Mini SQL (mSQL)

Source: ? Technology Dictionary - Filegi - Techtopedia - Techterm

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *