Định nghĩa Canonicalization là gì?
Canonicalization là Hợp thức hóa. Đây là nghĩa tiếng Việt của thuật ngữ Canonicalization - một thuật ngữ thuộc nhóm Technology Terms - Công nghệ thông tin.
Độ phổ biến(Factor rating): 5/10
Quá trình chuẩn hóa là quá trình chuyển đổi dữ liệu có liên quan đến nhiều hơn một đại diện sang một định dạng đã được phê duyệt tiêu chuẩn. đảm bảo chuyển đổi như vậy mà dữ liệu chiếu theo quy tắc kinh điển. Này so sánh cơ quan đại diện khác nhau để đảm bảo tính tương đương, để đếm số lượng các cấu trúc dữ liệu khác nhau, để áp đặt một trật tự sắp xếp có ý nghĩa và để cải thiện thuật toán hiệu quả, do đó loại trừ tính toán lặp đi lặp lại. Quá trình chuẩn hóa được sử dụng trong nhiều ứng dụng Internet và máy tính để tạo ra dữ liệu kinh điển từ các thông tin noncanonical. đại diện kinh điển của dữ liệu được sử dụng rộng rãi trong tối ưu hóa công cụ tìm kiếm (SEO), máy chủ Web, Unicode và XML. Thuật ngữ này còn được gọi là C14N, standarization hoặc bình thường.
Xem thêm: Thuật ngữ công nghệ A-Z
Giải thích ý nghĩa
Trong SEO, giao dịch URL hợp quy với nội dung web với nhiều hơn một URL có thể. Điều này có thể tạo ra sự khác biệt trong các tìm kiếm bởi vì công cụ tìm kiếm có thể không được nhận thức trong đó URL sẽ được hiển thị. Quá trình chuẩn chọn URL tốt nhất từ nhiều lựa chọn, thường đề cập đến trang chủ. Mặc dù URL nhất định xuất hiện để được như vậy, các máy chủ Web trả về kết quả khác nhau cho các URL. Công cụ tìm kiếm xem xét chỉ có một URL trong hình thức kinh điển. bảo mật máy tính được dựa trên tên file hợp quy. Một số máy chủ Web có thể có một quy tắc an ninh để chạy các file chỉ trong một thư mục cụ thể. Các tập tin sau đó được thực hiện chỉ khi con đường có thư mục nhất định trong tên của nó. chăm sóc đặc biệt phải được thực hiện để kiểm tra xem tên tập tin là một đại diện độc đáo. dễ bị tổn thương như vậy được gọi là thư mục traversal. Hầu hết các nhân vật trong các tiêu chuẩn Unicode có mã hóa chiều dài thay đổi. Điều này đòi hỏi một sự xem xét của mỗi chuỗi ký tự và làm cho các xác nhận chuỗi phức tạp hơn. Nếu tất cả các bảng mã ký tự không được coi là trong việc thực hiện các phần mềm, có phát sinh một khả năng lỗi. Vấn đề này có thể được loại bỏ sử dụng mã hóa duy nhất cho mỗi nhân vật. Giải pháp thay thế tốt nhất, mà bất kỳ phần mềm có thể mất, là để kiểm tra xem chuỗi là canonicalized. Strings mà không canonicalized có thể bị từ chối. Một tài liệu XML kinh điển là một tài liệu XML trong hình thức kinh điển XML. Nó được định nghĩa bởi đặc tả XML kinh điển. Quá trình chuẩn hóa trong XML loại bỏ khoảng trắng trong thẻ, phân loại tài liệu tham khảo không gian tên và loại bỏ những người không cần thiết, và sử dụng bảng mã ký tự đặc biệt. Nó cũng loại bỏ tờ khai XML và DOCTYPE, ngoài việc chuyển URL tương đối vào các URL tuyệt đối.
What is the Canonicalization? - Definition
Canonicalization is the process of converting data that involves more than one representation into a standard approved format. Such a conversion ensures that data conforms to canonical rules. This compares different representations to assure equivalence, to count numbers of distinct data structures, to impose a meaningful sorting order and to improve algorithm efficiency, thus eliminating repeated calculations. Canonicalization is used in numerous Internet and computer applications to generate canonical data from noncanonical information. Canonical representation of data is widely used in search engine optimization (SEO), Web servers, Unicode and XML. This term is also known as C14N, standarization or normalization.
Understanding the Canonicalization
In SEO, URL canonicalization deals with Web content with more than one possible URL. This may create discrepancies in searches because the search engine may not being aware of which URL should be displayed. Canonicalization picks the best URL from several choices, usually referring to home pages. Although certain URLs appear to be the same, Web servers return different results for the URLs. Search engines consider only one URL in canonical form. Computer security is based on file name canonicalization. Some Web servers may have a security rule to execute files only under a particular directory. The file is then executed only if the path has the specified directory in its name. Special care has to be taken to check if the file name is a unique representation. Such vulnerability is called directory traversal. Most of the characters in the Unicode standard have variable-length encodings. This requires a consideration of each string character and makes the string validation more complex. If all character encodings are not considered in the software implementation, there arises a possibility of bugs. This problem can be eliminated using single encoding for every character. The best alternative, which any software can take, is to check if the string is canonicalized. Strings that are not canonicalized can be rejected. A canonical XML document is an XML document in XML canonical form. It is defined by canonical XML specification. Canonicalization in XML eliminates white space within tags, sorts namespace references and eliminates redundant ones, and uses particular character encodings. It also removes XML and DOCTYPE declarations, in addition to transforming relative URLs into absolute URLs.
Thuật ngữ liên quan
- Search Engine Optimization (SEO)
- Internet
- World Wide Web (WWW)
- Extensible Markup Language (XML)
- Canonical
- Directory Traversal
- Uniform Resource Locator (URL)
- Unicode
- Data Modeling
- Commit
Source: Canonicalization là gì? Technology Dictionary - Filegi - Techtopedia - Techterm