Dự phòng dữ liệu có thể gây ra sự bất thường dữ liệu trong cơ sở dữ liệu - phổ biến nhất là lỗi chèn, xóa và cập nhật. Quá trình chuẩn hóa dữ liệu giúp loại bỏ dư thừa dữ liệu và các lỗi bất thường do nó gây ra.
Dự phòng dữ liệu xảy ra khi một phần dữ liệu cụ thể có thể được tìm thấy trong nhiều vùng của cơ sở dữ liệu. Một ví dụ phổ biến sẽ là cơ sở dữ liệu của một trường đại học hoặc cao đẳng về việc đăng ký các khóa học hiện tại. Một học sinh có thể được ghi danh vào một số khóa học khác nhau, vì vậy hồ sơ học sinh cá nhân của họ có thể được sao chép nhiều lần. Trong một kịch bản sản xuất, một nhà cung cấp duy nhất có thể được sử dụng cho các dự án và sản phẩm khác nhau.
Điều quan trọng là phải loại bỏ hiện tượng dư thừa dữ liệu trong khi vẫn duy trì tính toàn vẹn của dữ liệu thông qua quy trình chuẩn hóa nhiều bước. Dự phòng thường dẫn đến ba dị thường dữ liệu phổ biến - hoặc các trường hợp dữ liệu không nhất quán.
- Chèn bất thường - nơi dữ liệu không thể được lưu trữ hoặc cập nhật trừ khi một phần dữ liệu khác được lưu trữ cùng một lúc. Trong ví dụ về hồ sơ học sinh, điều này có thể xảy ra nếu không thể nhập hồ sơ học sinh cho đến khi họ đã đăng ký một khóa học.
- Cập nhật bất thường - trong đó một trong các bản sao của bản ghi được cập nhật trong khi bản sao khác thì không; tất cả các bản sao phải được cập nhật đồng thời.
- Sự bất thường khi xóa - điều này xảy ra khi xóa một phần dữ liệu đồng nghĩa với việc thông tin khác cũng bị mất. Trong các ví dụ về sinh viên, điều này có thể xảy ra nếu xóa khóa học đồng nghĩa với việc xóa hồ sơ sinh viên liên quan.