Test data là gì? 5 phương pháp hay nhất để quản lý test data.

Đinh Thao

Ở giai đoạn tăng trưởng mang tính cách mạng về Công nghệ thông tin hiện nay, những người kiểm thử thường trải qua việc tiếp nhận nhiều test data trong vòng đời kiểm thử phần mềm.

Những người kiểm thử không chỉ tiếp nhận/ duy trì dữ liệu từ các nguồn hiện có mà còn tạo ra khối lượng test data khổng lồ để đảm bảo sự đóng góp bùng nổ về chất lượng của họ trong việc cung cấp sản phẩm.

Do đó, người kiểm thử phải liên tục khám phá, học hỏi, áp dụng các phương pháp tiếp cận hiệu quả nhất để thu thập dữ liệu, tạo, bảo trì, tự động hóa, quản lý dữ liệu toàn diện cho bất kỳ loại kiểm thử chức năng và phi chức năng nào.

Test Data là gì?

Test Data – Dữ liệu kiểm thử là một thuật ngữ thường được sử dụng trong công việc của người kiểm thử. Trong khi thực hiện các trường hợp kiểm thử, họ cần một số dữ liệu để nhập để có được kết quả đầu ra như mong đợi. Đôi khi để tải ứng dụng bằng dữ liệu (Load testing) hoặc kiểm tra điểm ngắt (Stress testing) của ứng dụng, cần phải có dữ liệu khổng lồ.

Dữ liệu này có thể hợp lệ hoặc không hợp lệ. Vì vậy, trong ngắn hạn, test data là dữ liệu được yêu cầu trong việc thực thi các trường hợp kiểm thử đúng cách và để xác minh kết quả đầu ra mong đợi trong bất kỳ ứng dụng phần mềm nào được kiểm thử.

test data

Tại sao Test Data lại quan trọng?

Ví dụ này có thể hiểu được tầm quan trọng của test data, giả sử bạn muốn thử nghiệm các ứng dụng phần mềm di động. Có rất nhiều phần mềm khác nhau nên để kiểm thử chúng, bạn cần phải có dữ liệu đầu vào khác nhau như ảnh định dạng khác nhau, tệp nhạc được hỗ trợ và định dạng không được hỗ trợ, tệp video, danh bạ… tất cả đều là test data. Nếu không có điều này, người kiểm thử sẽ không thực hiện được và cũng sẽ không nhận được kết quả mong muốn.

Dữ liệu có thể ở bất kỳ dạng nào như:

 • Dữ liệu kiểm thử hệ thống
 • Dữ liệu kiểm thử SQL
 • Dữ liệu kiểm thử hiệu suất
 • Dữ liệu kiểm thử XML

Các loại test data

Dữ liệu kiểm thử có thể được phân thành các loại sau:

 • Tệp trống hoặc không có dữ liệu đề cập đến những tệp không có bất kỳ dữ liệu đầu vào nào được cung cấp cho ứng dụng và điều này xác minh rằng ứng dụng xử lý các trường hợp ngoại lệ đó và đưa ra lỗi thích hợp
 • Tập hợp dữ liệu kiểm thử đề cập đến các tệp hợp lệ hoặc được ứng dụng hỗ trợ. Chúng sẽ cung cấp đầu ra mong đợi khi được đưa ra làm đầu vào.
 • Tập dữ liệu kiểm thử không hợp lệ đề cập đến tất cả các định dạng tệp không hỗ trợ để thấy rằng ứng dụng xử lý tất cả chúng đúng cách mà không bị hỏng và cảnh báo người dùng bằng thông báo lỗi thích hợp.
 • Dữ liệu kiểm thử khổng lồ dành cho Load, Performance và Stress testing không thể được thực hiện tại thời điểm thực hiện và cần được chuẩn bị trong khi chuẩn bị môi trường kiểm thử của bạn. 
 • Dữ liệu kiểm thử để kiểm tra tất cả các điều kiện biên bao gồm dữ liệu có tất cả các kết hợp có thể có của các giá trị biên. 

Mẹo và thủ thuật để tạo test data

cach-tao-test-data

 • Luôn đảm bảo rằng các tệp dữ liệu kiểm thử không bị hỏng. Điều này có thể dẫn đến đầu ra không hợp lệ hoặc bỏ sót các lỗi quan trọng.
 • Dữ liệu kiểm thử phải được cập nhật thường xuyên. Điều này sẽ cho một cái nhìn rõ ràng về sản lượng dự kiến.
 • Dữ liệu kiểm thử nên được tạo trước khi thực thi các trường hợp kiểm thử
 • Một hoạt động tốt là sử dụng một số cung cụ tự động hóa để tạo ra một lượng lớn dữ liệu kiểm thử vì nỗ lực thủ công trong việc tạo dữ liệu đó sẽ nhiều hơn và tốn thời gian hơn.
 • Dữ liệu kiểm thử phải có đầu vào không hợp lệ để kiểm tra các tình huống xấu nhất.
 • Người kiểm thử có thể nhận trợ giúp của nhà phát triển để tạo dữ liệu kiểm thử.
 • Phương pháp tốt hơn luôn là bao gồm tất cả các kết hợp có thể có của các định dạng được hỗ trợ và không được hỗ trợ trong dữ liệu kiểm thử để đảm bảo rằng phạm vi kiểm thử là tối đa.

5 phương pháp hay nhất để quản lý test data

Bắt đầu với Test data strategy

Để quản lý test data hiệu quả và toàn diện. Điều quan trọng là phải bắt đầu bằng một chiến lược cụ thể. Bạn phải hiểu rõ về bối cảnh và các nhóm khác nhau trong công ty sẽ sử dụng test data và đóng góp vào đó như thế nào. Kế hoạch nên bao gồm nhu cầu, môi trường kiểm thử, chính sách quản lý dữ liệu và các quy định có liên quan ảnh hưởng đến việc xử lý dữ liệu. Bắt đầu với chiến lược quản lý test data sẽ tiết kiệm thời gian, chi phí.

Khám phá test data

Phương pháp hay nhất về quản lý dữ liệu kiểm thử là khám phá và tích hợp dữ liệu từ nhiều hệ thống nguồn và môi trường CNTT trong toàn công ty. Để đạt được điều này, bạn nên xác định sớm tất cả các kênh và nguồn dữ liệu có liên quan trong quy trình. Điều này bao gồm khám phá và phân loại tất cả dữ liệu nhạy cảm và thông tin nhận dạng cá nhân (PII) theo nhiều quy định bảo vệ dữ liệu (ví dụ: GDPR và CCPA) và luật ngành (ví dụ: HIPPA và PCI).

Bảo vệ dữ liệu cá nhân

Ngày nay, dữ liệu nhạy cảm và thông tin nhận dạng cá nhân (PII) là một dữ liệu quan trọng khi mọi người và chính quyền nhận thức rõ hơn về sự nguy hiểm của việc thu thập và sử dụng thông tin cá nhân của người khác. Quản lý test data phải tuân theo các nguyên tắc cụ thể như GDPR hoặc CCPA hoặc các tiêu chuẩn quản trị dữ liệu cao.

Khi có dữ liệu nhạy cảm, data masking sẽ bảo vệ dữ liệu đó. Bằng cách sử dụng các công cụ che giấu để làm xáo trộn dữ liệu sản xuất theo cách bắt chước dữ liệu thực tế – mà không làm lộ dữ liệu thực. Một khía cạnh bảo mật khác cần xem xét là cách lưu trữ và quản lý test data. Giữ cho test data chỉ có thể được truy cập bởi nhân viên được ủy quyền và duy trì các giao thức bảo mật, ngay cả đối với các ứng dụng đang được phát triển, là điều cần thiết.

Làm mới test data trong thời gian thực

Có lẽ yếu tố quan trọng nhất trong test data là giữ cho nó luôn mới. Do khối lượng lớn dữ liệu , nhiều công ty chỉ làm mới test data của họ theo định kỳ, chẳng hạn như mỗi quý một lần. Vì việc trích xuất và cung cấp dữ liệu tốn nhiều thời gian nên các nhóm tester thường sử dụng lại dữ liệu cũ nhiều lần. Để duy trì mức độ liên quan và độ tin cậy, cần có cơ chế đồng bộ hóa thời gian thực không yêu cầu sao chép cơ sở dữ liệu hàng loạt.

Đảm bảo mức độ liên quan

Thời gian không phải là yếu tố duy nhất ảnh hưởng đến mức độ liên quan của test data. Chất lượng kiểm thử phụ thuộc vào khả năng của các tester trong việc cung cấp dữ liệu có liên quan cho test case đang thực thiện. Do tính phức tạp của nhiệm vụ này, nhiều công cụ quản lý test data không khuyến khích tester thiết lập con dựa trên tham số, đặc biệt là trên nhiều hệ thống nguồn. Các nhóm tester nên kiểm tra xem phần tử dữ liệu nào là cần thiết cho các tình huống cụ thể của họ và xây dựng các tập hợp con dữ liệu tương ứng.

Dữ liệu kiểm thử là một trong những phần quan trọng nhất được thiết lập nếu mà không có thì việc thực thi các trường hợp kiểm thử sẽ khó khăn. Gần như không thể thực hiện Load, Performance và Stress testing mà không sử dụng dữ liệu kiểm thử.

>>> Xem thêm: Test plan là gì? Cách viết test plan hiệu quả trong 8 bước

5/5 - (2 bình chọn)
Từ khóa:
Bình luận
Icon Phone