Khoa học là tốt nhất khi dữ liệu là một cuốn sách mở Dữ liệu cần phải là một cuốn sách mở nếu khoa học được làm cho đáng tin cậy hơn. Quinn Dombrowski / Flickr, CC BY-SA

Đó là 1986, và cơ quan vũ trụ Mỹ, NASA, đã quay cuồng vì mất bảy mạng sống. Tàu con thoi Challenger đã phá vỡ khoảng một phút sau khi ra mắt.

Một ủy ban của Quốc hội được thành lập để báo cáo về thảm kịch này. Nhà vật lý Richard Feynman là một trong những thành viên của nó. Các quan chức của NASA đã làm chứng trước Quốc hội rằng cơ hội thất bại của tàu con thoi là xung quanh 1 ở 100,000. Feynman muốn nhìn xa hơn lời khai chính thức về những con số và dữ liệu sao lưu nó.

Sau khi hoàn thành cuộc điều tra của mình, Feynman đã tóm tắt những phát hiện của mình trong phần phụ lục của báo cáo chính thức của Ủy ban, trong đó ông tuyên bố rằng các quan chức của NASA đã tự lừa mình khi nghĩ rằng tàu con thoi an toàn.

Sau khi ra mắt, các bộ phận con thoi đôi khi trở lại bị hư hỏng hoặc hành xử theo những cách bất ngờ. Trong nhiều trường hợp đó, NASA đã đưa ra những lời giải thích thuận tiện giúp giảm thiểu tầm quan trọng của những lá cờ đỏ này. Những người ở NASA rất muốn tàu con thoi được an toàn, và điều này tô màu cho lý lẽ của họ.


đồ họa đăng ký nội tâm


Đối với Feynman, loại hành vi này không gây ngạc nhiên. Trong sự nghiệp là một nhà vật lý, Feynman đã quan sát thấy rằng không chỉ các kỹ sư và nhà quản lý, mà cả các nhà khoa học cơ bản cũng có những thành kiến ​​có thể dẫn đến sự tự lừa dối.

Feynman tin rằng các nhà khoa học nên liên tục nhắc nhở bản thân về những thành kiến ​​của họ. Nguyên tắc đầu tiên là một nhà nghiên cứu giỏi, theo Feynman, đó là bạn không được tự lừa mình và bạn là người dễ đánh lừa nhất.

Nhiều Mắt

Một nhà khoa học có thể xây dựng một sự nghiệp từ một lý thuyết, và sau đó thấy cô ấy có rất nhiều điều dựa trên lý thuyết đó là đúng. Và ngay cả những người trong chúng ta ít ràng buộc về lý thuyết vẫn hy vọng rằng mỗi điểm dữ liệu mới sẽ hỗ trợ lý thuyết hiện tại của chúng tôi, ngay cả khi chúng tôi chỉ nghĩ về lý thuyết đó ngày hôm qua.

Trong báo cáo chính thức trước Quốc hội, Feynman và các đồng nghiệp đã đề nghị một nhóm giám sát độc lập được thành lập để cung cấp một phân tích liên tục về rủi ro ít sai lệch hơn mức có thể được cung cấp bởi chính NASA. Cơ quan cần đầu vào từ những người không có cổ phần trong tàu con thoi được an toàn.

Các nhà khoa học cá nhân cũng cần loại đầu vào đó. Hệ thống khoa học phải được thiết lập theo cách mà các nhà nghiên cứu đăng ký vào các lý thuyết khác nhau có thể đưa ra những diễn giải độc lập cho cùng một bộ dữ liệu.

Điều này sẽ giúp bảo vệ cộng đồng khoa học khỏi xu hướng các cá nhân tự đánh lừa mình khi thấy sự hỗ trợ cho lý thuyết của họ không có ở đó.

Đối với tôi rõ ràng: các nhà nghiên cứu nên thường xuyên kiểm tra dữ liệu thô của người khác. Nhưng trong nhiều lĩnh vực ngày nay không có cơ hội để làm như vậy.

Các nhà khoa học truyền đạt kết quả của họ cho nhau thông qua các bài báo. Các bài viết này cung cấp tóm tắt dữ liệu, thường có nhiều chi tiết, nhưng trong nhiều lĩnh vực, số liệu thô không được chia sẻ. Và các bản tóm tắt có thể được sắp xếp một cách khéo léo để che giấu mâu thuẫn và tối đa hóa sự hỗ trợ rõ ràng cho lý thuyết của tác giả.

Thỉnh thoảng, một bài báo là đúng với dữ liệu đằng sau nó, cho thấy mụn cóc và tất cả. Nhưng chúng ta không nên tin vào điều đó. Như nhà hóa học Matthew Todd đã nói với tôi, điều đó sẽ giống như mong đợi tài liệu của một đại lý bất động sản cho một tài sản cho thấy những sai sót của tài sản. Bạn sẽ không mua một ngôi nhà mà không nhìn thấy nó bằng chính mắt mình. Có thể không khôn ngoan khi mua vào một lý thuyết mà không nhìn thấy dữ liệu chưa được lọc.

Nhiều xã hội khoa học công nhận điều này. Trong nhiều năm nay, một số tạp chí mà họ giám sát đã có chính sách yêu cầu các tác giả cung cấp dữ liệu thô khi các nhà nghiên cứu khác yêu cầu.

Thật không may, chính sách này đã thất bại một cách ngoạn mục, ít nhất là trong một số lĩnh vực khoa học. Các nghiên cứu đã phát hiện ra rằng khi một nhà nghiên cứu yêu cầu dữ liệu đằng sau một bài báo, các tác giả của bài báo đó phản hồi với dữ liệu trong ít hơn một nửa trường hợp. Đây là một thiếu sót lớn trong hệ thống khoa học, một sự bối rối thực sự.

Chính sách có thiện chí yêu cầu dữ liệu đó được cung cấp theo yêu cầu đã trở thành một công thức cho các email chưa được trả lời, cho lý do và cho sự chậm trễ. Dữ liệu trước khi yêu cầu chính sách, tuy nhiên, có thể có hiệu quả.

Một vài tạp chí đã thực hiện điều này, Yêu cầu dữ liệu đó được đăng trực tuyến khi xuất bản bài báo.

Tuần dữ liệu mở?

Việc áp dụng chính sách đăng dữ liệu mới này đã bị chậm, bị giữ lại bởi một khiếm khuyết thứ hai trong hệ thống khoa học. Hiện tại, các nhà nghiên cứu được khen thưởng - dưới hình thức thăng tiến công việc và tài trợ - cho các bài báo của họ công bố phát hiện của họ, nhưng không phải cho dữ liệu đằng sau các bài báo.

Kết quả là một số nhà khoa học tích trữ dữ liệu. Với mỗi bộ dữ liệu, họ xuất bản càng nhiều bài viết càng tốt, nhưng chống lại việc xuất bản dữ liệu đó.

Để khắc phục khoa học, chúng ta cần thay đổi các ưu đãi này: chia sẻ dữ liệu nên được khen thưởng; cung cấp một phân tích lại quan trọng của dữ liệu nên được khen thưởng; chọc lỗ hổng trong tuyên bố của người khác về một bộ dữ liệu nên được khen thưởng.

Nếu lợi nhuận của sự hoài nghi nghề nghiệp có thể tăng lên, khoa học sẽ lãng phí ít thời gian hơn để theo đuổi các lý thuyết sai lầm.

Khi tôi viết bài này, chúng tôi sắp kết thúc Tuần lễ truy cập mở quốc tế lần thứ tám. Đây là một tuần để kỷ niệm rằng số lượng bài báo khoa học ngày càng tăng có sẵn miễn phí thay vì được xuất bản đằng sau các khoản thanh toán, và là thời gian để ủng hộ nhiều hơn nữa.

Mở truy cập đối với các bài viết rất quan trọng, nhưng chúng ta cũng cần mở dữ liệu. Chúng ta có cần bắt đầu một Tuần dữ liệu mở quốc tế không? Trong một hệ thống khoa học tốt hơn, việc chia sẻ dữ liệu sẽ trở nên khó khăn.

Giới thiệu về Tác giảConversation

Alex O. Holcombe, Phó Giáo sư, Trường Tâm lý học, Đại học Sydney. Ông nghiên cứu cách kết hợp các tín hiệu từ những cái nhìn thoáng qua của tế bào thần kinh khác nhau về một khu vực vật thể chuyển động, cũng như cách các giới hạn thời gian hạn chế việc theo dõi các vật thể quan trọng trong một cảnh động.

Bài viết này ban đầu được xuất bản vào Conversation. Đọc ban đầu bài viết.

Sách liên quan:

at

phá vỡ

Cảm ơn đã ghé thăm Nội địa.com, ở đâu có 20,000 + những bài báo thay đổi cuộc sống quảng bá "Thái độ mới và những khả năng mới". Tất cả các bài viết được dịch sang Hơn 30 ngôn ngữ. Theo dõi đến Tạp chí Nội tâm, xuất bản hàng tuần và Cảm hứng hàng ngày của Marie T Russell. Tạp chí InsideSelf đã được xuất bản từ năm 1985.